en

Please fill in your name

Mobile phone format error

Por favor, insira o telefone

Por favor, insira o nome da sua empresa

Por favor, insira o e-mail da sua empresa

Por favor, insira a solicitação de dados

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

A solicitação de dados não pode conter menos de 5 palavras nem conter apenas números

Datasets para OCR

Melhore instantaneamente o desempenho dos seus modelos de IA com conjuntos de dados prontos para uso e de alta qualidade.

Tipos de Dados

Todos
27
Documento
2
Cenários Gerais
12
Escrita Manual
15
Imagens da Internet
3
Outros
5
Prova Escrita
1
Tabela
1

Idioma

Todos
27
Chinês
7
Inglês
4
Hindi
3
Japonês
6
Coreano
6
Outros
19
Vietnamita
3

222.289 Imagens - Dados de OCR de Cenários Naturais em Chinês

222.289 Imagens - Dados de OCR de Cenários Naturais em Chinês, cobrindo cenários internos e externos. A diversidade dos dados inclui vários cenários e vários ângulos de captura.  São realizadas anotaões de linha, de palavra e de carácter e transcrição do conteúdo nas imagens. Este conjunto de dados pode ser utilizado para tarefas de OCR de cenários naturais.
OCR Cenas Naturais Anotação por Linha Anotação por Palavra Anotação por Carácter Transcrição para os Textos

9.497 Imagens - Dados de OCR de 10 Tipos de Tabelas

9.497 Imagens - Dados de OCR de 10 Tipos de Tabelas, com anotação de caixas retangulares, podem ser utilizado para tarefas como Deteção e reconhecimento de tabelas.
OCR Tabelas

17.561 Imagens - Dados de Provas de Matemática do Ensino Básico

17.561 Imagens - Dados de Provas de Matemática do Ensino Básico recolhidos com fundo liso, abrangem diversos tipos de questões, múltiplos tipos de prova (cadernos de exercícios, exames escritos, testes competitivos, etc.) e vários anos letivos. Este conjunto de dados aplica-se a tarefas como correção inteligente de exames e orientação de trabalhos de casa para alunos do ensino básico.
Papéis de Matemática do Ensino Básico OCR Vários Tipos de Questões (Cálculo Vertical Cálculo Horizontal Cálculo Recursivo Fração Resolução de Equação etc.) Vários Tipos de Provas (Cadernos de Matemática Exames Escritos Testes Competitivos etc.) Vários Anos Letivos

4.995 Imagens - Dados de Anotação e Transcrição de OCR em Vietnamita

4.995 Imagens - Dados de Anotação e Transcrição de OCR em Vietnamita contêm 258 de cenários naturais, 2.553 imagens textuais de internet e 2.184 imagens de texto. Na anotação, este conjunto de dados está anotado por caixas delimitadores quadriláteras a nível de linha, transcrição de conteúdo a nível de linha, caixas delimitadores quadriláteras a nível de coluna vertical e transcrição de conteúdo a nível de coluna vertical. Este conjunto aplica-se a tarefas como reconhecimento de Vietnamita em múltiplos cenários e tradução por captura de imagem em Vietnamita.
Vietnamita OCR Imagens de Texto Imagens de Internet Cenários Naturais Múltiplos Ângulos Diferentes Condições de Iluminação Anotação de Caixa Delimitadora Quadrilátera Transcrição a Nível de Linha para Textos Transcrição a Nível de Coluna para Textos

104.320 imagens de dados OCR de cenas naturais em coreano e hindi.

104,320 imagens de dados OCR (Reconhecimento Óptico de Caracteres) em cenas naturais de coreano e hindi. Os cenários de coleta incluem embalagens de produtos, cartazes, bilhetes, avisos, cardápios, placas de edifícios, entre outros. A Diversidade dos Dados abrange múltiplos cenários, diferentes ângulos de captura e variadas condições de iluminação. A distribuição dos idiomas inclui coreano, hindi e inglês (em pequena quantidade). Quanto à anotação, os dados são marcados com caixas poligonais (ou caixas quadriláteras ou retangulares) a nível de linha, transcrição do conteúdo da linha e atributos do texto (tipo de idioma); também são feitas marcações poligonais a nível de coluna, transcrição do conteúdo da coluna e atributos do texto (tipo de idioma). Este conjunto de dados OCR de cenas naturais em coreano e hindi pode ser usado para tarefas de OCR em cenas naturais nessas línguas.
Coreano Hindi Dados OCR Cena natural Dados de transliteração OCR

105.941 Imagens - Dados de OCR de Cenários Naturais em 12 Línguas

105.941 Imagens - Dados de OCR de Cenários Naturais em 12 Línguas abrangem 12 línguas incluindo 6 asiáticos e 6 europeus, recolhidos em vários cenários naturais e capturados de diveros ângulos. Com anotação por caixas delimitadores quadriláteras para textos a nível de linha e transcrição de conteúdo a nível de linha, este conjunto de dados aplica-se a tarefas como reconhecimento de OCR em múltiplas línguas.
Japonês Coreano Indonésio Malaio Vietnamita Tailandês Francês Alemão Italiano Português Russo Espanhol OCR cenários naturais múltiplos ângulos fotográficos anotação de caixas delimitadores quadriláteras para textos a nível de linha e transcrição  para textos

100 Pessoas - Dados de Caligrafia Japonesa e Coreana

100 Pessoas - Dados de Caligrafia Japonesa e Coreana, o total de pessoas que entraram nos dados sendo 100 pessoas, com 50 japoneses, 49 coreanos e 1 afgano. Para cada pessoa, o corpus de escrita é diferente. A diversidade dos dados inclui vários dispositivos móveis e diferentes corpos de texto. Este conjunto de dados de caligrafia japonesa e coreana pode ser utilizado para reconhecimento óptico de caracteres (OCR) de caligrafia japonesa e coreana.
Japonês Coreano OCR de Caligrafia Traço da Caligrafia

101 Pessoas -  Dados de OCR de 4.538 Imagens de Manuscritos Japoneses

101 Pessoas -  Dados de OCR de 4.538 Imagens de Manuscritos Japoneses, com substrato textual de papel A4, abrangem domínios como bem-estar social, entretenimento, turismo, eventos esportivos, cinema e composição musical. São realizadas anotações de caixas retangulares a nível de carácter, transcrição de conteúdo a nível de carácter, anotações de caixas retangulares a nível de linha e transcrição de conteúdo a nível de linha. Este conjunto de dados pode ser utilizado para tarefas de OCR de letras manuscritas japonesas.
Manuscritos Japoneses OCR Anotações de Caixas Retangulares a Nível de Carácter Transcrição de Texto Caligrafia Rascunho Manuscrito Dados de OCR Japonês

30,000 imagens de OCR em cenas naturais de idiomas minoritários do Sudeste Asiático

30,000 imagens OCR de idiomas menores do Sudeste Asiático (cambodja, lao, birmanês), em ambientes naturais e ângulos variados. Indicadas para OCR de idiomas minoritários.
OCR Idiomas do Sudeste Asiático Cenas Naturais

loading

Personalize os Seus Dados Agora

Porquê escolher conjuntos de dados prontos?

  • Direitos de Autor

    Direitos de Autor

    Direitos claros e verificáveis
  • Segurança

    Segurança

    Autorização adequada Utilização segura
  • Profissionalismo

    Profissionalismo

    Produzido por especialistas em dados de IA
  • Diversidade

    Diversidade

    Coletado a partir de múltiplos cenários reais
  • Rentabilidade

    Rentabilidade

    Mais económico do que dados personalizados
  • Eficiência

    Eficiência

    Prontos a usar em segundos
746cb3cf-ada4-4531-8adb-91098ddc4988