pt

Please fill in your name

Mobile phone format error

Por favor, insira o telefone

Por favor, insira o nome da sua empresa

Por favor, insira o e-mail da sua empresa

Por favor, insira a solicitação de dados

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

A solicitação de dados não pode conter menos de 5 palavras nem conter apenas números

Datasets para OCR

Melhore instantaneamente o desempenho dos seus modelos de IA com conjuntos de dados prontos para uso e de alta qualidade.

Tipos de Dados

Todos
26
Documento
2
Cenários Gerais
12
Escrita Manual
15
Imagens da Internet
1
Outros
4
Prova Escrita
1
Tabela
1

Idioma

Todos
26
Chinês
6
Inglês
4
Hindi
3
Japonês
6
Coreano
6
Outros
19
Vietnamita
3

4.995 Imagens - Dados de Anotação e Transcrição de OCR em Vietnamita

4.995 Imagens - Dados de Anotação e Transcrição de OCR em Vietnamita contêm 258 de cenários naturais, 2.553 imagens textuais de internet e 2.184 imagens de texto. Na anotação, este conjunto de dados está anotado por caixas delimitadores quadriláteras a nível de linha, transcrição de conteúdo a nível de linha, caixas delimitadores quadriláteras a nível de coluna vertical e transcrição de conteúdo a nível de coluna vertical. Este conjunto aplica-se a tarefas como reconhecimento de Vietnamita em múltiplos cenários e tradução por captura de imagem em Vietnamita.
Vietnamita OCR Imagens de Texto Imagens de Internet Cenários Naturais Múltiplos Ângulos Diferentes Condições de Iluminação Anotação de Caixa Delimitadora Quadrilátera Transcrição a Nível de Linha para Textos Transcrição a Nível de Coluna para Textos

3.506 Imagens - Dados de Anotação e Transcrição de OCR em Híndi

3.506 Imagens - Dados de Anotação e Transcrição de OCR em Híndi contêm 2.056 de cenários naturais, 1.103 imagens textuais de internet e 347 imagens de texto. Na anotação, este conjunto de dados está anotado por caixas delimitadores quadriláteras a nível de linha, transcrição de conteúdo a nível de linha, caixas delimitadores quadriláteras a nível de coluna vertical e transcrição de conteúdo a nível de coluna vertical. Este conjunto aplica-se a tarefas como reconhecimento de Hindi em múltiplos cenários e tradução por captura de imagem em Hindi.
Hindi OCR Imagens de Texto Imagens de Internet Cenários Naturais Múltiplos Ângulos Diferentes Condições de Iluminação Anotação de Caixa Delimitadora Quadrilátera Transcrição a Nível de Linha para Textos Transcrição a Nível de Coluna para Textos

57,645 imagens de OCR de texto na vertical em cenários diversos

São 57,645 imagens de texto disposto na vertical em diferentes cenários. Os cenários de coleta incluem ruas, fachadas, letreiros, outdoors, cartazes, decorações, tipografias artísticas, capas de revistas, entre outros. A distribuição de idiomas é, na sua maioria, em chinês, com uma pequena quantidade em inglês. Na anotação, foram utilizadas caixas retangulares por coluna (caixas poligonais, caixas em formato de paralelogramo) e transcrição do conteúdo por coluna; para textos não verticais, há caixas retangulares (caixas poligonais, caixas em formato de paralelogramo) e transcrição do conteúdo não vertical. Este conjunto de dados pode ser usado para várias tarefas de OCR em cenários de texto na vertical.
Dados de OCR de cenas com texto vertical Dados de imagem OCR Dados de OCR Conjunto de dados de OCR Anotação OCR Recolha de OCR Processamento de dados OCR Reescrita de dados OCR

14.980 Imagens - Dados de OCR para PPT em 8 Línguas

14.980 Imagens - Dados de OCR para PPT em 8 Línguas abrangem múltiplos cenários, diferentes ângulos de captura, distâncias de captura e condições de iluminação. Anotado por quadrilátero de nível de linha, e com transcrição textual de nível de linha, este conjunto de dados é aplicável em tarefas de OCR de múltiplos línguas.
PPT OCR Sala de Reuniões Sala de Conferências Diferentes Ângulos de Fotografia Diferentes Distâncias de Fotografia Diferentes Condições de Luz Anotação de Caixa Delimitadora Quadrilátera de Nível de Linha e Transcrição para os Textos

100 Pessoas - Dados de Caligrafia Japonesa e Coreana

100 Pessoas - Dados de Caligrafia Japonesa e Coreana, o total de pessoas que entraram nos dados sendo 100 pessoas, com 50 japoneses, 49 coreanos e 1 afgano. Para cada pessoa, o corpus de escrita é diferente. A diversidade dos dados inclui vários dispositivos móveis e diferentes corpos de texto. Este conjunto de dados de caligrafia japonesa e coreana pode ser utilizado para reconhecimento óptico de caracteres (OCR) de caligrafia japonesa e coreana.
Japonês Coreano OCR de Caligrafia Traço da Caligrafia

5,147 imagens de dados de OCR de escrita manual em japonês

5,147 imagens de OCR de escrita manual em japonês. Os suportes dos textos incluem papel A4, papel pautado e papel quadriculado. As imagens foram capturadas com celulares, em ângulo de visão frontal. Os conteúdos abrangem redações em japonês, poesias, ensaios, notícias e histórias. As anotações incluem quadros retangulares por linha de texto e transcrição linha por linha. Este conjunto pode ser usado para tarefas de OCR de escrita manual em japonês.
Japonês Escrita Manual OCR Anotação em Nível de Linha Transcrição de Texto em Nível de Linha

101 Pessoas -  Dados de OCR de 4.538 Imagens de Manuscritos Japoneses

101 Pessoas -  Dados de OCR de 4.538 Imagens de Manuscritos Japoneses, com substrato textual de papel A4, abrangem domínios como bem-estar social, entretenimento, turismo, eventos esportivos, cinema e composição musical. São realizadas anotações de caixas retangulares a nível de carácter, transcrição de conteúdo a nível de carácter, anotações de caixas retangulares a nível de linha e transcrição de conteúdo a nível de linha. Este conjunto de dados pode ser utilizado para tarefas de OCR de letras manuscritas japonesas.
Manuscritos Japoneses OCR Anotações de Caixas Retangulares a Nível de Carácter Transcrição de Texto Caligrafia Rascunho Manuscrito Dados de OCR Japonês

105.941 Imagens - Dados de OCR de Cenários Naturais em 12 Línguas

105.941 Imagens - Dados de OCR de Cenários Naturais em 12 Línguas abrangem 12 línguas incluindo 6 asiáticos e 6 europeus, recolhidos em vários cenários naturais e capturados de diveros ângulos. Com anotação por caixas delimitadores quadriláteras para textos a nível de linha e transcrição de conteúdo a nível de linha, este conjunto de dados aplica-se a tarefas como reconhecimento de OCR em múltiplas línguas.
Japonês Coreano Indonésio Malaio Vietnamita Tailandês Francês Alemão Italiano Português Russo Espanhol OCR cenários naturais múltiplos ângulos fotográficos anotação de caixas delimitadores quadriláteras para textos a nível de linha e transcrição  para textos

500,000 imagens de OCR de cenas naturais e documentos de múltiplos países

500,000 imagens OCR de idiomas diversos (chinês tradicional, japonês, coreano, indonésio, malaio, tailandês, vietnamita, polonês etc.), capturadas em cenários naturais com vários ângulos. Indicadas para tarefas de OCR multilíngue.
Cenas Naturais Documentos OCR

loading

Personalize os Seus Dados Agora

Porquê escolher conjuntos de dados prontos?

  • Direitos de Autor

    Direitos de Autor

    Direitos claros e verificáveis
  • Segurança

    Segurança

    Autorização adequada Utilização segura
  • Profissionalismo

    Profissionalismo

    Produzido por especialistas em dados de IA
  • Diversidade

    Diversidade

    Coletado a partir de múltiplos cenários reais
  • Rentabilidade

    Rentabilidade

    Mais económico do que dados personalizados
  • Eficiência

    Eficiência

    Prontos a usar em segundos
784a490c-5bc8-499b-997a-bd632773edd2