en

Please fill in your name

Mobile phone format error

Por favor, insira o telefone

Por favor, insira o nome da sua empresa

Por favor, insira o e-mail da sua empresa

Por favor, insira a solicitação de dados

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

A solicitação de dados não pode conter menos de 5 palavras nem conter apenas números

104.320 imagens de dados OCR de cenas naturais em coreano e hindi.

Coreano
Hindi
Dados OCR
Cena natural
Dados de transliteração OCR

104,320 imagens de dados OCR (Reconhecimento Óptico de Caracteres) em cenas naturais de coreano e hindi.Os cenários de coleta incluem embalagens de produtos, cartazes, bilhetes, avisos, cardápios, placas de edifícios, entre outros.A Diversidade dos Dados abrange múltiplos cenários, diferentes ângulos de captura e variadas condições de iluminação.A distribuição dos idiomas inclui coreano, hindi e inglês (em pequena quantidade).Quanto à anotação, os dados são marcados com caixas poligonais (ou caixas quadriláteras ou retangulares) a nível de linha, transcrição do conteúdo da linha e atributos do texto (tipo de idioma); também são feitas marcações poligonais a nível de coluna, transcrição do conteúdo da coluna e atributos do texto (tipo de idioma).Este conjunto de dados OCR de cenas naturais em coreano e hindi pode ser usado para tarefas de OCR em cenas naturais nessas línguas.

Conjuntos de Dados Pagos
Este é um conjunto de dado pagos destinando a uso comercial, fins de investigação e otras finalidades. Conjunto de dados licenciado e pronto ajuda a acelerar projetos d IA.
EspecificaçõesCaracterísticas
Escala dos Dados
76,861 imagens em coreano, 555,913 caixas; 27,459 imagens em hindi, 200,453 caixas
Ambiente de Recolha
Inclui embalagens de produtos, cartazes, bilhetes, avisos, cardápios, placas de edifícios etc.
Diversidade de Recolha
Vários cenários naturais, vários ângulos de captura, diferentes condições de iluminação
Equipamento de Recolha
Celular
Ângulo de Captação
Vista de baixo, de cima, e frontal
Distribuição de Idiomas
Coreano, hindi, inglês (em pequena quantidade)
Formato dos Dados
Formato de imagem: .jpg; formato de anotação: .json
Distribuição do Formato das Caixas de Anotação
Coreano: 315,822 caixas quadriláteras, 240,091 caixas poligonais; Hindi: 780 caixas quadriláteras, 199,671 caixas poligonais, 2 caixas retangulares
Conteúdo Anotado
Anotação com caixas poligonais (ou quadriláteras, ou retangulares) por linha, transcrição do conteúdo por linha, atributos do texto (tipo de idioma); anotação por coluna com caixas poligonais (ou quadriláteras, ou retangulares), transcrição do conteúdo por coluna, atributos do texto (tipo de idioma)
Taxa de Precisão
A detecção é considerada correta se a diferença nos vértices da caixa anotada for de no máximo 5 pixels; a precisão da caixa de detecção é de no mínimo 95%; a precisão da transcrição textual é de no mínimo 95%
Amostra Amostra
  • 104.320 imagens de dados OCR de cenas naturais em coreano e hindi.
  • 104.320 imagens de dados OCR de cenas naturais em coreano e hindi.
  • 104.320 imagens de dados OCR de cenas naturais em coreano e hindi.
Conjuntos de Dados RecomendadosConjuntos de Dados Recomendados
Informe-nos das Suas Necessidades Específicas

Ao submeter, declaro aceitação do Acordo de Licença de Dados

032ff011-9c00-4b49-a58d-8fff5865a717

bd0bad44-ba45-4bdf-bde6-e4bfed72dd09