104.320 imagens de dados OCR de cenas naturais em coreano e hindi.

Coreano

Hindi

Dados OCR

Cena natural

Dados de transliteração OCR

104,320 imagens de dados OCR (Reconhecimento Óptico de Caracteres) em cenas naturais de coreano e hindi.Os cenários de coleta incluem embalagens de produtos, cartazes, bilhetes, avisos, cardápios, placas de edifícios, entre outros.A Diversidade dos Dados abrange múltiplos cenários, diferentes ângulos de captura e variadas condições de iluminação.A distribuição dos idiomas inclui coreano, hindi e inglês (em pequena quantidade).Quanto à anotação, os dados são marcados com caixas poligonais (ou caixas quadriláteras ou retangulares) a nível de linha, transcrição do conteúdo da linha e atributos do texto (tipo de idioma); também são feitas marcações poligonais a nível de coluna, transcrição do conteúdo da coluna e atributos do texto (tipo de idioma).Este conjunto de dados OCR de cenas naturais em coreano e hindi pode ser usado para tarefas de OCR em cenas naturais nessas línguas.

Este é um conjunto de dado pagos destinando a uso comercial, fins de investigação e otras finalidades. Conjunto de dados licenciado e pronto ajuda a acelerar projetos d IA.

Características

Escala dos Dados

76,861 imagens em coreano, 555,913 caixas; 27,459 imagens em hindi, 200,453 caixas

Ambiente de Recolha

Inclui embalagens de produtos, cartazes, bilhetes, avisos, cardápios, placas de edifícios etc.

Diversidade de Recolha

Vários cenários naturais, vários ângulos de captura, diferentes condições de iluminação

Equipamento de Recolha

Celular

Ângulo de Captação

Vista de baixo, de cima, e frontal

Distribuição de Idiomas

Coreano, hindi, inglês (em pequena quantidade)

Formato dos Dados

Formato de imagem: .jpg; formato de anotação: .json

Distribuição do Formato das Caixas de Anotação

Coreano: 315,822 caixas quadriláteras, 240,091 caixas poligonais; Hindi: 780 caixas quadriláteras, 199,671 caixas poligonais, 2 caixas retangulares

Conteúdo Anotado

Anotação com caixas poligonais (ou quadriláteras, ou retangulares) por linha, transcrição do conteúdo por linha, atributos do texto (tipo de idioma); anotação por coluna com caixas poligonais (ou quadriláteras, ou retangulares), transcrição do conteúdo por coluna, atributos do texto (tipo de idioma)

Taxa de Precisão

A detecção é considerada correta se a diferença nos vértices da caixa anotada for de no máximo 5 pixels; a precisão da caixa de detecção é de no mínimo 95%; a precisão da transcrição textual é de no mínimo 95%

104.320 imagens de dados OCR de cenas naturais em coreano e hindi.

Coreano Hindi Dados OCR Cena natural Dados de transliteração OCR

Nível de maturidade do projeto

Coreano

Hindi

Dados OCR

Cena natural

Dados de transliteração OCR