105.941 Imagens - Dados de OCR de Cenários Naturais em 12 Línguas

Japonês

Coreano

Indonésio

Malaio

Vietnamita

Tailandês

Francês

Alemão

Italiano

Português

Russo

Espanhol

OCR

cenários naturais

múltiplos ângulos fotográficos

anotação de caixas delimitadores quadriláteras para textos a nível de linha e transcrição para textos

105.941 Imagens - Dados de OCR de Cenários Naturais em 12 Línguas abrangem 12 línguas incluindo 6 asiáticos e 6 europeus, recolhidos em vários cenários naturais e capturados de diveros ângulos. Com anotação por caixas delimitadores quadriláteras para textos a nível de linha e transcrição de conteúdo a nível de linha, este conjunto de dados aplica-se a tarefas como reconhecimento de OCR em múltiplas línguas.

Este é um conjunto de dado pagos destinando a uso comercial, fins de investigação e otras finalidades. Conjunto de dados licenciado e pronto ajuda a acelerar projetos d IA.

Características

Escala dos Dados

Total de 105.941 imagens, incluindo línguas asiáticas: Japonês: 9.997 imagens, Coreano: 10.231 imagens, Indonésio: 7.591 imagens, Malaio: 5.650 imagens, Vietnamita: 8.822 imagens, Thai: 9.645 imagens; línguas europeias: Francês: 10.015 imagens, Alemão: 7.213 imagens, Italiano: 8.824 imagens, Português: 7.754 imagens, Russo: 10.376 imagens, Espanhol: 9.823 imagens

Ambiente de Recolha

Inclui placas de loja, painéis de paragem, cartazes, bilhetes de transporte, sinais de trânsito, banda desenhada, pinturas de tampas de saneamento, frases informativas, avisos de advertência, instruções de embalagem, ementas, placas identificativas de edifícios, etc.

Diversidade de Recolha

Inclui 12 línguas, vários cenários naturais, diveros ângulos de captura (vista frontal, vista de cima, vista de baixo)

Equipamento de Recolha

Telemóvel, câmara

Parâmetro de Imagem

Formato dos dados de imagem é jpg, formato de anotação textual é json

Conteúdo Anotado

Anotação de caixas delimitadores a nível de linha, transcrição de conteúdo a nível de linha

Taxa de Precisão

Considera-se delimitação correta quando quando o desvio máximo em qualquer ponto do perímetro das caixas não excede 5 píxeis; precição das caixas delimitadoras não é inferior a 97%; precisão de transcrição textual não é inferior a 97%

105.941 Imagens - Dados de OCR de Cenários Naturais em 12 Línguas

Japonês Coreano Indonésio Malaio Vietnamita Tailandês Francês Alemão Italiano Português Russo Espanhol OCR cenários naturais múltiplos ângulos fotográficos anotação de caixas delimitadores quadriláteras para textos a nível de linha e transcrição para textos

Nível de maturidade do projeto

Japonês

Coreano

Indonésio

Malaio

Vietnamita

Tailandês

Francês

Alemão

Italiano

Português

Russo

Espanhol

OCR

cenários naturais

múltiplos ângulos fotográficos

anotação de caixas delimitadores quadriláteras para textos a nível de linha e transcrição para textos