en

Please fill in your name

Mobile phone format error

Por favor, insira o telefone

Por favor, insira o nome da sua empresa

Por favor, insira o e-mail da sua empresa

Por favor, insira a solicitação de dados

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

A solicitação de dados não pode conter menos de 5 palavras nem conter apenas números

3.506 Imagens - Dados de Anotação e Transcrição de OCR em Híndi

Hindi
OCR
Imagens de Texto
Imagens de Internet
Cenários Naturais
Múltiplos Ângulos
Diferentes Condições de Iluminação
Anotação de Caixa Delimitadora Quadrilátera
Transcrição a Nível de Linha para Textos
Transcrição a Nível de Coluna para Textos

3.506 Imagens - Dados de Anotação e Transcrição de OCR em Híndi contêm 2.056 de cenários naturais, 1.103 imagens textuais de internet e 347 imagens de texto. Na anotação, este conjunto de dados está anotado por caixas delimitadores quadriláteras a nível de linha, transcrição de conteúdo a nível de linha, caixas delimitadores quadriláteras a nível de coluna vertical e transcrição de conteúdo a nível de coluna vertical. Este conjunto aplica-se a tarefas como reconhecimento de Hindi em múltiplos cenários e tradução por captura de imagem em Hindi.

Conjuntos de Dados Pagos
Este é um conjunto de dado pagos destinando a uso comercial, fins de investigação e otras finalidades. Conjunto de dados licenciado e pronto ajuda a acelerar projetos d IA.
EspecificaçõesCaracterísticas
Escala dos Dados
3.506 imagens, incluindo 2.056 de cenários naturais; 1.103 imagens textuais de internet; 347 imagens de texto
Ambiente de Recolha
Cenários naturais (placas, instruções de embalagem, anúncios de rua, menus, cartazes, etc.), imagens de internet (capas de revistas, capas de banda desenhada, etc.), documentos textuais (documentos textuais, etc.)
Diversidade de Recolha
Incluindo múltiplos cenários, várias perspetivas, differentes condições de iluminação
Equipamento de Recolha
Telemóvel
Ângulo de Recolha
Vista de baixo, vista frontal
Formato dos Dados
Formato de imagem é .jpg,  formato de anotação textual é .json
Conteúdo Anotado
Anotação de caixas delimitadores quadriláteras a nível de linha, transcrição de conteúdo a nível de linha; anotação de caixas delimitadores quadriláteras a nível de coluna vertical e transcrição de conteúdo a nível de coluna vertical
Taxa de Precisão
Considera-se delimitação correta quando quando o desvio máximo em qualquer ponto do perímetro das caixas não excede 10 píxeis; precição das caixas delimitadoras não é inferior a 97%; precisão de transcrição textual não é inferior a 97%
Amostra Amostra
  • 3.506 Imagens - Dados de Anotação e Transcrição de OCR em Híndi
  • 3.506 Imagens - Dados de Anotação e Transcrição de OCR em Híndi
  • 3.506 Imagens - Dados de Anotação e Transcrição de OCR em Híndi
Conjuntos de Dados RecomendadosConjuntos de Dados Recomendados
Informe-nos das Suas Necessidades Específicas

Ao submeter, declaro aceitação do Acordo de Licença de Dados

4465222a-7957-4fbf-b952-7fe5c6243584

7ebac3e7-b7f1-44fc-aa27-18d48c0fbf12