en

Please fill in your name

Mobile phone format error

Por favor, insira o telefone

Por favor, insira o nome da sua empresa

Por favor, insira o e-mail da sua empresa

Por favor, insira a solicitação de dados

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

A solicitação de dados não pode conter menos de 5 palavras nem conter apenas números

57,645 imagens de OCR de texto na vertical em cenários diversos

Dados de OCR de cenas com texto vertical
Dados de imagem OCR
Dados de OCR
Conjunto de dados de OCR
Anotação OCR
Recolha de OCR
Processamento de dados OCR
Reescrita de dados OCR

São 57,645 imagens de texto disposto na vertical em diferentes cenários. Os cenários de coleta incluem ruas, fachadas, letreiros, outdoors, cartazes, decorações, tipografias artísticas, capas de revistas, entre outros. A distribuição de idiomas é, na sua maioria, em chinês, com uma pequena quantidade em inglês. Na anotação, foram utilizadas caixas retangulares por coluna (caixas poligonais, caixas em formato de paralelogramo) e transcrição do conteúdo por coluna;para textos não verticais, há caixas retangulares (caixas poligonais, caixas em formato de paralelogramo) e transcrição do conteúdo não vertical.Este conjunto de dados pode ser usado para várias tarefas de OCR em cenários de texto na vertical.

Conjuntos de Dados Pagos
Este é um conjunto de dado pagos destinando a uso comercial, fins de investigação e otras finalidades. Conjunto de dados licenciado e pronto ajuda a acelerar projetos d IA.
EspecificaçõesCaracterísticas
Escala dos Dados
57,645 imagens, 528,553 caixas
Ambiente de Recolha
Inclui cenas de rua, placas, outdoors, cartazes, decorações, letras artísticas, capas de revistas, etc.
Diversidade de Recolha
Vários cenários, diversos tipos de fontes.
Distribuição de Idiomas
Chinês e inglês (em pequena quantidade)
Distribuição da Orientação das Caixas de Anotação
324.399 caixas verticais, 204,154 caixas não verticais
Distribuição do Formato das Caixas de Anotação
34,936 caixas retangulares, 220,716 caixas poligonais, 272,901 caixas em forma de paralelogramo
Formato dos Dados
Formato dos dados de imagem: .jpg; formato dos arquivos de anotação: .json
Conteúdo Anotado
Anotação de caixas retangulares em nível de coluna (caixas poligonais e paralelogramos) e transcrição de conteúdo em nível de coluna; anotação de caixas não verticais (polígonos e paralelogramos) e transcrição de conteúdo não vertical
Taxa de Precisão
A detecção é considerada correta se a diferença nos vértices das caixas anotadas não passar de três pixels. A precisão das caixas de detecção não é inferior a 97%. A precisão da transcrição do texto também não é inferior a 97%
Amostra Amostra
  • 57,645 imagens de OCR de texto na vertical em cenários diversos
  • 57,645 imagens de OCR de texto na vertical em cenários diversos
  • 57,645 imagens de OCR de texto na vertical em cenários diversos
Conjuntos de Dados RecomendadosConjuntos de Dados Recomendados
Informe-nos das Suas Necessidades Específicas

Ao submeter, declaro aceitação do Acordo de Licença de Dados

dc07094d-b5dc-4a63-ac11-22a4b9ef6b77

349465c7-f195-4588-bdfa-0fd1d16c900c