Início > Todos os Datasets por Categoria > Datasets para OCR > 57,645 imagens de OCR de texto na vertical em cenários diversos

57,645 imagens de OCR de texto na vertical em cenários diversos

Dados de OCR de cenas com texto vertical

Dados de imagem OCR

Dados de OCR

Conjunto de dados de OCR

Anotação OCR

Recolha de OCR

Processamento de dados OCR

Reescrita de dados OCR

São 57,645 imagens de texto disposto na vertical em diferentes cenários. Os cenários de coleta incluem ruas, fachadas, letreiros, outdoors, cartazes, decorações, tipografias artísticas, capas de revistas, entre outros. A distribuição de idiomas é, na sua maioria, em chinês, com uma pequena quantidade em inglês. Na anotação, foram utilizadas caixas retangulares por coluna (caixas poligonais, caixas em formato de paralelogramo) e transcrição do conteúdo por coluna;para textos não verticais, há caixas retangulares (caixas poligonais, caixas em formato de paralelogramo) e transcrição do conteúdo não vertical.Este conjunto de dados pode ser usado para várias tarefas de OCR em cenários de texto na vertical.

Este é um conjunto de dado pagos destinando a uso comercial, fins de investigação e otras finalidades. Conjunto de dados licenciado e pronto ajuda a acelerar projetos d IA.

Características

Escala dos Dados

57,645 imagens, 528,553 caixas

Ambiente de Recolha

Inclui cenas de rua, placas, outdoors, cartazes, decorações, letras artísticas, capas de revistas, etc.

Diversidade de Recolha

Vários cenários, diversos tipos de fontes.

Distribuição de Idiomas

Chinês e inglês (em pequena quantidade)

Distribuição da Orientação das Caixas de Anotação

324.399 caixas verticais, 204,154 caixas não verticais

Distribuição do Formato das Caixas de Anotação

34,936 caixas retangulares, 220,716 caixas poligonais, 272,901 caixas em forma de paralelogramo

Formato dos Dados

Formato dos dados de imagem: .jpg; formato dos arquivos de anotação: .json

Conteúdo Anotado

Anotação de caixas retangulares em nível de coluna (caixas poligonais e paralelogramos) e transcrição de conteúdo em nível de coluna; anotação de caixas não verticais (polígonos e paralelogramos) e transcrição de conteúdo não vertical

Taxa de Precisão

A detecção é considerada correta se a diferença nos vértices das caixas anotadas não passar de três pixels. A precisão das caixas de detecção não é inferior a 97%. A precisão da transcrição do texto também não é inferior a 97%

57,645 imagens de OCR de texto na vertical em cenários diversos

Dados de OCR de cenas com texto vertical Dados de imagem OCR Dados de OCR Conjunto de dados de OCR Anotação OCR Recolha de OCR Processamento de dados OCR Reescrita de dados OCR

Nível de maturidade do projeto

Dados de OCR de cenas com texto vertical

Dados de imagem OCR

Dados de OCR

Conjunto de dados de OCR

Anotação OCR

Recolha de OCR

Processamento de dados OCR

Reescrita de dados OCR