[{"@type":"PropertyValue","name":"Escala dos Dados","value":"57,645 imagens, 528,553 caixas"},{"@type":"PropertyValue","name":"Ambiente de Recolha","value":"Inclui cenas de rua, placas, outdoors, cartazes, decorações, letras artísticas, capas de revistas, etc."},{"@type":"PropertyValue","name":"Diversidade de Recolha","value":"Vários cenários, diversos tipos de fontes."},{"@type":"PropertyValue","name":"Distribuição de Idiomas","value":"Chinês e inglês (em pequena quantidade)"},{"@type":"PropertyValue","name":"Distribuição da Orientação das Caixas de Anotação","value":"324.399 caixas verticais, 204,154 caixas não verticais"},{"@type":"PropertyValue","name":"Distribuição do Formato das Caixas de Anotação","value":"34,936 caixas retangulares, 220,716 caixas poligonais, 272,901 caixas em forma de paralelogramo"},{"@type":"PropertyValue","name":"Formato dos Dados","value":"Formato dos dados de imagem: .jpg; formato dos arquivos de anotação: .json"},{"@type":"PropertyValue","name":"Conteúdo Anotado","value":"Anotação de caixas retangulares em nível de coluna (caixas poligonais e paralelogramos) e transcrição de conteúdo em nível de coluna; anotação de caixas não verticais (polígonos e paralelogramos) e transcrição de conteúdo não vertical"},{"@type":"PropertyValue","name":"Taxa de Precisão","value":"A detecção é considerada correta se a diferença nos vértices das caixas anotadas não passar de três pixels. A precisão das caixas de detecção não é inferior a 97%. A precisão da transcrição do texto também não é inferior a 97%"}]
{"id":1226,"datatype":"1","titleimg":"https://pt.nexdata.ai/shujutang/static/image/index/datatang_tuxiang_default.webp","type1":"147","type1str":null,"type2":"150","type2str":null,"dataname":"57,645 imagens de OCR de texto na vertical em cenários diversos","datazy":[{"title":"Escala dos Dados","desc":"Escala dos Dados","content":"57,645 imagens, 528,553 caixas"},{"title":"Ambiente de Recolha","desc":"Ambiente de Recolha","content":"Inclui cenas de rua, placas, outdoors, cartazes, decorações, letras artísticas, capas de revistas, etc."},{"title":"Diversidade de Recolha","desc":"Diversidade de Recolha","content":"Vários cenários, diversos tipos de fontes."},{"title":"Distribuição de Idiomas","desc":"Distribuição de Idiomas","content":"Chinês e inglês (em pequena quantidade)"},{"title":"Distribuição da Orientação das Caixas de Anotação","desc":"Distribuição da Orientação das Caixas de Anotação","content":"324.399 caixas verticais, 204,154 caixas não verticais"},{"title":"Distribuição do Formato das Caixas de Anotação","desc":"Distribuição do Formato das Caixas de Anotação","content":"34,936 caixas retangulares, 220,716 caixas poligonais, 272,901 caixas em forma de paralelogramo"},{"title":"Formato dos Dados","desc":"Formato dos Dados","content":"Formato dos dados de imagem: .jpg; formato dos arquivos de anotação: .json"},{"title":"Conteúdo Anotado","desc":"Conteúdo Anotado","content":"Anotação de caixas retangulares em nível de coluna (caixas poligonais e paralelogramos) e transcrição de conteúdo em nível de coluna; anotação de caixas não verticais (polígonos e paralelogramos) e transcrição de conteúdo não vertical"},{"title":"Taxa de Precisão","desc":"Taxa de Precisão","content":"A detecção é considerada correta se a diferença nos vértices das caixas anotadas não passar de três pixels. A precisão das caixas de detecção não é inferior a 97%. A precisão da transcrição do texto também não é inferior a 97%"}],"datatag":"OCR,Multiple scenes,Multiple fonts","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"/data/apps/damp/temp/ziptemp/APY230117001_demo1695809214287/APY230117001_demo/054889_demo.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230117001_demo1695809214287/APY230117001_demo/054889_demo.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=tDNg2Jmp1JEEZiTMQB2hIFr17SI%3D","intro":"","size":0,"progress":100,"type":"jpg"},{"name":"/data/apps/damp/temp/ziptemp/APY230117001_demo1695809214287/APY230117001_demo/056472_demo.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230117001_demo1695809214287/APY230117001_demo/056472_demo.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=sGLSMlt8%2BocGKzLN0YYIgRrTg78%3D","intro":"","size":0,"progress":100,"type":"jpg"},{"name":"/data/apps/damp/temp/ziptemp/APY230117001_demo1695809214287/APY230117001_demo/054886_demo.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230117001_demo1695809214287/APY230117001_demo/054886_demo.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=2t3vBygA4k0HDuTQq9h%2ByOBmO8E%3D","intro":"","size":0,"progress":100,"type":"jpg"}],"officialSummary":"São 57,645 imagens de texto disposto na vertical em diferentes cenários. Os cenários de coleta incluem ruas, fachadas, letreiros, outdoors, cartazes, decorações, tipografias artísticas, capas de revistas, entre outros. A distribuição de idiomas é, na sua maioria, em chinês, com uma pequena quantidade em inglês. Na anotação, foram utilizadas caixas retangulares por coluna (caixas poligonais, caixas em formato de paralelogramo) e transcrição do conteúdo por coluna;para textos não verticais, há caixas retangulares (caixas poligonais, caixas em formato de paralelogramo) e transcrição do conteúdo não vertical.Este conjunto de dados pode ser usado para várias tarefas de OCR em cenários de texto na vertical.","dataexampl":null,"datakeyword":["Dados de OCR de cenas com texto vertical"," Dados de imagem OCR"," Dados de OCR"," Conjunto de dados de OCR"," Anotação OCR"," Recolha de OCR"," Processamento de dados OCR"," Reescrita de dados OCR"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"ocr","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,JP,PT,DE\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"57,645 Images - Vertical OCR Data in Text Scenes","BGimg":"","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"],"firstList":[{"name":"/data/apps/damp/temp/ziptemp/APY230117001_demo1695809214287/APY230117001_demo/056480_demo.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230117001_demo1695809214287/APY230117001_demo/056480_demo.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=2d2r3%2FYQASEMnhCBsTgJBTu2y74%3D","intro":"","size":0,"progress":100,"type":"jpg"}]}
57,645 imagens de OCR de texto na vertical em cenários diversos
Dados de OCR de cenas com texto vertical
Dados de imagem OCR
Dados de OCR
Conjunto de dados de OCR
Anotação OCR
Recolha de OCR
Processamento de dados OCR
Reescrita de dados OCR
São 57,645 imagens de texto disposto na vertical em diferentes cenários. Os cenários de coleta incluem ruas, fachadas, letreiros, outdoors, cartazes, decorações, tipografias artísticas, capas de revistas, entre outros. A distribuição de idiomas é, na sua maioria, em chinês, com uma pequena quantidade em inglês. Na anotação, foram utilizadas caixas retangulares por coluna (caixas poligonais, caixas em formato de paralelogramo) e transcrição do conteúdo por coluna;para textos não verticais, há caixas retangulares (caixas poligonais, caixas em formato de paralelogramo) e transcrição do conteúdo não vertical.Este conjunto de dados pode ser usado para várias tarefas de OCR em cenários de texto na vertical.
Este é um conjunto de dado pagos destinando a uso comercial, fins de investigação e otras finalidades. Conjunto de dados licenciado e pronto ajuda a acelerar projetos d IA.
Características
Escala dos Dados
57,645 imagens, 528,553 caixas
Ambiente de Recolha
Inclui cenas de rua, placas, outdoors, cartazes, decorações, letras artísticas, capas de revistas, etc.
Diversidade de Recolha
Vários cenários, diversos tipos de fontes.
Distribuição de Idiomas
Chinês e inglês (em pequena quantidade)
Distribuição da Orientação das Caixas de Anotação
324.399 caixas verticais, 204,154 caixas não verticais
Distribuição do Formato das Caixas de Anotação
34,936 caixas retangulares, 220,716 caixas poligonais, 272,901 caixas em forma de paralelogramo
Formato dos Dados
Formato dos dados de imagem: .jpg; formato dos arquivos de anotação: .json
Conteúdo Anotado
Anotação de caixas retangulares em nível de coluna (caixas poligonais e paralelogramos) e transcrição de conteúdo em nível de coluna; anotação de caixas não verticais (polígonos e paralelogramos) e transcrição de conteúdo não vertical
Taxa de Precisão
A detecção é considerada correta se a diferença nos vértices das caixas anotadas não passar de três pixels. A precisão das caixas de detecção não é inferior a 97%. A precisão da transcrição do texto também não é inferior a 97%