[{"@type":"PropertyValue","name":"Escala dos Dados","value":"Total de 105.941 imagens, incluindo línguas asiáticas: Japonês: 9.997 imagens, Coreano: 10.231 imagens, Indonésio: 7.591 imagens, Malaio: 5.650 imagens, Vietnamita: 8.822 imagens, Thai: 9.645 imagens; línguas europeias: Francês: 10.015 imagens, Alemão: 7.213 imagens, Italiano: 8.824 imagens, Português: 7.754 imagens, Russo: 10.376 imagens, Espanhol: 9.823 imagens"},{"@type":"PropertyValue","name":"Ambiente de Recolha","value":"Inclui placas de loja, painéis de paragem, cartazes, bilhetes de transporte, sinais de trânsito, banda desenhada, pinturas de tampas de saneamento, frases informativas, avisos de advertência, instruções de embalagem, ementas, placas identificativas de edifícios, etc."},{"@type":"PropertyValue","name":"Diversidade de Recolha","value":"Inclui 12 línguas, vários cenários naturais, diveros ângulos de captura (vista frontal, vista de cima, vista de baixo)"},{"@type":"PropertyValue","name":"Equipamento de Recolha","value":"Telemóvel, câmara"},{"@type":"PropertyValue","name":"Parâmetro de Imagem","value":"Formato dos dados de imagem é jpg, formato de anotação textual é json"},{"@type":"PropertyValue","name":"Conteúdo Anotado","value":"Anotação de caixas delimitadores a nível de linha, transcrição de conteúdo a nível de linha"},{"@type":"PropertyValue","name":"Taxa de Precisão","value":"Considera-se delimitação correta quando quando o desvio máximo em qualquer ponto do perímetro das caixas não excede 5 píxeis; precição das caixas delimitadoras não é inferior a 97%; precisão de transcrição textual não é inferior a 97%"}]
{"id":1064,"datatype":"1","titleimg":"https://pt.nexdata.ai/shujutang/static/image/index/datatang_tuxiang_default.webp","type1":"147","type1str":null,"type2":"150","type2str":null,"dataname":"105.941 Imagens - Dados de OCR de Cenários Naturais em 12 Línguas","datazy":[{"title":"Escala dos Dados","desc":"Escala dos Dados","content":"Total de 105.941 imagens, incluindo línguas asiáticas: Japonês: 9.997 imagens, Coreano: 10.231 imagens, Indonésio: 7.591 imagens, Malaio: 5.650 imagens, Vietnamita: 8.822 imagens, Thai: 9.645 imagens; línguas europeias: Francês: 10.015 imagens, Alemão: 7.213 imagens, Italiano: 8.824 imagens, Português: 7.754 imagens, Russo: 10.376 imagens, Espanhol: 9.823 imagens"},{"title":"Ambiente de Recolha","desc":"Ambiente de Recolha","content":"Inclui placas de loja, painéis de paragem, cartazes, bilhetes de transporte, sinais de trânsito, banda desenhada, pinturas de tampas de saneamento, frases informativas, avisos de advertência, instruções de embalagem, ementas, placas identificativas de edifícios, etc."},{"title":"Diversidade de Recolha","desc":"Diversidade de Recolha","content":"Inclui 12 línguas, vários cenários naturais, diveros ângulos de captura (vista frontal, vista de cima, vista de baixo)"},{"title":"Equipamento de Recolha","desc":"Equipamento de Recolha","content":"Telemóvel, câmara"},{"title":"Parâmetro de Imagem","desc":"Parâmetro de Imagem","content":"Formato dos dados de imagem é jpg, formato de anotação textual é json"},{"title":"Conteúdo Anotado","desc":"Conteúdo Anotado","content":"Anotação de caixas delimitadores a nível de linha, transcrição de conteúdo a nível de linha"},{"title":"Taxa de Precisão","desc":"Taxa de Precisão","content":"Considera-se delimitação correta quando quando o desvio máximo em qualquer ponto do perímetro das caixas não excede 5 píxeis; precição das caixas delimitadoras não é inferior a 97%; precisão de transcrição textual não é inferior a 97%"}],"datatag":"12 languages,Multiple photographic angles,Multiple scenes,Line-level quadrilateral bounding box annotation and transcription","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"/data/apps/damp/temp/ziptemp/APY200531001_demo1695808990408/Spanish.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY200531001_demo1695808990408/Spanish.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=TafXJxAg8o5Kg%2BGun3KIiEjsu%2BU%3D","intro":"","size":0,"progress":100,"type":"jpg"},{"name":"/data/apps/damp/temp/ziptemp/APY200531001_demo1695808990408/Portuguese.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY200531001_demo1695808990408/Portuguese.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=9arI65%2BOzsdy2xK7XZfBGqmQ2og%3D","intro":"","size":0,"progress":100,"type":"jpg"},{"name":"/data/apps/damp/temp/ziptemp/APY200531001_demo1695808990408/German.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY200531001_demo1695808990408/German.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=%2FiYq03v6ZQCDTNsEE6fB5DmAkGk%3D","intro":"","size":0,"progress":100,"type":"jpg"}],"officialSummary":"105.941 Imagens - Dados de OCR de Cenários Naturais em 12 Línguas abrangem 12 línguas incluindo 6 asiáticos e 6 europeus, recolhidos em vários cenários naturais e capturados de diveros ângulos. Com anotação por caixas delimitadores quadriláteras para textos a nível de linha e transcrição de conteúdo a nível de linha, este conjunto de dados aplica-se a tarefas como reconhecimento de OCR em múltiplas línguas.","dataexampl":null,"datakeyword":["Japonês"," Coreano"," Indonésio"," Malaio"," Vietnamita"," Tailandês"," Francês"," Alemão"," Italiano"," Português"," Russo"," Espanhol"," OCR"," cenários naturais"," múltiplos ângulos fotográficos"," anotação de caixas delimitadores quadriláteras para textos a nível de linha e transcrição para textos"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"ocr","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,JP,PT,DE\"},{\"code\":\"3\",\"language\":\"EN\"}]","productNameEn":"105,941 Images Natural Scenes OCR Data of 12 Languages","BGimg":"","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"],"firstList":[{"name":"/data/apps/damp/temp/ziptemp/APY200531001_demo1695808990408/Russian.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY200531001_demo1695808990408/Russian.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=ieEtznzUAUiNqtvqirs%2F8uIwe8Y%3D","intro":"","size":0,"progress":100,"type":"jpg"}]}
105.941 Imagens - Dados de OCR de Cenários Naturais em 12 Línguas
Japonês
Coreano
Indonésio
Malaio
Vietnamita
Tailandês
Francês
Alemão
Italiano
Português
Russo
Espanhol
OCR
cenários naturais
múltiplos ângulos fotográficos
anotação de caixas delimitadores quadriláteras para textos a nível de linha e transcrição para textos
105.941 Imagens - Dados de OCR de Cenários Naturais em 12 Línguas abrangem 12 línguas incluindo 6 asiáticos e 6 europeus, recolhidos em vários cenários naturais e capturados de diveros ângulos. Com anotação por caixas delimitadores quadriláteras para textos a nível de linha e transcrição de conteúdo a nível de linha, este conjunto de dados aplica-se a tarefas como reconhecimento de OCR em múltiplas línguas.
Este é um conjunto de dado pagos destinando a uso comercial, fins de investigação e otras finalidades. Conjunto de dados licenciado e pronto ajuda a acelerar projetos d IA.
Inclui placas de loja, painéis de paragem, cartazes, bilhetes de transporte, sinais de trânsito, banda desenhada, pinturas de tampas de saneamento, frases informativas, avisos de advertência, instruções de embalagem, ementas, placas identificativas de edifícios, etc.
Diversidade de Recolha
Inclui 12 línguas, vários cenários naturais, diveros ângulos de captura (vista frontal, vista de cima, vista de baixo)
Equipamento de Recolha
Telemóvel, câmara
Parâmetro de Imagem
Formato dos dados de imagem é jpg, formato de anotação textual é json
Conteúdo Anotado
Anotação de caixas delimitadores a nível de linha, transcrição de conteúdo a nível de linha
Taxa de Precisão
Considera-se delimitação correta quando quando o desvio máximo em qualquer ponto do perímetro das caixas não excede 5 píxeis; precição das caixas delimitadoras não é inferior a 97%; precisão de transcrição textual não é inferior a 97%