[{"@type":"PropertyValue","name":"Escala dos Dados","value":"3.506 imagens, incluindo 2.056 de cenários naturais; 1.103 imagens textuais de internet; 347 imagens de texto"},{"@type":"PropertyValue","name":"Ambiente de Recolha","value":"Cenários naturais (placas, instruções de embalagem, anúncios de rua, menus, cartazes, etc.), imagens de internet (capas de revistas, capas de banda desenhada, etc.), documentos textuais (documentos textuais, etc.)"},{"@type":"PropertyValue","name":"Diversidade de Recolha","value":"Incluindo múltiplos cenários, várias perspetivas, differentes condições de iluminação"},{"@type":"PropertyValue","name":"Equipamento de Recolha","value":"Telemóvel"},{"@type":"PropertyValue","name":"Ângulo de Recolha","value":"Vista de baixo, vista frontal"},{"@type":"PropertyValue","name":"Formato dos Dados","value":"Formato de imagem é .jpg, formato de anotação textual é .json"},{"@type":"PropertyValue","name":"Conteúdo Anotado","value":"Anotação de caixas delimitadores quadriláteras a nível de linha, transcrição de conteúdo a nível de linha; anotação de caixas delimitadores quadriláteras a nível de coluna vertical e transcrição de conteúdo a nível de coluna vertical"},{"@type":"PropertyValue","name":"Taxa de Precisão","value":"Considera-se delimitação correta quando quando o desvio máximo em qualquer ponto do perímetro das caixas não excede 10 píxeis; precição das caixas delimitadoras não é inferior a 97%; precisão de transcrição textual não é inferior a 97%"}]
{"id":1058,"datatype":"1","titleimg":"https://pt.nexdata.ai/shujutang/static/image/index/datatang_tuxiang_default.webp","type1":"147","type1str":null,"type2":"150","type2str":null,"dataname":"3.506 Imagens - Dados de Anotação e Transcrição de OCR em Híndi","datazy":[{"title":"Escala dos Dados","desc":"Escala dos Dados","content":"3.506 imagens, incluindo 2.056 de cenários naturais; 1.103 imagens textuais de internet; 347 imagens de texto"},{"title":"Ambiente de Recolha","desc":"Ambiente de Recolha","content":"Cenários naturais (placas, instruções de embalagem, anúncios de rua, menus, cartazes, etc.), imagens de internet (capas de revistas, capas de banda desenhada, etc.), documentos textuais (documentos textuais, etc.)"},{"title":"Diversidade de Recolha","desc":"Diversidade de Recolha","content":"Incluindo múltiplos cenários, várias perspetivas, differentes condições de iluminação"},{"title":"Equipamento de Recolha","desc":"Equipamento de Recolha","content":"Telemóvel"},{"title":"Ângulo de Recolha","desc":"Ângulo de Recolha","content":"Vista de baixo, vista frontal"},{"title":"Formato dos Dados","desc":"Formato dos Dados","content":"Formato de imagem é .jpg, formato de anotação textual é .json"},{"title":"Conteúdo Anotado","desc":"Conteúdo Anotado","content":"Anotação de caixas delimitadores quadriláteras a nível de linha, transcrição de conteúdo a nível de linha; anotação de caixas delimitadores quadriláteras a nível de coluna vertical e transcrição de conteúdo a nível de coluna vertical"},{"title":"Taxa de Precisão","desc":"Taxa de Precisão","content":"Considera-se delimitação correta quando quando o desvio máximo em qualquer ponto do perímetro das caixas não excede 10 píxeis; precição das caixas delimitadoras não é inferior a 97%; precisão de transcrição textual não é inferior a 97%"}],"datatag":"Hindi OCR,Multiple scenes,Multiple angles,Different light conditions","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"/data/apps/damp/temp/ziptemp/APY200102001_demo1695808983232/APY200102001_demo/00004.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY200102001_demo1695808983232/APY200102001_demo/00004.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=1RHyBQ877xadK9qW66Lj6Ivikq0%3D","intro":"","size":0,"progress":100,"type":"jpg"},{"name":"/data/apps/damp/temp/ziptemp/APY200102001_demo1695808983232/APY200102001_demo/00006.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY200102001_demo1695808983232/APY200102001_demo/00006.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=ZYCVjKlMLMjdYWQ17c9BpniCAa0%3D","intro":"","size":0,"progress":100,"type":"jpg"},{"name":"/data/apps/damp/temp/ziptemp/APY200102001_demo1695808983232/APY200102001_demo/00027.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY200102001_demo1695808983232/APY200102001_demo/00027.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=p8LQVuz%2BoHuw%2BP8mwBwq45M3q9Q%3D","intro":"","size":0,"progress":100,"type":"jpg"}],"officialSummary":"3.506 Imagens - Dados de Anotação e Transcrição de OCR em Híndi contêm 2.056 de cenários naturais, 1.103 imagens textuais de internet e 347 imagens de texto. Na anotação, este conjunto de dados está anotado por caixas delimitadores quadriláteras a nível de linha, transcrição de conteúdo a nível de linha, caixas delimitadores quadriláteras a nível de coluna vertical e transcrição de conteúdo a nível de coluna vertical. Este conjunto aplica-se a tarefas como reconhecimento de Hindi em múltiplos cenários e tradução por captura de imagem em Hindi.","dataexampl":null,"datakeyword":["Hindi"," OCR"," Imagens de Texto"," Imagens de Internet"," Cenários Naturais"," Múltiplos Ângulos"," Diferentes Condições de Iluminação"," Anotação de Caixa Delimitadora Quadrilátera"," Transcrição a Nível de Linha para Textos"," Transcrição a Nível de Coluna para Textos"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"ocr","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,JP,PT,DE\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"3,506 Hindi OCR Images Data - Images with Annotation and Transcription","BGimg":"","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"],"firstList":[{"name":"/data/apps/damp/temp/ziptemp/APY200102001_demo1695808983232/APY200102001_demo/00001.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY200102001_demo1695808983232/APY200102001_demo/00001.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=VNNczsPK38IDN%2F2BxuBFYMdpzBc%3D","intro":"","size":0,"progress":100,"type":"jpg"}]}
3.506 Imagens - Dados de Anotação e Transcrição de OCR em Híndi
Hindi
OCR
Imagens de Texto
Imagens de Internet
Cenários Naturais
Múltiplos Ângulos
Diferentes Condições de Iluminação
Anotação de Caixa Delimitadora Quadrilátera
Transcrição a Nível de Linha para Textos
Transcrição a Nível de Coluna para Textos
3.506 Imagens - Dados de Anotação e Transcrição de OCR em Híndi contêm 2.056 de cenários naturais, 1.103 imagens textuais de internet e 347 imagens de texto. Na anotação, este conjunto de dados está anotado por caixas delimitadores quadriláteras a nível de linha, transcrição de conteúdo a nível de linha, caixas delimitadores quadriláteras a nível de coluna vertical e transcrição de conteúdo a nível de coluna vertical. Este conjunto aplica-se a tarefas como reconhecimento de Hindi em múltiplos cenários e tradução por captura de imagem em Hindi.
Este é um conjunto de dado pagos destinando a uso comercial, fins de investigação e otras finalidades. Conjunto de dados licenciado e pronto ajuda a acelerar projetos d IA.
Características
Escala dos Dados
3.506 imagens, incluindo 2.056 de cenários naturais; 1.103 imagens textuais de internet; 347 imagens de texto
Ambiente de Recolha
Cenários naturais (placas, instruções de embalagem, anúncios de rua, menus, cartazes, etc.), imagens de internet (capas de revistas, capas de banda desenhada, etc.), documentos textuais (documentos textuais, etc.)
Diversidade de Recolha
Incluindo múltiplos cenários, várias perspetivas, differentes condições de iluminação
Equipamento de Recolha
Telemóvel
Ângulo de Recolha
Vista de baixo, vista frontal
Formato dos Dados
Formato de imagem é .jpg, formato de anotação textual é .json
Conteúdo Anotado
Anotação de caixas delimitadores quadriláteras a nível de linha, transcrição de conteúdo a nível de linha; anotação de caixas delimitadores quadriláteras a nível de coluna vertical e transcrição de conteúdo a nível de coluna vertical
Taxa de Precisão
Considera-se delimitação correta quando quando o desvio máximo em qualquer ponto do perímetro das caixas não excede 10 píxeis; precição das caixas delimitadoras não é inferior a 97%; precisão de transcrição textual não é inferior a 97%