[{"@type":"PropertyValue","name":"Escala dos Dados","value":"76,861 imagens em coreano, 555,913 caixas; 27,459 imagens em hindi, 200,453 caixas"},{"@type":"PropertyValue","name":"Ambiente de Recolha","value":"Inclui embalagens de produtos, cartazes, bilhetes, avisos, cardápios, placas de edifícios etc."},{"@type":"PropertyValue","name":"Diversidade de Recolha","value":"Vários cenários naturais, vários ângulos de captura, diferentes condições de iluminação"},{"@type":"PropertyValue","name":"Equipamento de Recolha","value":"Celular"},{"@type":"PropertyValue","name":"Ângulo de Captação","value":"Vista de baixo, de cima, e frontal"},{"@type":"PropertyValue","name":"Distribuição de Idiomas","value":"Coreano, hindi, inglês (em pequena quantidade)"},{"@type":"PropertyValue","name":"Formato dos Dados","value":"Formato de imagem: .jpg; formato de anotação: .json"},{"@type":"PropertyValue","name":"Distribuição do Formato das Caixas de Anotação","value":"Coreano: 315,822 caixas quadriláteras, 240,091 caixas poligonais; Hindi: 780 caixas quadriláteras, 199,671 caixas poligonais, 2 caixas retangulares"},{"@type":"PropertyValue","name":"Conteúdo Anotado","value":"Anotação com caixas poligonais (ou quadriláteras, ou retangulares) por linha, transcrição do conteúdo por linha, atributos do texto (tipo de idioma); anotação por coluna com caixas poligonais (ou quadriláteras, ou retangulares), transcrição do conteúdo por coluna, atributos do texto (tipo de idioma)"},{"@type":"PropertyValue","name":"Taxa de Precisão","value":"A detecção é considerada correta se a diferença nos vértices da caixa anotada for de no máximo 5 pixels; a precisão da caixa de detecção é de no mínimo 95%; a precisão da transcrição textual é de no mínimo 95%"}]
{"id":1254,"datatype":"1","titleimg":"https://pt.nexdata.ai/shujutang/static/image/index/datatang_tuxiang_default.webp","type1":"147","type1str":null,"type2":"150","type2str":null,"dataname":"104.320 imagens de dados OCR de cenas naturais em coreano e hindi.","datazy":[{"title":"Escala dos Dados","desc":"Escala dos Dados","content":"76,861 imagens em coreano, 555,913 caixas; 27,459 imagens em hindi, 200,453 caixas"},{"title":"Ambiente de Recolha","desc":"Ambiente de Recolha","content":"Inclui embalagens de produtos, cartazes, bilhetes, avisos, cardápios, placas de edifícios etc."},{"title":"Diversidade de Recolha","desc":"Diversidade de Recolha","content":"Vários cenários naturais, vários ângulos de captura, diferentes condições de iluminação"},{"title":"Equipamento de Recolha","desc":"Equipamento de Recolha","content":"Celular"},{"title":"Ângulo de Captação","desc":"Ângulo de Captação","content":"Vista de baixo, de cima, e frontal"},{"title":"Distribuição de Idiomas","desc":"Distribuição de Idiomas","content":"Coreano, hindi, inglês (em pequena quantidade)"},{"title":"Formato dos Dados","desc":"Formato dos Dados","content":"Formato de imagem: .jpg; formato de anotação: .json"},{"title":"Distribuição do Formato das Caixas de Anotação","desc":"Distribuição do Formato das Caixas de Anotação","content":"Coreano: 315,822 caixas quadriláteras, 240,091 caixas poligonais; Hindi: 780 caixas quadriláteras, 199,671 caixas poligonais, 2 caixas retangulares"},{"title":"Conteúdo Anotado","desc":"Conteúdo Anotado","content":"Anotação com caixas poligonais (ou quadriláteras, ou retangulares) por linha, transcrição do conteúdo por linha, atributos do texto (tipo de idioma); anotação por coluna com caixas poligonais (ou quadriláteras, ou retangulares), transcrição do conteúdo por coluna, atributos do texto (tipo de idioma)"},{"title":"Taxa de Precisão","desc":"Taxa de Precisão","content":"A detecção é considerada correta se a diferença nos vértices da caixa anotada for de no máximo 5 pixels; a precisão da caixa de detecção é de no mínimo 95%; a precisão da transcrição textual é de no mínimo 95%"}],"datatag":"Multiple natural scenes,Multiple shooting angles,Multiple light conditions","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"/data/apps/damp/temp/ziptemp/APY230328002_demo1711533626489/APY230328002_demo/2.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230328002_demo1711533626489/APY230328002_demo/2.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=1xXx3CKukYZpXUoWeGQa3UM5%2F5A%3D","intro":"","size":0,"progress":100,"type":"jpg"},{"name":"/data/apps/damp/temp/ziptemp/APY230328002_demo1711533626489/APY230328002_demo/3.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230328002_demo1711533626489/APY230328002_demo/3.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=k36XqpwImWbppq62S04QPeMPSEA%3D","intro":"","size":0,"progress":100,"type":"jpg"},{"name":"/data/apps/damp/temp/ziptemp/APY230328002_demo1711533626489/APY230328002_demo/1.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230328002_demo1711533626489/APY230328002_demo/1.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=zyhyQSDYy6jTbpF3nc4f%2F09ufT4%3D","intro":"","size":0,"progress":100,"type":"jpg"}],"officialSummary":"104,320 imagens de dados OCR (Reconhecimento Óptico de Caracteres) em cenas naturais de coreano e hindi.Os cenários de coleta incluem embalagens de produtos, cartazes, bilhetes, avisos, cardápios, placas de edifícios, entre outros.A Diversidade dos Dados abrange múltiplos cenários, diferentes ângulos de captura e variadas condições de iluminação.A distribuição dos idiomas inclui coreano, hindi e inglês (em pequena quantidade).Quanto à anotação, os dados são marcados com caixas poligonais (ou caixas quadriláteras ou retangulares) a nível de linha, transcrição do conteúdo da linha e atributos do texto (tipo de idioma); também são feitas marcações poligonais a nível de coluna, transcrição do conteúdo da coluna e atributos do texto (tipo de idioma).Este conjunto de dados OCR de cenas naturais em coreano e hindi pode ser usado para tarefas de OCR em cenas naturais nessas línguas.","dataexampl":null,"datakeyword":["Coreano"," Hindi"," Dados OCR"," Cena natural"," Dados de transliteração OCR"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"ocr","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,JP,PT,DE\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"104,320 Images - Korean and Hindi OCR Data in Natural Scenes","BGimg":"","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"],"firstList":[{"name":"/data/apps/damp/temp/ziptemp/APY230328002_demo1711533626489/APY230328002_demo/5.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230328002_demo1711533626489/APY230328002_demo/5.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=59499xW%2FRbwxe18fQPgO5cjSQFE%3D","intro":"","size":0,"progress":100,"type":"jpg"}]}
104.320 imagens de dados OCR de cenas naturais em coreano e hindi.
Coreano
Hindi
Dados OCR
Cena natural
Dados de transliteração OCR
104,320 imagens de dados OCR (Reconhecimento Óptico de Caracteres) em cenas naturais de coreano e hindi.Os cenários de coleta incluem embalagens de produtos, cartazes, bilhetes, avisos, cardápios, placas de edifícios, entre outros.A Diversidade dos Dados abrange múltiplos cenários, diferentes ângulos de captura e variadas condições de iluminação.A distribuição dos idiomas inclui coreano, hindi e inglês (em pequena quantidade).Quanto à anotação, os dados são marcados com caixas poligonais (ou caixas quadriláteras ou retangulares) a nível de linha, transcrição do conteúdo da linha e atributos do texto (tipo de idioma); também são feitas marcações poligonais a nível de coluna, transcrição do conteúdo da coluna e atributos do texto (tipo de idioma).Este conjunto de dados OCR de cenas naturais em coreano e hindi pode ser usado para tarefas de OCR em cenas naturais nessas línguas.
Este é um conjunto de dado pagos destinando a uso comercial, fins de investigação e otras finalidades. Conjunto de dados licenciado e pronto ajuda a acelerar projetos d IA.
Características
Escala dos Dados
76,861 imagens em coreano, 555,913 caixas; 27,459 imagens em hindi, 200,453 caixas
Ambiente de Recolha
Inclui embalagens de produtos, cartazes, bilhetes, avisos, cardápios, placas de edifícios etc.
Diversidade de Recolha
Vários cenários naturais, vários ângulos de captura, diferentes condições de iluminação
Equipamento de Recolha
Celular
Ângulo de Captação
Vista de baixo, de cima, e frontal
Distribuição de Idiomas
Coreano, hindi, inglês (em pequena quantidade)
Formato dos Dados
Formato de imagem: .jpg; formato de anotação: .json
Anotação com caixas poligonais (ou quadriláteras, ou retangulares) por linha, transcrição do conteúdo por linha, atributos do texto (tipo de idioma); anotação por coluna com caixas poligonais (ou quadriláteras, ou retangulares), transcrição do conteúdo por coluna, atributos do texto (tipo de idioma)
Taxa de Precisão
A detecção é considerada correta se a diferença nos vértices da caixa anotada for de no máximo 5 pixels; a precisão da caixa de detecção é de no mínimo 95%; a precisão da transcrição textual é de no mínimo 95%