[{"@type":"PropertyValue","name":"Formato de Armazenamento","value":"txt"},{"@type":"PropertyValue","name":"Conteúdo dos Dados","value":"Pares paralelos de corpus traduzidos mutuamente entre chinês e urdu"},{"@type":"PropertyValue","name":"Escala dos Dados","value":"980 mil pares de dados paralelos chinês-urdu, com média de 19,9 caracteres por sentença em chinês"},{"@type":"PropertyValue","name":"Língua","value":"Chinês, urdu"},{"@type":"PropertyValue","name":"Taxa de Precisão","value":"0.9"},{"@type":"PropertyValue","name":"Cenário de Aplicação","value":"Tradução automática"}]
{"id":1247,"datatype":"1","titleimg":"https://pt.nexdata.ai/shujutang/static/image/index/datatang_wenben_default.webp","type1":"183","type1str":null,"type2":"185","type2str":null,"dataname":"980 mil pares de dados paralelos chinês-urdu.","datazy":[{"title":"Formato de Armazenamento","desc":"Formato de Armazenamento","content":"txt"},{"title":"Conteúdo dos Dados","desc":"Conteúdo dos Dados","content":"Pares paralelos de corpus traduzidos mutuamente entre chinês e urdu"},{"title":"Escala dos Dados","desc":"Escala dos Dados","content":"980 mil pares de dados paralelos chinês-urdu, com média de 19,9 caracteres por sentença em chinês"},{"title":"Língua","desc":"Língua","content":"Chinês, urdu"},{"title":"Taxa de Precisão","desc":"Taxa de Precisão","content":"0.9"},{"title":"Cenário de Aplicação","desc":"Cenário de Aplicação","content":"Tradução automática"}],"datatag":"Chinese,Urdu,Chinese-Urdu,Parallel Corpus","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"/data/apps/damp/temp/ziptemp/APY230328001_demo1729159200917/zh-ur-demo.png","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230328001_demo1729159200917/zh-ur-demo.png?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=nUPuvCfxkLg92E5Ay0vj079s53I%3D","intro":"","size":0,"progress":100,"type":"jpg"}],"officialSummary":"Os dados paralelos chinês-urdu incluem 980 mil pares de textos paralelos traduzidos mutuamente, armazenados em formato de documento txt. Os dados passaram por limpeza, anonimização e controle de qualidade, podendo ser usados como um corpus básico para análise de dados textuais e aplicados em áreas como tradução automática.","dataexampl":null,"datakeyword":["Dados do corpus paralelo chinês e urdu"," Corpus de alinhamento"," Dados de corpus paralelo"," Dados de corpus de alinhamento"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Type","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"nlu","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,JP,PT,DE\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"980,000 Groups - Chinese-Urdu Parallel Corpus Data","BGimg":"","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
Os dados paralelos chinês-urdu incluem 980 mil pares de textos paralelos traduzidos mutuamente, armazenados em formato de documento txt. Os dados passaram por limpeza, anonimização e controle de qualidade, podendo ser usados como um corpus básico para análise de dados textuais e aplicados em áreas como tradução automática.
Este é um conjunto de dado pagos destinando a uso comercial, fins de investigação e otras finalidades. Conjunto de dados licenciado e pronto ajuda a acelerar projetos d IA.
Características
Formato de Armazenamento
txt
Conteúdo dos Dados
Pares paralelos de corpus traduzidos mutuamente entre chinês e urdu
Escala dos Dados
980 mil pares de dados paralelos chinês-urdu, com média de 19,9 caracteres por sentença em chinês