[{"@type":"PropertyValue","name":"Formato de Armazenamento","value":"TXT"},{"@type":"PropertyValue","name":"Conteúdo dos Dados","value":"Corpus paralelo chinês-uigur"},{"@type":"PropertyValue","name":"Escala dos Dados","value":"4,72 milhões de pares de dados paralelos chinês-uigur, comprimento médio das frases em chinês: 22 caracteres"},{"@type":"PropertyValue","name":"Língua","value":"Chinês, uigur"},{"@type":"PropertyValue","name":"Cenário de Aplicação","value":"Tradução automática"},{"@type":"PropertyValue","name":"Taxa de Precisão","value":"0.9"}]
{"id":1185,"datatype":"1","titleimg":"https://pt.nexdata.ai/shujutang/static/image/index/datatang_wenben_default.webp","type1":"183","type1str":null,"type2":"185","type2str":null,"dataname":"4,72 milhões de pares de dados paralelos em chinês e uigur","datazy":[{"title":"Formato de Armazenamento","desc":"Formato de Armazenamento","content":"TXT"},{"title":"Conteúdo dos Dados","desc":"Conteúdo dos Dados","content":"Corpus paralelo chinês-uigur"},{"title":"Escala dos Dados","desc":"Escala dos Dados","content":"4,72 milhões de pares de dados paralelos chinês-uigur, comprimento médio das frases em chinês: 22 caracteres"},{"title":"Língua","desc":"Língua","content":"Chinês, uigur"},{"title":"Cenário de Aplicação","desc":"Cenário de Aplicação","content":"Tradução automática"},{"title":"Taxa de Precisão","desc":"Taxa de Precisão","content":"0.9"}],"datatag":"Chinese,Uighur,Han-Uyghur,Parallel corpus","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"/data/apps/damp/temp/ziptemp/APY220720002_demo1711015209158/APY220720002-demo/zh_ug ????.png","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY220720002_demo1711015209158/APY220720002-demo/zh_ug%20%3F%3F%3F%3F.png?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=4x5LxBrzAXyre6%2BPLWdnkk8B%2FKI%3D","intro":"","size":0,"progress":100,"type":"jpg"}],"officialSummary":"O corpus paralelo chinês-uigur inclui 4,72 milhões de pares de frases em chinês e uigur, armazenados em formato txt. O conjunto foi sujeito a limpeza, anonimização e verificação de qualidade, podendo ser usado como corpus base para análise textual e tradução automática.","dataexampl":null,"datakeyword":["Dados de Corpus Paralelo Chinês-Uigur"," Corpus de Alinhamento"," Dados de Corpus Paralelo"," Dados de Corpus de Alinhamento"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Type","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"nlu","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,JP,PT,DE\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"4,720,000 Groups - Chinese-Uighur Parallel Corpus Data","BGimg":"","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
4,72 milhões de pares de dados paralelos em chinês e uigur
Dados de Corpus Paralelo Chinês-Uigur
Corpus de Alinhamento
Dados de Corpus Paralelo
Dados de Corpus de Alinhamento
O corpus paralelo chinês-uigur inclui 4,72 milhões de pares de frases em chinês e uigur, armazenados em formato txt. O conjunto foi sujeito a limpeza, anonimização e verificação de qualidade, podendo ser usado como corpus base para análise textual e tradução automática.
Este é um conjunto de dado pagos destinando a uso comercial, fins de investigação e otras finalidades. Conjunto de dados licenciado e pronto ajuda a acelerar projetos d IA.
Características
Formato de Armazenamento
TXT
Conteúdo dos Dados
Corpus paralelo chinês-uigur
Escala dos Dados
4,72 milhões de pares de dados paralelos chinês-uigur, comprimento médio das frases em chinês: 22 caracteres