[{"@type":"PropertyValue","name":"Formato de Armazenamento","value":"txt"},{"@type":"PropertyValue","name":"Conteúdo dos Dados","value":"Corpus paralelo chinês-tibetano"},{"@type":"PropertyValue","name":"Escala dos Dados","value":"5,01 milhões de pares de dados dos corpus paralelos chinês-tibetano, com comprimento médio da frase em chinês de 20,8 caracteres"},{"@type":"PropertyValue","name":"Língua","value":"Chinês, Tibetano"},{"@type":"PropertyValue","name":"Cenário de Aplicação","value":"Tradução automática"}]
{"id":1236,"datatype":"1","titleimg":"https://pt.nexdata.ai/shujutang/static/image/index/datatang_wenben_default.webp","type1":"183","type1str":null,"type2":"185","type2str":null,"dataname":"5,01 milhões de pares de dados do corpus paralelos chinês-tibetano","datazy":[{"title":"Formato de Armazenamento","desc":"Formato de Armazenamento","content":"txt"},{"title":"Conteúdo dos Dados","desc":"Conteúdo dos Dados","content":"Corpus paralelo chinês-tibetano"},{"title":"Escala dos Dados","desc":"Escala dos Dados","content":"5,01 milhões de pares de dados dos corpus paralelos chinês-tibetano, com comprimento médio da frase em chinês de 20,8 caracteres"},{"title":"Língua","desc":"Língua","content":"Chinês, Tibetano"},{"title":"Cenário de Aplicação","desc":"Cenário de Aplicação","content":"Tradução automática"}],"datatag":"Chinese,Tibetan,Chinese-Tibetan,Parallel Corpus","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"/data/apps/damp/temp/ziptemp/APY230315001_demo1729159200808/demo.png","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230315001_demo1729159200808/demo.png?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=tLL0sffQZBePZWEDJDuUT0Q%2B7oI%3D","intro":"","size":0,"progress":100,"type":"jpg"}],"officialSummary":"Os dados do corpus paralelo chinês-tibetano inclui 5,01 milhões de pares de traduções paralelas em chinês e tibetano. O formato de armazenamento dos dados é em arquivos txt. Os dados passaram por limpeza, anonimização e controle de qualidade, podendo servir como um corpus básico para análise de dados textuais, sendo aplicável em áreas como tradução automática.","dataexampl":null,"datakeyword":["Dados do corpus paralelo chinês e tibetano"," Corpus alinhado"," Dados de corpus paralelo"," Dados de corpus alinhado"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Type","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"nlu","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,JP,PT,DE\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"5,010,000 Groups - Chinese-Tibetan Parallel Corpus Data","BGimg":"","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
5,01 milhões de pares de dados do corpus paralelos chinês-tibetano
Dados do corpus paralelo chinês e tibetano
Corpus alinhado
Dados de corpus paralelo
Dados de corpus alinhado
Os dados do corpus paralelo chinês-tibetano inclui 5,01 milhões de pares de traduções paralelas em chinês e tibetano. O formato de armazenamento dos dados é em arquivos txt. Os dados passaram por limpeza, anonimização e controle de qualidade, podendo servir como um corpus básico para análise de dados textuais, sendo aplicável em áreas como tradução automática.
Este é um conjunto de dado pagos destinando a uso comercial, fins de investigação e otras finalidades. Conjunto de dados licenciado e pronto ajuda a acelerar projetos d IA.
Características
Formato de Armazenamento
txt
Conteúdo dos Dados
Corpus paralelo chinês-tibetano
Escala dos Dados
5,01 milhões de pares de dados dos corpus paralelos chinês-tibetano, com comprimento médio da frase em chinês de 20,8 caracteres