5,01 milhões de pares de dados do corpus paralelos chinês-tibetano

Dados do corpus paralelo chinês e tibetano

Corpus alinhado

Dados de corpus paralelo

Dados de corpus alinhado

Os dados do corpus paralelo chinês-tibetano inclui 5,01 milhões de pares de traduções paralelas em chinês e tibetano. O formato de armazenamento dos dados é em arquivos txt. Os dados passaram por limpeza, anonimização e controle de qualidade, podendo servir como um corpus básico para análise de dados textuais, sendo aplicável em áreas como tradução automática.

Este é um conjunto de dado pagos destinando a uso comercial, fins de investigação e otras finalidades. Conjunto de dados licenciado e pronto ajuda a acelerar projetos d IA.

Conjuntos de Dados Recomendados

5,5 milhões de pares de corpus paralelo turco-inglês

5,5 milhões de pares de textos paralelos turco-inglês, armazenados como arquivos .txt, cobrindo vários domínios. Os dados passaram por limpeza, anonimização e controle de qualidade. Podem ser usados como corpus base para análise textual e tradução automática.

Corpus Paralelo Turco Inglês

1,98 milhão de pares de corpus paralelo chinês-polonês

O corpus paralelo chinês-polonês contém 1,98 milhão de pares de traduções entre chinês e polonês, armazenados em arquivos .txt. Também passou por limpeza, anonimização e controle de qualidade, sendo útil para análise textual e tradução automática.

Dados de corpus paralelo chinês e polonês Corpus alinhado dados de corpus paralelo Dados de corpus alinhado

1,99 milhão de pares de corpus paralelo chinês-tcheco

O corpus paralelo chinês-tcheco contém 1,99 milhão de pares de traduções entre chinês e tcheco, armazenados em arquivos .txt. Os dados passaram por limpeza, anonimização e controle de qualidade, sendo adequados como base para análises textuais e aplicações como tradução automática.

Dados de corpus paralelo chinês e tcheco Corpus alinhado Dados de corpus paralelo Dados de corpus alinhado

980 mil pares de dados paralelos chinês-urdu.

Os dados paralelos chinês-urdu incluem 980 mil pares de textos paralelos traduzidos mutuamente, armazenados em formato de documento txt. Os dados passaram por limpeza, anonimização e controle de qualidade, podendo ser usados como um corpus básico para análise de dados textuais e aplicados em áreas como tradução automática.

Dados do corpus paralelo chinês e urdu Corpus de alinhamento Dados de corpus paralelo Dados de corpus de alinhamento

1,14 milhões de pares de dados paralelos em chinês e hebraico

1,14 milhões de pares de dados paralelos chinês-hebraico, em formato txt, abrangendo turismo, vida quotidiana, notícias, entre outros domínios. Os dados foram limpos, anonimizados e verificados, sendo adequados para tradução automática e análise textual.

Dados de Corpus Paralelo Chinês-Hebraico Corpus Paralelo Chinês-Hebraico Dados de Corpus Paralelo Dados de Alinhamento de Corpus

12.820.000 Conjuntos de Dados de Corpus Paralelo Chinês-Coreano

12,820,000 Conjuntos de Dados de Corpus Paralelo Chinês-Coreano, armazenados no formato de documentos txt, abrangem diversos domínios, como linguagem coloquial, turismo, notícias, finanças. Submetido a processos de limpeza, desensibilização e controlo de qualidade, o corpus pode servir como base para análises de dados de texto, aplicando-se a campos como a tradução automática.

Corpus Paralelo Chinês-Coreano Dados de Corpus Corpus de Alinhamento Dados de Corpus Paralelo Dados de Corpus de Alinhamento

3,14 milhões de pares de dados paralelos em chinês e espanhol

3,14 milhões de pares de dados paralelos de tradução entre chinês e espanhol, armazenados em formato txt, provenientes da área científica e tecnológica. Após limpeza e anonimização, os dados estão prontos para utilização como corpus de base em análise textual e tradução automática.

Dados de Corpus Paralelo Inglês-Japonês Corpus Paralelo Inglês-Japonês Dados de Corpus Paralelo Dados de Alinhamento de Corpus

850.000 pares de dados paralelos em inglês e japonês

850.000 pares de dados paralelos de tradução entre inglês e japonês, armazenados em formato txt, abrangendo turismo, medicina, vida quotidiana, notícias e outros domínios. Os dados foram limpos, anonimizados e verificados, podendo servir como corpus básico para análise textual e tradução automática.

Dados de Corpus Paralelo Inglês-Japonês Corpus Paralelo Inglês-Japonês Dados de Corpus Paralelo Dados de Alinhamento de Corpus

5,01 milhões de pares de dados do corpus paralelos chinês-tibetano

Dados do corpus paralelo chinês e tibetano Corpus alinhado Dados de corpus paralelo Dados de corpus alinhado

Nível de maturidade do projeto

Dados do corpus paralelo chinês e tibetano

Corpus alinhado

Dados de corpus paralelo

Dados de corpus alinhado