en

Please fill in your name

Mobile phone format error

Por favor, insira o telefone

Por favor, insira o nome da sua empresa

Por favor, insira o e-mail da sua empresa

Por favor, insira a solicitação de dados

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

A solicitação de dados não pode conter menos de 5 palavras nem conter apenas números

Datasets para NLU

Melhore instantaneamente o desempenho dos seus modelos de IA com conjuntos de dados prontos para uso e de alta qualidade.

Tipo

Todos
34
Identificação de Entidades
4
Texto de Diálogo
1
Compreensão de Intenção
1
Outros
2
Corpus Paralelo
23

5,31 milhões de pares de dados paralelos em chinês e alemão

5,14 milhões de pares de dados paralelos entre chinês e alemão, armazenados no formato txt, abrangendo turismo, medicina, vida quotidiana, notícias e outros domínios. Os dados foram limpos, anonimizados e verificados, adequados como corpus base para análise de dados textuais e tradução automática.
Dados de Corpus Paralelo Chinês-Alemão Corpus Paralelo Chinês-Alemão Dados de Corpus Paralelo Dados de Alinhamento de Corpus

84.516 frases em inglês com anotações de intenção em cenários interativos

O conjunto de dados de reconhecimento de intenção em inglês contém um total de 84.516 frases, com anotações de intenções, slots e valores de slot. As áreas de intenção incluem música, meteorologia, datas, agendas, dispositivos domésticos, entre outras. É adequado para investigação em reconhecimento de intenção e domínios relacionados.
Dados de Anotação de Intenção em Inglês Dados Interativos de Anotação de Intenção Reconhecimento de Intenção Dados de Reconhecimento de Intenção em PLN Dados de NLU

1,08 milhões de pares de dados paralelos em inglês e russo

O total de dados paralelos em inglês e russo é de 1,08 milhões de pares, com remoção de termos sensíveis como política, conteúdo sexual ou dados pessoais. Podem ser utilizados como corpus de base para análise de dados textuais, em áreas como tradução automática.
Dados de Corpus Paralelo Chinês-Hindi Corpus Paralelo Chinês-Hindi Dados de Corpus Paralelo Dados de Alinhamento de Corpus

1.340.000 Conjuntos de Dados de Corpus Paralelo Inglês-Coreano

O Corpus Paralelo Inglês-Coreano conta com 1,34 milhões conjuntos no total; exclui termos sensíveis como política, conteúdo pornográfico e dados pessoais; pode servir como base para análises de dados textuais e aplicar-se em domínios como tradução automática.
Dados de Corpus Paralelo Inglês-Coreano Recolha de Corpus Inglês-Coreano Corpus de Alinhamento Dados de Corpus Paralelo Dados de Corpus de Alinhamento

380.000 Conjuntos de Dados de Corpus Paralelo Japonês-Inglês

O Corpus Paralelo Japonês-Inglês conta com 380 mil conjuntos no total; exclui termos sensíveis como política, conteúdo pornográfico e dados pessoais; pode servir como base para análises de dados textuais e aplicar-se em domínios como tradução automática.
Dados de Corpus Paralelo Japonês e Inglês Recolha de Corpus Paralelo Japonês e Inglês Corpus de Alinhamento Dados de Corpus Paralelo Dados de Corpus de Alinhamento

687.694 Registos - Dados Anotados de Intenção em Domínio Aberto

Dados Anotados de Intenção em Domínio Aberto foram obtidos pela anotação de 687.694 registos de conteúdos textuais gerados por utilizadores em cenários reais de telemóel. Abrangendo cenários de tarefas pendentes, cenários de localização e cenários de agenda, esses dados podem ser aplicados em tarefas como a compreensão da linguagem natural.
Dados de Domínio Aberto Dados de Anotação de Intenção Anotação de Dados textuais Dados de Texto de SMS Dados de Compreensão da Linguagem Natural Dados de Compreensão da Intenção

47.811 Frases - Dados Anotados de Intenção de Frases Individuais em Cenários Interativos

Dados Anotados de Intenção de Frases em Cenários Interativos, contêm 47.811 frases, anotadas com informações de intenção, incluindo slots e valores correspondentes. As áreas de intenção abrangem música, meteorologia, datas, agendas, dispositivos domésticos e outros domínios relevantes. Estes dados são adequados para pesquisas como reconhecimento de intenções.
Dados de Anotação de Intenção Dados de Anotação de Intenção Interativa Reconhecimento de Intenção Dados de Reconhecimento de Intenção em PLN (Processamento de Linguagem Natural) Dados de NLU (Compreensão de Linguagem Natural)

1,99 milhão de pares de corpus paralelo chinês-tcheco

O corpus paralelo chinês-tcheco contém 1,99 milhão de pares de traduções entre chinês e tcheco, armazenados em arquivos .txt. Os dados passaram por limpeza, anonimização e controle de qualidade, sendo adequados como base para análises textuais e aplicações como tradução automática.
Dados de corpus paralelo chinês e tcheco Corpus alinhado Dados de corpus paralelo Dados de corpus alinhado

10 Milhões Registos - Dados de Corpus de Mensagens Textuais em Caracteres Chineses Tradicionais

O Corpus de Mensagens Textuais em Caracteres Chineses Tradicionais, com um total de 10 milhões registos, são os dados reais de mensagens textuais coloquiais em caracteres chineses tradicionais, contendo apenas o texto das mensagens. As anotações estão armazenadas no formato txt. Esses dados podem ser aplicados em tarefas como compreensão da linguagem natural.
Corpus de Mensagens Textuais (SMS) em Caracteres Chineses Tradicionais Dados de Mensagens Textuais (SMS) em Caracteres Chineses tradicionais Recolha de Mensagens Textuais (SMS) em Caracteres Chineses Tradicionais Dados de Corpus em Caracteres Chineses Tradicionais

loading

Personalize os Seus Dados Agora

Porquê escolher conjuntos de dados prontos?

  • Direitos de Autor

    Direitos de Autor

    Direitos claros e verificáveis
  • Segurança

    Segurança

    Autorização adequada Utilização segura
  • Profissionalismo

    Profissionalismo

    Produzido por especialistas em dados de IA
  • Diversidade

    Diversidade

    Coletado a partir de múltiplos cenários reais
  • Rentabilidade

    Rentabilidade

    Mais económico do que dados personalizados
  • Eficiência

    Eficiência

    Prontos a usar em segundos
62710c11-2603-4d09-8164-3555d3fde948