en

Please fill in your name

Mobile phone format error

Por favor, insira o telefone

Por favor, insira o nome da sua empresa

Por favor, insira o e-mail da sua empresa

Por favor, insira a solicitação de dados

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

A solicitação de dados não pode conter menos de 5 palavras nem conter apenas números

Conjunto de Dados da Competição de Diálogo Multilíngue Interspeech 2025-MLC- SLM

Conjunto de Dados de Áudio de Workshop
Conjunto de Dados MLC-SLM
Dados de Reconhecimento de Fala ASR

O contexto do Conjunto de Dados da Competição de Diálogo Multilíngue Interspeech 2025-MLC-SLM tem origem na organização da Competição de Diálogo Multilíngue MLC-SLM pela Datatang em 2025. O conjunto de dados provém da recolha de quinze conjuntos de dados de diálogos por Datatang. Caracterizado por alta precisão de dados e forte usabilidade, foi projetado especificamente para superar gargalos técnicos no reconhecimento de fala multilíngue e compreensão de contexto longo. O conjunto de dados captura de forma autêntica cenários interativos complexos, como sobreposição de falantes e interrupções espontâneas, fornecendo recursos ricos para pesquisas e aplicações relacionadas com reconhecimento de voz, ajudando os modelos a desempenharem-se excelentemente face à diversidade do mundo real. Cumprimos rigorosamente as leis de proteção de dados e as normas de privacidade, garantindo a proteção da privacidade dos utilizadores e os seus direitos legais durante todo o processo de recolha, armazenamento e utilização dos dados. Todos os dados estão em conformidade com o RGPD, CCPA e PIPL.

Conjuntos de Dados Pagos
Este é um conjunto de dado pagos destinando a uso comercial, fins de investigação e otras finalidades. Conjunto de dados licenciado e pronto ajuda a acelerar projetos d IA.
EspecificaçõesCaracterísticas
Formato
16kHz, 16 bit, WAV não comprimido, monoaural
Ambiente de Gravação
Ambiente interior relativamente silencioso, sem reverberação
Conteúdo de Gravação
Dados uma lista de tópicos, os locutores selecionam vários tópicos familiares para garantir que o diálogo seja fluido e natural. Em torno de cada tema, um diálogo é desenvolvido e gravado.
Características de Anotação
Anotação do conteúdo textual, marcas de tempo de início/fim para frases válidas, identificação do locutor
Equipamento
Telemóveis Android, iOS
Língua
Inglês americano, inglês britânico, inglês filipino, inglês australiano, inglês indiano, francês, alemão, italiano, japonês, coreano, português, russo, espanhol, tailandês, vietnamita.
Amostra Amostra
  • Audio

    one direction is the first thing like in the mind

  • Audio

    Parce que j'ai plus l'ancien, j'en ai que celui-là dorénavant.

  • Audio

    D'accord très bien l'autre, je vais l'effacer alors.

  • Audio

    조금 이제 날씨도 더워지는데 덜 답답하구

  • Audio

    이천치십 년이랑 이천이십일 년 진짜 학교 못 간게

Conjuntos de Dados RecomendadosConjuntos de Dados Recomendados
Informe-nos das Suas Necessidades Específicas

Ao submeter, declaro aceitação do Acordo de Licença de Dados

bda53669-8db2-4ef2-b322-e5af2d996824

20d020de-49ae-47d3-b106-8c39d95d8351