196 horas de dados de voz em urdu – Diálogos (telefone)

Áudio

Dados

Conjunto de dados

Conversacional

Dados de reconhecimento automático de fala

Urdu

Dados de voz em urdu – diálogos (telefone), gravados com base na simulação de cerca de vinte temas comuns. Este conjunto de dados inclui anotações de conteúdo textual, marcação de tempo das frases, identidade dos locutors, gênero e outros atributos. Foi gravado por 270 locutors nativos de diferentes regiões e contextos culturais, garantindo alta precisão. Trata-se de um recurso valioso para pesquisas e aplicações relacionadas ao reconhecimento de voz, já validado por múltiplas empresas de IA: ajuda os modelos a apresentarem bom desempenho diante da diversidade do mundo real. Seguimos rigorosamente as leis de proteção de dados e regulamentos de privacidade, garantindo que a coleta, armazenamento e uso dos dados respeitem a privacidade e os direitos legais dos usuários. Todos os dados estão em conformidade com o GDPR, CCPA e PIPL.

Este é um conjunto de dado pagos destinando a uso comercial, fins de investigação e otras finalidades. Conjunto de dados licenciado e pronto ajuda a acelerar projetos d IA.

Amostra

Audio
کہ یہ کرو، اور وہ کرو، اور احتیاطی تدابیر وغیرہ بھی نا۔
Audio
اچھا اور جب دیکھیں، ہمارا پہلے ہوتا تھا، یہ نزلہ وغیرہ اور ہم کہتے تھے، چلو ہم،
Audio
ہمم، اور دیکھیں ذرا، covid کا اور کورونا کا آج کل جو ہے، وہ اخبار اور ٹی وی میں بھی اتنا بتا رہے ہیں،
Audio
ہاں تمہیں پتہ ہے نا، پچھلے دو سالوں سے سردی زیادہ ہوتی ہے، تو سردی کے موسم میں کورونا کے پھیلنے کا خطرہ بھی زیادہ ہوتا ہے۔
Audio
سال میں دو، تین دفعہ تو سکول یہ کہہ کر بند کر دیے جاتے ہیں کہ کورونا کے پھیلنے کا خطرہ ہے۔

Conjuntos de Dados Recomendados

Conjunto de Dados da Competição de Diálogo Multilíngue Interspeech 2025-MLC- SLM

O contexto do Conjunto de Dados da Competição de Diálogo Multilíngue Interspeech 2025-MLC-SLM tem origem na organização da Competição de Diálogo Multilíngue MLC-SLM pela Datatang em 2025. O conjunto de dados provém da recolha de quinze conjuntos de dados de diálogos por Datatang. Caracterizado por alta precisão de dados e forte usabilidade, foi projetado especificamente para superar gargalos técnicos no reconhecimento de fala multilíngue e compreensão de contexto longo. O conjunto de dados captura de forma autêntica cenários interativos complexos, como sobreposição de falantes e interrupções espontâneas, fornecendo recursos ricos para pesquisas e aplicações relacionadas com reconhecimento de voz, ajudando os modelos a desempenharem-se excelentemente face à diversidade do mundo real. Cumprimos rigorosamente as leis de proteção de dados e as normas de privacidade, garantindo a proteção da privacidade dos utilizadores e os seus direitos legais durante todo o processo de recolha, armazenamento e utilização dos dados. Todos os dados estão em conformidade com o RGPD, CCPA e PIPL.

Conjunto de Dados de Áudio de Workshop Conjunto de Dados MLC-SLM Dados de Reconhecimento de Fala ASR

581 Horas - Dados de Voz Coloquial em Grego

Dados de Voz Coloquial em Grego, abrangem domínios genéricos como mídias independentes, diálogos e transmissões ao vivo, refletindo cenários reais de interação. Anotado com o conteúdo textual, género e identidade do locutor e outros atributos, este conjunto de dados foi gravado por nativos romenos de diferentes regiões e culturas, garantindo alta precisão e usabilidade. Oferece recursos abrangentes para pesquisas e aplicações relacionadas com reconhecimento de voz, ajudando os modelos a desempenharem-se excelentemente face à diversidade do mundo real. Cumprimos rigorosamente as leis de proteção de dados e as normas de privacidade, garantindo a proteção da privacidade dos utilizadores e os seus direitos legais durante todo o processo de recolha, armazenamento e utilização dos dados. Todos os dados estão em conformidade com o RGPD, CCPA e PIPL.

Conjunto de Dados de Fala Grega Dados de Treinamento ASR em Grego Corpus de Conversação Grega Fala Monológica Grega Conjunto de Dados de Reconhecimento de Fala Grega Dados de Fala para Texto Grego Conjunto de Dados de Voz Grega Conjunto de Dados de Transcrição Grega

600 Horas - Dados de Voz Coloquial em Norueguês

Dados de Voz Coloquial em Norueguês, abrangem domínios genéricos como mídias independentes, diálogos e transmissões ao vivo, refletindo cenários reais de interação. Anotado com o conteúdo textual, género e identidade do locutor e outros atributos, este conjunto de dados foi gravado por múltiplos noruegueses de diferentes regiões e culturas, garantindo alta precisão e usabilidade. Oferece recursos abrangentes para pesquisas e aplicações relacionadas com reconhecimento de voz, ajudando os modelos a desempenharem-se excelentemente face à diversidade do mundo real. Cumprimos rigorosamente as leis de proteção de dados e as normas de privacidade, garantindo a proteção da privacidade dos utilizadores e os seus direitos legais durante todo o processo de recolha, armazenamento e utilização dos dados. Todos os dados estão em conformidade com o RGPD, CCPA e PIPL.

Conjunto de Dados de Fala em Norueguês Dados de Treinamento ASR em Norueguês Corpus de Conversação em Norueguês Fala Monológica em Norueguês Conjunto de Dados de Reconhecimento de Fala em Norueguês Dados de Fala para Texto em Norueguês Conjunto de Dados de Voz em Norueguês Dados de Fala Multilíngues Conjunto de Dados de Transcrição em Norueguês

Dados de Voz de Diálogos Scriptados em Gujarati

Dados de Voz de Diálogos Scriptados em Gujarati, recolhidos através de diálogos baseados em scripts fornecidos, abrangem diversos setores e com conteúdo rico. Este conjunto de dados está anotado com o conteúdo textual e outros atributos com alta precisão, oferecendo recursos abrangentes para pesquisas e aplicações relacionadas com reconhecimento de voz, validado por várias empresas de IA: ajuda os modelos a desempenharem-se excelentemente face à diversidade do mundo real. Cumprimos rigorosamente as leis de proteção de dados e as normas de privacidade, garantindo a proteção da privacidade dos utilizadores e os seus direitos legais durante todo o processo de recolha, armazenamento e utilização dos dados. Todos os dados estão em conformidade com o RGPD, CCPA e PIPL.

Conjunto de Dados de Áudio em Gujarati Conjunto de Dados ASR em Gujarati Conjunto de Dados de Fala em Gujarati Conjunto de Dados TTS em Gujarati

600 Horas - Dados de Voz de Diálogos Naturais em Inglês Filipino em Faixas Separadas (Telemóvel)

Dados de Voz de Diálogos Naturais em Inglês Filipino em Faixas Separadas (Telemóvel), gravados com base em temas comuns. Anotado com atributos como o conteúdo textual, marcas de tempo das frases, género e identidade do locutor, este conjunto de dados foi gravado por nativos filipinos de diferentes regiões e culturas com precisão alta. Oferece recursos abrangentes para pesquisas e aplicações relacionadas com reconhecimento de voz, ajudando os modelos a desempenharem-se excelentemente face à diversidade do mundo real. Cumprimos rigorosamente as leis de proteção de dados e as normas de privacidade, garantindo a proteção da privacidade dos utilizadores e os seus direitos legais durante todo o processo de recolha, armazenamento e utilização dos dados. Todos os dados estão em conformidade com o RGPD, CCPA e PIPL.

Conjunto de Dados de Diálogo para IA Dados de Treinamento de Reconhecimento de Fala Conjunto de Dados de Áudio Multicanal Dados de Fala para Telemóvel Conjunto de Dados de Fala Espontânea Conjunto de Dados de Fala Multicanal Conjunto de Dados de Fala em Inglês Filipino Conjunto de Dados de Fala Duplex Completo

600 Horas - Dados de Voz de Diálogos Naturais em Inglês Americano em Faixas Separadas (Telemóvel)

Dados de Voz de Diálogos Naturais em Inglês Americano em Faixas Separadas (Telemóvel), gravados com base em temas comuns. Anotado com atributos como o conteúdo textual, marcas de tempo das frases, género e identidade do locutor, este conjunto de dados foi gravado por nativos americanos de diferentes regiões e culturas com precisão alta. Oferece recursos abrangentes para pesquisas e aplicações relacionadas com reconhecimento de voz, ajudando os modelos a desempenharem-se excelentemente face à diversidade do mundo real. Cumprimos rigorosamente as leis de proteção de dados e as normas de privacidade, garantindo a proteção da privacidade dos utilizadores e os seus direitos legais durante todo o processo de recolha, armazenamento e utilização dos dados. Todos os dados estão em conformidade com o RGPD, CCPA e PIPL.

Conjunto de Dados de Fala em Inglês Americano Conjunto de Dados de Fala Multicanal Conjunto de Dados de Diálogo Duplex Completo Conjunto de Dados de Fala Espontânea Dados de Fala para Telemóvel Conjunto de Dados de Áudio Multicanal Dados de Treinamento de Reconhecimento de Fala Conjunto de Dados de Diálogo para IA

Dados de Voz Coloquial em Espanhol Mexicano

Dados de Voz Coloquial em Espanhol Mexicano, abrangem domínios genéricos como mídias independentes, diálogos e transmissões ao vivo, refletindo cenários reais de interação. Anotado com o conteúdo textual, género e identidade do locutor e outros atributos, com alta precisão e usabilidade. Oferece recursos abrangentes para pesquisas e aplicações relacionadas com reconhecimento de voz, ajudando os modelos a desempenharem-se excelentemente face à diversidade do mundo real. Cumprimos rigorosamente as leis de proteção de dados e as normas de privacidade, garantindo a proteção da privacidade dos utilizadores e os seus direitos legais durante todo o processo de recolha, armazenamento e utilização dos dados. Todos os dados estão em conformidade com o RGPD, CCPA e PIPL.

México Espanhol Conversação Casual ASR

460 horas de dados de voz em sueco – linguagem coloquial

Dados de voz coloquial em sueco, refletindo situações reais de interação no mundo real. Este conjunto de dados está anotado com o conteúdo do texto, identidade do locutor, gênero e outras propriedades, gravado por locutors nativos da Suécia de diferentes regiões e contextos culturais. Possui alta precisão e é fácil de usar, fornecendo recursos ricos para pesquisas e aplicações relacionadas ao reconhecimento de fala. Isso ajuda os modelos a terem um desempenho excelente ao lidar com a diversidade do mundo real. Seguimos rigorosamente as leis de proteção de dados e privacidade, garantindo a privacidade e os direitos legais dos usuários durante a coleta, armazenamento e uso dos dados. Todos os dados estão em conformidade com GDPR, CCPA e PIPL.

Sueco Espontâneo ASR

196 horas de dados de voz em urdu – Diálogos (telefone)

Áudio Dados Conjunto de dados Conversacional Dados de reconhecimento automático de fala Urdu

Nível de maturidade do projeto

Áudio

Dados

Conjunto de dados

Conversacional

Dados de reconhecimento automático de fala

Urdu