Conjuntos de Dados Prontos a Usar | Torne a sua IA mais competitiva

262 Horas de Dados de Fala Infantil Japonesa

411 Falantes – Aprox. 262 Horas de Conjunto de Dados de Fala Infantil Japonesa, composto por 147.668 enunciados roteirizados. Os falantes são crianças japonesas com idades entre 6 e 13 anos, categorizadas em séries iniciais (6–9 anos, 179 falantes) e séries finais (10–13 anos, 232 falantes), com distribuição equilibrada de gênero. As gravações foram realizadas com smartphones no formato WAV mono 16kHz/16bit, acompanhadas de transcrições de enunciados e roteiros de leitura. O conjunto de dados é aplicável a tarefas como ASR infantil em japonês, TTS, reconhecimento de locutor e avaliação de pronúncia.

Japonês Crianças Leitura em voz alta

Conjunto de Dados da Competição de Diálogo Multilíngue Interspeech 2025-MLC- SLM

O contexto do Conjunto de Dados da Competição de Diálogo Multilíngue Interspeech 2025-MLC-SLM tem origem na organização da Competição de Diálogo Multilíngue MLC-SLM pela Datatang em 2025. O conjunto de dados provém da recolha de quinze conjuntos de dados de diálogos por Datatang. Caracterizado por alta precisão de dados e forte usabilidade, foi projetado especificamente para superar gargalos técnicos no reconhecimento de fala multilíngue e compreensão de contexto longo. O conjunto de dados captura de forma autêntica cenários interativos complexos, como sobreposição de falantes e interrupções espontâneas, fornecendo recursos ricos para pesquisas e aplicações relacionadas com reconhecimento de voz, ajudando os modelos a desempenharem-se excelentemente face à diversidade do mundo real. Cumprimos rigorosamente as leis de proteção de dados e as normas de privacidade, garantindo a proteção da privacidade dos utilizadores e os seus direitos legais durante todo o processo de recolha, armazenamento e utilização dos dados. Todos os dados estão em conformidade com o RGPD, CCPA e PIPL.

Conjunto de Dados de Áudio de Workshop Conjunto de Dados MLC-SLM Dados de Reconhecimento de Fala ASR

111 Horas - Dados de Voz em Grego: Leitura (Telemóvel)

Dados de Voz em Grego: Leitura (Telemóvel), recolhidos através de monólogos baseados em scripts fornecidos. Foram 95 locutores da Grécia, e as gravações foram feitas em um ambiente silencioso sem reverberação. O conteúdo gravado é amplo, com aproximadamente 1000 frases por cada locutor. Os textos são revisados manualmente para garantir alta precisão. Oferece recursos abrangentes para pesquisas e aplicações relacionadas com reconhecimento de voz, validado por várias empresas de IA: ajuda os modelos a desempenharem-se excelentemente face à diversidade do mundo real. Cumprimos rigorosamente as leis de proteção de dados e as normas de privacidade, garantindo a proteção da privacidade dos utilizadores e os seus direitos legais durante todo o processo de recolha, armazenamento e utilização dos dados. Todos os dados estão em conformidade com o RGPD, CCPA e PIPL.

Conjunto de Dados de Monólogo Roteirizado em Grego Conjunto de Dados de Fala em Grego Conjunto de Dados de Áudio em Grego Dados de Fala em Grego Dados de Síntese de Fala em Grego

280 Horas - Dados de Voz em Norueguês: Leitura (Telemóvel)

Dados de Voz em Norueguês: Leitura (Telemóvel), recolhidos através de monólogos baseados em scripts fornecidos. Foram 157 locutores da Noruega, e as gravações foram feitas em um ambiente silencioso sem reverberação. O conteúdo gravado é amplo, com aproximadamente 1000 frases por cada locutor. Os textos são revisados manualmente para garantir alta precisão. Oferece recursos abrangentes para pesquisas e aplicações relacionadas com reconhecimento de voz, validado por várias empresas de IA: ajuda os modelos a desempenharem-se excelentemente face à diversidade do mundo real. Cumprimos rigorosamente as leis de proteção de dados e as normas de privacidade, garantindo a proteção da privacidade dos utilizadores e os seus direitos legais durante todo o processo de recolha, armazenamento e utilização dos dados. Todos os dados estão em conformidade com o RGPD, CCPA e PIPL.

Conjunto de Dados de Monólogo Roteirizado em Norueguês Conjunto de Dados de Fala em Norueguês Dados de Síntese de Fala em Norueguês Corpus de NLP em Norueguês Dados de Fala em Norueguês Conjunto de Dados de Áudio em Norueguês

581 Horas - Dados de Voz Coloquial em Grego

Dados de Voz Coloquial em Grego, abrangem domínios genéricos como mídias independentes, diálogos e transmissões ao vivo, refletindo cenários reais de interação. Anotado com o conteúdo textual, género e identidade do locutor e outros atributos, este conjunto de dados foi gravado por nativos romenos de diferentes regiões e culturas, garantindo alta precisão e usabilidade. Oferece recursos abrangentes para pesquisas e aplicações relacionadas com reconhecimento de voz, ajudando os modelos a desempenharem-se excelentemente face à diversidade do mundo real. Cumprimos rigorosamente as leis de proteção de dados e as normas de privacidade, garantindo a proteção da privacidade dos utilizadores e os seus direitos legais durante todo o processo de recolha, armazenamento e utilização dos dados. Todos os dados estão em conformidade com o RGPD, CCPA e PIPL.

Conjunto de Dados de Fala Grega Dados de Treinamento ASR em Grego Corpus de Conversação Grega Fala Monológica Grega Conjunto de Dados de Reconhecimento de Fala Grega Dados de Fala para Texto Grego Conjunto de Dados de Voz Grega Conjunto de Dados de Transcrição Grega

600 Horas - Dados de Voz Coloquial em Norueguês

Dados de Voz Coloquial em Norueguês, abrangem domínios genéricos como mídias independentes, diálogos e transmissões ao vivo, refletindo cenários reais de interação. Anotado com o conteúdo textual, género e identidade do locutor e outros atributos, este conjunto de dados foi gravado por múltiplos noruegueses de diferentes regiões e culturas, garantindo alta precisão e usabilidade. Oferece recursos abrangentes para pesquisas e aplicações relacionadas com reconhecimento de voz, ajudando os modelos a desempenharem-se excelentemente face à diversidade do mundo real. Cumprimos rigorosamente as leis de proteção de dados e as normas de privacidade, garantindo a proteção da privacidade dos utilizadores e os seus direitos legais durante todo o processo de recolha, armazenamento e utilização dos dados. Todos os dados estão em conformidade com o RGPD, CCPA e PIPL.

Conjunto de Dados de Fala em Norueguês Dados de Treinamento ASR em Norueguês Corpus de Conversação em Norueguês Fala Monológica em Norueguês Conjunto de Dados de Reconhecimento de Fala em Norueguês Dados de Fala para Texto em Norueguês Conjunto de Dados de Voz em Norueguês Dados de Fala Multilíngues Conjunto de Dados de Transcrição em Norueguês

Dados textuais da plataforma de perguntas e respostas japonesa OKWAVE

Dados de texto da plataforma japonesa de perguntas e respostas OKWAVE, incluindo perguntas, respostas, categorias, data de publicação, autores e outros campos. Os dados estão em atualização contínua; até o final de abril de 2025, havia 8,4 milhões de perguntas com 2,3 bilhões de caracteres, 27 milhões de respostas com 7,6 bilhões de caracteres, 15,5 milhões de agradecimentos (expressões de gratidão dos perguntadores aos respondentes) com 1,7 bilhão de caracteres, e 2,1 milhões de esclarecimentos adicionais com 360 milhões de caracteres. Esses dados podem ser usados para treinamento de modelos gerais de grande porte.

Perguntas e Respostas Texto Japonês

500 Horas - Dados de Voz em Tamil: Leitura (Telemóvel)

Dados de Voz em Tamil: Leitura (Telemóvel), recolhidos através de monólogos baseados em scripts fornecidos com conteúdo rico. Anotado com o conteúdo textual e outros atributos, o conjunto de dados foi recolhido por 479 nativos, com precisão alta. Oferece recursos abrangentes para pesquisas e aplicações relacionadas com reconhecimento de voz, validado por várias empresas de IA: ajuda os modelos a desempenharem-se excelentemente face à diversidade do mundo real. Cumprimos rigorosamente as leis de proteção de dados e as normas de privacidade, garantindo a proteção da privacidade dos utilizadores e os seus direitos legais durante todo o processo de recolha, armazenamento e utilização dos dados. Todos os dados estão em conformidade com o RGPD, CCPA e PIPL.

Conjunto de Dados de Fala em Tamil Conjunto de Dados de Áudio em Tamil Conjunto de Dados de Língua Tamil Conjunto de Dados de Monólogo em Tamil Corpus de Voz em Tamil Dados ASR em Tamil Fala Roteirizada em Tamil Conjunto de Dados de Tamil para Telemóvel Conjunto de Dados de Reconhecimento de Fala em Tamil Dados de Fala Multilíngue

500 Horas - Dados de Voz em Lao: Leitura (Telemóvel)

Dados de Voz em Lao: Leitura (Telemóvel), recolhidos através de monólogos baseados em scripts fornecidos com conteúdo rico. Anotado com atributos como o conteúdo textual, este conjunto de dados foi gravado por 418 nativos, com precisão alta. Oferece recursos abrangentes para pesquisas e aplicações relacionadas com reconhecimento de voz, ajudando os modelos a desempenharem-se excelentemente face à diversidade do mundo real. Cumprimos rigorosamente as leis de proteção de dados e as normas de privacidade, garantindo a proteção da privacidade dos utilizadores e os seus direitos legais durante todo o processo de recolha, armazenamento e utilização dos dados. Todos os dados estão em conformidade com o RGPD, CCPA e PIPL.

Conjunto de Dados de Fala em Lao Conjunto de Dados de Fala Monológica em Lao Conjunto de Dados de Fala Roteirizada em Lao Conjunto de Dados de Fala em Lao para Telemóvel Conjunto de Dados de Voz em Lao para TTS Conjunto de Dados de Áudio em Lao Conjunto de Dados de Voz em Lao para ASR

Dados de Voz de Diálogos Scriptados em Gujarati

Dados de Voz de Diálogos Scriptados em Gujarati, recolhidos através de diálogos baseados em scripts fornecidos, abrangem diversos setores e com conteúdo rico. Este conjunto de dados está anotado com o conteúdo textual e outros atributos com alta precisão, oferecendo recursos abrangentes para pesquisas e aplicações relacionadas com reconhecimento de voz, validado por várias empresas de IA: ajuda os modelos a desempenharem-se excelentemente face à diversidade do mundo real. Cumprimos rigorosamente as leis de proteção de dados e as normas de privacidade, garantindo a proteção da privacidade dos utilizadores e os seus direitos legais durante todo o processo de recolha, armazenamento e utilização dos dados. Todos os dados estão em conformidade com o RGPD, CCPA e PIPL.

Conjunto de Dados de Áudio em Gujarati Conjunto de Dados ASR em Gujarati Conjunto de Dados de Fala em Gujarati Conjunto de Dados TTS em Gujarati

100 Horas - Dados de Voz em Birmanês: Leitura (Telemóvel)

Dados de Voz em Birmanês: Leitura (Telemóvel), recolhidos através de monólogos baseados em scripts fornecidos. Anotado com o conteúdo textual, este conjunto de dados foi gravado por nativos usando telemóveis, com precisão alta. Oferece recursos abrangentes para pesquisas e aplicações relacionadas com reconhecimento de voz, ajudando os modelos a desempenharem-se excelentemente face à diversidade do mundo real. Cumprimos rigorosamente as leis de proteção de dados e as normas de privacidade, garantindo a proteção da privacidade dos utilizadores e os seus direitos legais durante todo o processo de recolha, armazenamento e utilização dos dados. Todos os dados estão em conformidade com o RGPD, CCPA e PIPL.

Ler Leitura Birmanês

30 milhões de vídeos de alta qualidade

30 milhões de vídeos de alta qualidade, com uma grande variedade de tipos de recursos, alta resolução e qualidade de imagem clara, com alta fidelidade de cores e detalhes bem apresentados. Todo o material foi obtido por meios legais, com direitos autorais claramente indicados e limites de autorização de uso definidos. Todo o material oferece autorização para uso comercial e já possui licença para uso em pesquisa, com propriedade intelectual clara e rastreável. Esse vasto e rico recurso de vídeos fornece suporte poderoso para pesquisa na área de visão computacional, treinamento de algoritmos de reconhecimento de imagem, obtenção de materiais para design criativo e diversos outros cenários, ajudando a realizar esses trabalhos de forma eficiente.

Vídeo 4K