pt

Please fill in your name

Mobile phone format error

Por favor, insira o telefone

Por favor, insira o nome da sua empresa

Por favor, insira o e-mail da sua empresa

Por favor, insira a solicitação de dados

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

A solicitação de dados não pode conter menos de 5 palavras nem conter apenas números

Datasets para ASR

Melhore instantaneamente o desempenho dos seus modelos de IA com conjuntos de dados prontos para uso e de alta qualidade.

Idioma

Todos
203
Árabe
4
Birmanês
2
Dialetos chineses
3
Inglês
43
Francês
11
Alemão
9
Hindi
6
Indonésio
8
Italiano
8
Japonês
8
Coreano
13
Malaio
5
Mandarim
4
Outros
45
Português
12
Russo
6
Espanhol
14
Tailandês
8
Vietnamita
6

Tipos de Dados

Todos
203
Diálogo
101
Leitura
103

97 horas de dados de voz infantil em português do Brasil – estilo coloquial

Dados de voz infantil em português do Brasil – estilo coloquial O conteúdo abrange áreas gerais como mídias sociais, diálogos, transmissões ao vivo, palestras e programas de variedades, refletindo situações reais de interação. Este conjunto de dados é anotado com conteúdo textual, identidade dos locutors, gênero, sotaque e outros atributos. As gravações foram feitas por várias crianças brasileiras de até 12 anos, provenientes de diferentes regiões e contextos culturais. Os dados apresentam alta precisão e são fáceis de utilizar, oferecendo recursos valiosos para pesquisas e aplicações em reconhecimento de fala. Foram validados por múltiplas empresas de IA, auxiliando os modelos a se destacarem diante da diversidade do mundo real. Seguimos rigorosamente as leis de proteção de dados e privacidade, garantindo que a coleta, o armazenamento e o uso das informações mantenham os direitos legais e a privacidade dos usuários. Todos os dados estão em conformidade com o GDPR, CCPA e PIPL.
Português brasileiro Fala espontânea Anotação de texto

500 horas de dados de voz em português do Brasil — linguagem oral

Dados de voz em português do Brasil — linguagem oral. O conteúdo cobre áreas como mídia independente, conversas e transmissões ao vivo, refletindo situações reais de interação. O conjunto foi anotado com texto, identidade do locutor, gênero, entre outros atributos. Altamente preciso e de fácil uso, serve como recurso rico para pesquisas e aplicações em reconhecimento de fala. Validado por múltiplas empresas de IA, ajuda modelos a lidar melhor com a diversidade do mundo real. Todo o processo de coleta, armazenamento e uso dos dados segue as leis de proteção de dados e privacidade, conforme GDPR, CCPA e PIPL.
Português brasileiro Fala espontânea Anotação de texto

2,000 horas de dados de voz em inglês australiano – linguagem coloquial

Dados de voz coloquial em inglês australiano, abrangendo áreas como mídias sociais, diálogos e transmissões ao vivo, refletindo interações reais do cotidiano. O conjunto de dados inclui anotações como conteúdo textual, identidade e gênero dos locutors, sendo gravado por locutors nativos de diferentes regiões e contextos culturais. Possui alta precisão e excelente usabilidade, oferecendo recursos valiosos para pesquisas e aplicações em reconhecimento de fala, ajudando os modelos a se saírem bem diante da diversidade do mundo real. A coleta, o armazenamento e o uso dos dados seguem rigorosamente as legislações de proteção de dados e privacidade, garantindo os direitos e a privacidade dos usuários. Todos os dados estão em conformidade com o GDPR, CCPA e PIPL.
Inglês Austrália Conversa Informal ASR

97 horas de dados de voz de crianças em alemão – linguagem coloquial

Dados de voz de crianças alemãs – linguagem coloquial, com conteúdo abrangendo mídias sociais, diálogos, transmissões ao vivo, palestras, variedades e outras áreas gerais, refletindo situações de interação do mundo real. Este conjunto de dados inclui anotações de conteúdo textual, identidade do locutor, gênero e outros atributos. Foi gravado por várias crianças alemãs com até 12 anos, provenientes de diferentes regiões e contextos culturais, garantindo alta precisão e facilidade de uso. É um recurso valioso para pesquisas e aplicações relacionadas ao reconhecimento de voz, ajudando os modelos a apresentarem bom desempenho diante da diversidade do mundo real. Seguimos rigorosamente as leis de proteção de dados e regulamentos de privacidade, garantindo a privacidade e os direitos legais dos usuários durante a coleta, armazenamento e uso dos dados. Todos os dados estão em conformidade com o GDPR, CCPA e PIPL.
Fala espontânea Anotação de texto Alemão

101 horas de Dados de voz infantil em italiano – estilo coloquial

Dados de voz infantil em italiano (estilo coloquial), com conteúdo abrangendo mídias sociais, diálogos, transmissões ao vivo, palestras, programas de variedades, entre outros domínios gerais, refletindo contextos reais de interação. O conjunto é anotado com conteúdo textual, identidade e gênero do locutor, sotaque, entre outros atributos. As gravações foram feitas por várias crianças italianas de até 12 anos, de diferentes regiões e contextos culturais. O conjunto tem alta precisão e é fácil de usar, oferecendo ricas fontes para pesquisa e aplicação em reconhecimento de fala. Ajuda os modelos a lidar com a diversidade do mundo real. Seguimos rigorosamente as regulamentações de proteção de dados e privacidade, garantindo a proteção dos direitos dos usuários durante a coleta, o armazenamento e o uso. Todos os dados seguem as normas GDPR, CCPA e PIPL.
Dados de voz espontânea Anotação de Texto Italiano

Dados de Voz Coloquial em Espanhol Mexicano

Dados de Voz Coloquial em Espanhol Mexicano, abrangem domínios genéricos como mídias independentes, diálogos e transmissões ao vivo, refletindo cenários reais de interação.  Anotado com o conteúdo textual, género e identidade do locutor e outros atributos, com alta precisão e usabilidade. Oferece recursos abrangentes para pesquisas e aplicações relacionadas com reconhecimento de voz, ajudando os modelos a desempenharem-se excelentemente face à diversidade do mundo real. Cumprimos rigorosamente as leis de proteção de dados e as normas de privacidade, garantindo a proteção da privacidade dos utilizadores e os seus direitos legais durante todo o processo de recolha, armazenamento e utilização dos dados. Todos os dados estão em conformidade com o RGPD, CCPA e PIPL.
México Espanhol Conversação Casual ASR

34 horas de Dados de voz infantil em híndi da Índia — linguagem oral

Dados de voz infantil em híndi — linguagem oral. O conteúdo inclui mídia independente, conversas, transmissões ao vivo, palestras e programas de variedades, refletindo situações reais. O conjunto possui anotações sobre texto, identidade e gênero dos locutors, sotaque, entre outros. As gravações foram feitas por várias crianças de até 12 anos, oriundas de múltiplas regiões e contextos culturais da Índia. É um recurso valioso para pesquisas de reconhecimento de fala. Todos os dados estão em conformidade com regulamentações de privacidade como GDPR, CCPA e PIPL.
Hindi Conversa informal monólogo ASR Crianças

144.6 horas de Dados de voz infantil em espanhol da Espanha — coloquial.

Dados de voz infantil em espanhol da Espanha — coloquial, com conteúdo abrangendo mídias sociais, diálogos, transmissões ao vivo, palestras, programas de variedades e outros domínios gerais, refletindo situações reais de interação no mundo real. Este conjunto de dados é anotado com conteúdo textual, identidade e gênero do locutor, sotaque e outras características, gravado por várias crianças espanholas de até 12 anos, provenientes de diferentes regiões e contextos culturais. Possui alta precisão e facilidade de uso, oferecendo recursos ricos para pesquisas e aplicações relacionadas ao reconhecimento de voz, ajudando os modelos a se destacarem diante da diversidade do mundo real. Seguimos rigorosamente as leis de proteção de dados e regulamentos de privacidade, garantindo a proteção da privacidade e dos direitos legais dos usuários durante a coleta, armazenamento e uso dos dados. Todos os dados estão em conformidade com GDPR, CCPA e PIPL.
Espanhol Fala espontânea Anotação de texto

98 horas de Dados de voz infantil em indonésio da Indonésia — linguagem oral

Dados de voz infantil em indonésio da Indonésia — linguagem oral. O conteúdo abrange áreas como mídia independente, conversas, transmissões ao vivo, palestras e programas de variedades, refletindo situações reais de interação. Este conjunto de dados foi anotado com informações como conteúdo textual, identidade e gênero dos locutors, sotaque e outras características. As gravações foram feitas por múltiplas crianças de até 12 anos, provenientes de diferentes regiões e contextos culturais da Indonésia. É altamente preciso e de fácil uso, sendo um recurso valioso para pesquisas e aplicações em reconhecimento de fala. O conjunto está em conformidade com regulamentações de proteção de dados e privacidade, como GDPR, CCPA e PIPL.
Fala espontânea Anotação de texto Indonésio
. . .

loading

Personalize os Seus Dados Agora

Porquê escolher conjuntos de dados prontos?

  • Direitos de Autor

    Direitos de Autor

    Direitos claros e verificáveis
  • Segurança

    Segurança

    Autorização adequada Utilização segura
  • Profissionalismo

    Profissionalismo

    Produzido por especialistas em dados de IA
  • Diversidade

    Diversidade

    Coletado a partir de múltiplos cenários reais
  • Rentabilidade

    Rentabilidade

    Mais económico do que dados personalizados
  • Eficiência

    Eficiência

    Prontos a usar em segundos
4154541c-8e62-49e6-a9e3-58242fdf071d