en

Please fill in your name

Mobile phone format error

Por favor, insira o telefone

Por favor, insira o nome da sua empresa

Por favor, insira o e-mail da sua empresa

Por favor, insira a solicitação de dados

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

A solicitação de dados não pode conter menos de 5 palavras nem conter apenas números

330 horas de dados de voz em dari (telefone)

ASR
Áudio
Conversacional
dados ASR
Dari

Dados de voz em dari (telefone), gravados com base na simulação de cerca de vinte temas comuns. Este conjunto de dados inclui anotações de conteúdo textual, marcação de tempo das frases, identidade dos locutors, gênero e outros atributos. Foi gravado por 452 locutors nativos do Afeganistão com diferentes origens regionais e culturais, garantindo alta precisão. Trata-se de um recurso valioso para pesquisas e aplicações relacionadas ao reconhecimento de voz, já validado por múltiplas empresas de IA: ajuda os modelos a apresentarem bom desempenho diante da diversidade do mundo real. Seguimos rigorosamente as leis de proteção de dados e regulamentos de privacidade, garantindo que a coleta, o armazenamento e o uso dos dados respeitem a privacidade e os direitos legais dos usuários. Todos os dados estão em conformidade com o GDPR, CCPA e PIPL.

Conjuntos de Dados Pagos
Este é um conjunto de dado pagos destinando a uso comercial, fins de investigação e otras finalidades. Conjunto de dados licenciado e pronto ajuda a acelerar projetos d IA.
EspecificaçõesCaracterísticas
Formato
8kHz, 8 bit, u-law/a-law PCM, mono
Categorias de Conteúdo
Os locutores escolhem tópicos familiares de uma lista e gravam diálogos naturais e fluidos
Condições de Gravação
Ambiente interno relativamente silencioso, sem eco
Equipamento de Gravação
Sistema de gravação telefônica
Informações dos Gravadores
No total, 452 pessoas, entre elas 425 homens e 27 mulheres
País
Afeganistão
Língua
Dari
Características de Anotação
Anotação do conteúdo textual, marcação de tempo das frases, identificação do locutor, gênero
Taxa de Precisão
Precisão de palavras: 95%
Amostra Amostra
  • Audio

    مکتبهای دولتی مکتبهای شخصی وجود داره

  • Audio

    دیگه ده همی جای شما

  • Audio

    کلشان در تعلیم مصروف هستن و مکتبا همینطور فعلا خوب مکتبام شروع شدن

  • Audio

    دیگه مکتبا پوهنتونا همینطور مدرسه ها کلشان ده همیجه فعال هستن

  • Audio

    پاچای پیشینگی ما بود و حالا که هسته

Conjuntos de Dados RecomendadosConjuntos de Dados Recomendados
Informe-nos das Suas Necessidades Específicas

Ao submeter, declaro aceitação do Acordo de Licença de Dados

6c56acb9-b69d-4561-a15d-41bded222429

1a67d81e-b0be-4b18-a25d-9e27778c39f6