pt

Please fill in your name

Mobile phone format error

Por favor, insira o telefone

Por favor, insira o nome da sua empresa

Por favor, insira o e-mail da sua empresa

Por favor, insira a solicitação de dados

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

A solicitação de dados não pode conter menos de 5 palavras nem conter apenas números

104 horas de Dados de voz em português do Brasil – conversas por telefone

Fala conversacional
Dados de ASR em português
Conjunto de dados de ASR em português
Português

Áudio​‍​‌‍​‍‌​‍​‌‍​‍‌ em português do Brasil – chamadas telefónicas – geradas a partir de cerca de trinta tópicos comuns do dia a dia. Este conjunto de dados está acompanhado de transcrições, pontes de tempo ao nível da frase, informação sobre o orador, género, entre outros rótulos. Foi recolhido por 118 falantes nativos do português do Brasil de diferentes regiões e contextos culturais. O conjunto é altamente preciso, foi revisado por várias empresas de IA e é ideal para investigação e utilização em sistemas de reconhecimento de voz em ambientes de trabalho. Todos os dados foram tratados de acordo com as leis de proteção de dados (GDPR, CCPA e PIPL).

Conjuntos de Dados Pagos
Este é um conjunto de dado pagos destinando a uso comercial, fins de investigação e otras finalidades. Conjunto de dados licenciado e pronto ajuda a acelerar projetos d IA.
EspecificaçõesCaracterísticas
Formato
8kHz, 8 bit, u-law/a-law PCM, mono
Categorias de Conteúdo
Os locutores escolhem tópicos familiares de uma lista e gravam diálogos naturais e fluidos
Condições de Gravação
Ambiente interno relativamente silencioso, sem eco
Equipamento de Gravação
Sistema de gravação telefônica
Informações dos Gravadores
Total de 118 pessoas, sendo 64 homens e 54 mulheres
País
Brasil
Código de Região Linguística
pt-BR
Língua
Português
Características de Anotação
Anotação de conteúdo textual, marca de tempo de frase, identificação do locutor, género, anotação de ruído
Taxa de Precisão
Precisão de palavras: 98%
Amostra Amostra
  • Audio

    Eu lembro que tinha algumas pessoas, e também lembro que eu estava montado numa tartaruga gigante.

  • Audio

    E as carteiras eram ilhas, eu não lembro quem estava lá.

  • Audio

    eu lembro de ter sonhado, que eu estava na minha, é, no meu ensino fundamental, na sala do meu ensino fundamental.

  • Audio

    eu acabo misturando muita fantasia, muitas loucuras. Então um exemplo é, quando eu era jovem,

  • Audio

    e eu lembro que esta sala de aula virou um, um mar, tipo um oceano, na verdade.

Conjuntos de Dados RecomendadosConjuntos de Dados Recomendados
Informe-nos das Suas Necessidades Específicas

Nível de maturidade do projeto

Fase inicial de exploração (sem especificações concretas)
Objetivos definidos, necessidade de orientação profissional
Fase de desenvolvimento ou otimização
Especialistas em dados e rotulagem com especificações claras

Ao submeter, declaro aceitação do Acordo de Licença de Dados

5828af8f-bb24-4721-8739-5c81b325bac3

f8ea7fbe-50f1-44e8-a495-92bdd731f7e3