Conjuntos de Dados para Reconhecimento de Voz

Please fill in your name

Mobile phone format error

Por favor, insira o telefone

Por favor, insira o nome da sua empresa

Por favor, insira o e-mail da sua empresa

Por favor, insira a solicitação de dados

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

A solicitação de dados não pode conter menos de 5 palavras nem conter apenas números

Início > Todos os Datasets por Categoria > Datasets para ASR

Idioma

Todos

208

Árabe

Birmanês

Dialetos chineses

Inglês

Francês

Alemão

Hindi

Indonésio

Italiano

Japonês

Coreano

Malaio

Mandarim

Outros

Português

Russo

Espanhol

Tailandês

Vietnamita

Tipos de Dados

Todos

208

Diálogo

105

Leitura

104

Dados de vídeo multimodais de leitura labial com múltiplos ângulos de 202 pessoas

Dados de vídeo multimodal de leitura labial com múltiplos ângulos envolvendo 202 pessoas. As cenas de coleta incluem ambientes internos com luz natural e ambientes internos com iluminação fluorescente. Os vídeos foram gravados com celular. A diversidade da coleta abrange diferentes cenários, faixas etárias e 13 ângulos de filmagem. A linguagem usada é o mandarim padrão. Os conteúdos gravados são de domínio geral, sem restrição de tema. Os dados podem ser usados em pesquisas de algoritmos de aprendizado multimodal na área de voz e imagem.

Múltiplos Ângulos Multimodalidade Labial Cenas Internas com Luz Natural Cenas Internas com Iluminação Fluorescente 13 Ângulos de Filmagem Mandarim Chinês Campo Geral

. . .

Personalize os Seus Dados Agora

Porquê escolher conjuntos de dados prontos?

Direitos de Autor
Direitos claros e verificáveis
Segurança
Autorização adequada Utilização segura
Profissionalismo
Produzido por especialistas em dados de IA
Diversidade
Coletado a partir de múltiplos cenários reais
Rentabilidade
Mais económico do que dados personalizados
Eficiência
Prontos a usar em segundos

Subscreva a Nossa Newsletter

Seja o primeiro a receber os últimos lançamentos de produtos, soluções de dados e novidades empresariais da Nexdata.

Datasets Pré-Processados: Todos os Datasets por Categoria; Datasets para LLM; Datasets para Visão Computacional; Datasets para ASR; Datasets para TTS; Datasets para OCR; Dicionário de Pronúncia; Datasets para NLU

Serviços de Dados: Dados de 3D PCD; Dados de Vista de Rua; Dados para OCR; Dados para Comportamento; Dados para Identidade; Dados para ASR; Dados para Síntese de Fala; Dados Multimodais

Setores: Embodied AI; IA Generativa; Veículos Autónomos; RA e RV; IA Conversacional; Casa Inteligente; Retalho; Cuidados de Saúde Inteligentes

Empresa: Sobre Nós; Notícias; Parceiros; Qualidade & Segurança; Eventos
Ligações Úteis: OPENMPD; DataPlus; Datarade

Plataforma: Plataforma
Competição: Competição
Recursos: Datasets Patrocinados

Aprimore a Sua IA com Dados de Alta Qualidade

+1(626)594-5598

[email protected]

Mapa do Site Termos e Condições

Utilizamos cookies para melhorar a sua experiência de navegação, apresentar anúncios ou conteúdos personalizados e analisar o tráfego do nosso website. Ao clicar em “Aceitar Todos”, concorda com a utilização de cookies.

c69eff79-07f6-4eb1-b992-d62e8b013f6a

Datasets para ASR

Idioma

Tipos de Dados

97 horas de dados de voz infantil em português do Brasil – estilo coloquial

406 horas de Dados de voz em português europeu – conversas por celular

101 horas de Dados de voz infantil em italiano – estilo coloquial

200 horas de dados de voz em malaio _ conversas (celular)

162 horas de dados de voz de crianças em francês – linguagem coloquial

494 horas de Dados de voz em hindi — coloquial

136 horas de Dados de voz em coreano — diálogos (por telefone)

347 horas de dados de voz em indonésio (celular)

Dados de vídeo multimodais de leitura labial com múltiplos ângulos de 202 pessoas

Personalize os Seus Dados Agora

Porquê escolher conjuntos de dados prontos?