pt

Please fill in your name

Mobile phone format error

Por favor, insira o telefone

Por favor, insira o nome da sua empresa

Por favor, insira o e-mail da sua empresa

Por favor, insira a solicitação de dados

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

A solicitação de dados não pode conter menos de 5 palavras nem conter apenas números

155 Horas - Dados de Vídeo de Sincronização Labial: Multimodal

Linguagem Labial
Multimodal
Mandarim
Leitura
Telemóvel
Câmara de Vídeo

249 pessoas participaram da gravação de voz e vídeos de linguagem labial correspondentes, com gravação sincronizada em múltiplos equipamentos. A alinhamento preciso é realizado por meio de sinal de pulso, garantindo alta precisão. O conjunto de dados pode ser utilizado para a pesquisa de algoritmos de aprendizagem multimodal na área de voz e imagem. Validado por várias empresas de IA, este conjunto de dado pode ajudar os modelos a desempenharem-se excelentemente face à diversidade do mundo real. Cumprimos rigorosamente as leis de proteção de dados e as normas de privacidade, garantindo a integridade da privacidade dos utilizadores e os seus direitos legais durante todo o processo de recolha, armazenamento e utilização dos dados. Todos os dados estão em conformidade com o RGPD, CCPA e PIPL.

Conjuntos de Dados Pagos
Este é um conjunto de dado pagos destinando a uso comercial, fins de investigação e otras finalidades. Conjunto de dados licenciado e pronto ajuda a acelerar projetos d IA.
EspecificaçõesCaracterísticas
Formato
Vídeo com formato mp4, 1.280*710; áudio com formato wav, 16kHz, 16bit, monoaural
Ambiente de Gravação
Cenário executado em sala interior silenciosa com janelas ensolaradas, simulando ambiente diurno de condução exterior, com relação sinal-ruído (SNR) de 15-20 dB.
Cenário de Gravação
Cenários categorizados conforme intensidade luminosa: cenários principais e subcenários
Conteúdo Gravado
Comandos curtos; frases orais
Gravador
249 chineses, sendo 125 homens e 124 mulheres
Equipamento de Gravação
Câmaras de vídeo, microfones de alta fidelidade,  placas de som.
Ângulo de Gravação
Gravação simultânea de vídeos com áudio em 6 ângulos: frontal, perfil unilateral, vista de cima, vista de baixo, perfil de cima, perfil de baixo, áudios (sem vídeo) em 2 distâncias: próxima e distal.
Língua
Mandarim
Cenário de Aplicação
reconhecimento labial
Taxa de Precisão
A Taxa de Precisão das Frases: 95%
Amostra Amostra
Conjuntos de Dados RecomendadosConjuntos de Dados Recomendados
Informe-nos das Suas Necessidades Específicas

Nível de maturidade do projeto

Fase inicial de exploração (sem especificações concretas)
Objetivos definidos, necessidade de orientação profissional
Fase de desenvolvimento ou otimização
Especialistas em dados e rotulagem com especificações claras

Ao submeter, declaro aceitação do Acordo de Licença de Dados

8c3a7773-d1ad-4e42-af17-323930a39324

3003edc6-2e68-430d-bcdb-a91d38d99591