en

Please fill in your name

Mobile phone format error

Por favor, insira o telefone

Por favor, insira o nome da sua empresa

Por favor, insira o e-mail da sua empresa

Por favor, insira a solicitação de dados

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

A solicitação de dados não pode conter menos de 5 palavras nem conter apenas números

155 Horas - Dados de Vídeo de Sincronização Labial: Multimodal

Linguagem Labial
Multimodal
Mandarim
Leitura
Telemóvel
Câmara de Vídeo

249 pessoas participaram da gravação de voz e vídeos de linguagem labial correspondentes, com gravação sincronizada em múltiplos equipamentos. A alinhamento preciso é realizado por meio de sinal de pulso, garantindo alta precisão. O conjunto de dados pode ser utilizado para a pesquisa de algoritmos de aprendizagem multimodal na área de voz e imagem. Validado por várias empresas de IA, este conjunto de dado pode ajudar os modelos a desempenharem-se excelentemente face à diversidade do mundo real. Cumprimos rigorosamente as leis de proteção de dados e as normas de privacidade, garantindo a integridade da privacidade dos utilizadores e os seus direitos legais durante todo o processo de recolha, armazenamento e utilização dos dados. Todos os dados estão em conformidade com o RGPD, CCPA e PIPL.

Conjuntos de Dados Pagos
Este é um conjunto de dado pagos destinando a uso comercial, fins de investigação e otras finalidades. Conjunto de dados licenciado e pronto ajuda a acelerar projetos d IA.
EspecificaçõesCaracterísticas
Formato
Vídeo com formato mp4, 1.280*710; áudio com formato wav, 16kHz, 16bit, monoaural
Ambiente de Gravação
Cenário executado em sala interior silenciosa com janelas ensolaradas, simulando ambiente diurno de condução exterior, com relação sinal-ruído (SNR) de 15-20 dB.
Cenário de Gravação
Cenários categorizados conforme intensidade luminosa: cenários principais e subcenários
Conteúdo Gravado
Comandos curtos; frases orais
Gravador
249 chineses, sendo 125 homens e 124 mulheres
Equipamento de Gravação
Câmaras de vídeo, microfones de alta fidelidade,  placas de som.
Ângulo de Gravação
Gravação simultânea de vídeos com áudio em 6 ângulos: frontal, perfil unilateral, vista de cima, vista de baixo, perfil de cima, perfil de baixo, áudios (sem vídeo) em 2 distâncias: próxima e distal.
Língua
Mandarim
Cenário de Aplicação
reconhecimento labial
Taxa de Precisão
A Taxa de Precisão das Frases: 95%
Amostra Amostra
Conjuntos de Dados RecomendadosConjuntos de Dados Recomendados
Informe-nos das Suas Necessidades Específicas

Ao submeter, declaro aceitação do Acordo de Licença de Dados

73d6af4c-f1f6-477d-a155-82c3e6534cfb

24e2a490-18a6-4b7a-b99c-2622dcfffdae