[{"@type":"PropertyValue","name":"Formato","value":"1) Matriz de 16 microfones de campo longínquo: 48kHz, 16 bits, wav, 16 canais;"},{"@type":"PropertyValue","name":"2) Matriz de 8 microfones de campo longínquo","value":"48kHz, 16 bits, wav, 8 canais;"},{"@type":"PropertyValue","name":"3) Microfone de campo longínquo de alta fidelidade","value":"48kHz, 16 bits, wav, monoaural;"},{"@type":"PropertyValue","name":"4) Telemóvel de campo próximo","value":"16kHz, 16 bits, wav, monoaural;"},{"@type":"PropertyValue","name":"Ambiente de Gravação","value":"Quatro salas de reuniões com diferentes tamanhos, sendo que cada tamanho de área inclui três salas distintas"},{"@type":"PropertyValue","name":"Conteúdo de Gravação","value":"Conversas de reunião simulando cenários reais de reuniões"},{"@type":"PropertyValue","name":"Equipamento","value":"Matriz de 16 microfones, array de 8 microfones, microfones de alta fidelidade e telemóveis"},{"@type":"PropertyValue","name":"Idioma","value":"Mandarim chinês"},{"@type":"PropertyValue","name":"Características de Anotação","value":"Anotação textual, identificação do locotor, anotação do género e identificação da posição"},{"@type":"PropertyValue","name":"Cenários de Aplicação","value":"Reconhecimento de voz; Reconhecimento biométrico da voz"},{"@type":"PropertyValue","name":"Taxa de Precisão","value":"Taxa de precisão das frases não é inferior a 97%"}]
{"id":1203,"datatype":"1","titleimg":"https://pt.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"223","type2str":null,"dataname":"672 Horas - Dados de Voz de Conferências com Várias Pessoas Recolhidos em Multi-canais","datazy":[{"title":"Formato","desc":"Formato","content":"1) Matriz de 16 microfones de campo longínquo: 48kHz, 16 bits, wav, 16 canais;"},{"title":"2) Matriz de 8 microfones de campo longínquo","desc":"2) Matriz de 8 microfones de campo longínquo","content":"48kHz, 16 bits, wav, 8 canais;"},{"title":"3) Microfone de campo longínquo de alta fidelidade","desc":"3) Microfone de campo longínquo de alta fidelidade","content":"48kHz, 16 bits, wav, monoaural;"},{"title":"4) Telemóvel de campo próximo","desc":"4) Telemóvel de campo próximo","content":"16kHz, 16 bits, wav, monoaural;"},{"title":"Ambiente de Gravação","desc":"Ambiente de Gravação","content":"Quatro salas de reuniões com diferentes tamanhos, sendo que cada tamanho de área inclui três salas distintas"},{"title":"Conteúdo de Gravação","desc":"Conteúdo de Gravação","content":"Conversas de reunião simulando cenários reais de reuniões"},{"title":"Equipamento","desc":"Equipamento","content":"Matriz de 16 microfones, array de 8 microfones, microfones de alta fidelidade e telemóveis"},{"title":"Idioma","desc":"Idioma","content":"Mandarim chinês"},{"title":"Características de Anotação","desc":"Características de Anotação","content":"Anotação textual, identificação do locotor, anotação do género e identificação da posição"},{"title":"Cenários de Aplicação","desc":"Cenários de Aplicação","content":"Reconhecimento de voz; Reconhecimento biométrico da voz"},{"title":"Taxa de Precisão","desc":"Taxa de Precisão","content":"Taxa de precisão das frases não é inferior a 97%"}],"datatag":"","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[],"officialSummary":"672 Horas - Dados de Voz de Conferências com Várias Pessoas Recolhidos em Multi-canais, cobrindo cenários de reuniões envolvendo 3 a 6 participantes. Gravado em diversos ambientes de salas de conferência, este conjunto de dados reflete situações interativas autênticas encontradas em reuniões do mundo real. Anotado com vários atributos, incluindo conteúdo textual, identidade e género do locutor e posição, apresentando alta precisão (precisão de frases não inferior a 97%) e forte usabilidade, este conjunto de dados oferece recursos abrangentes para pesquisas e aplicações relacionadas com reconhecimento de voz, validado por várias empresas de IA: ajuda os modelos a desempenharem-se excelentemente face à diversidade do mundo real. Cumprimos rigorosamente as leis de proteção de dados e as normas de privacidade, garantindo a proteção da privacidade dos utilizadores e os seus direitos legais durante todo o processo de recolha, armazenamento e utilização dos dados. Todos os dados estão em conformidade com o RGPD, CCPA e PIPL.","dataexampl":null,"datakeyword":["Reunião"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,PT,DE\"},{\"code\":\"3\",\"language\":\"EN\"}]","productNameEn":"672 Hours of Multi-party Conference Multi-channel Recorded Speech Data","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
672 Horas - Dados de Voz de Conferências com Várias Pessoas Recolhidos em Multi-canais
Reunião
672 Horas - Dados de Voz de Conferências com Várias Pessoas Recolhidos em Multi-canais, cobrindo cenários de reuniões envolvendo 3 a 6 participantes. Gravado em diversos ambientes de salas de conferência, este conjunto de dados reflete situações interativas autênticas encontradas em reuniões do mundo real. Anotado com vários atributos, incluindo conteúdo textual, identidade e género do locutor e posição, apresentando alta precisão (precisão de frases não inferior a 97%) e forte usabilidade, este conjunto de dados oferece recursos abrangentes para pesquisas e aplicações relacionadas com reconhecimento de voz, validado por várias empresas de IA: ajuda os modelos a desempenharem-se excelentemente face à diversidade do mundo real. Cumprimos rigorosamente as leis de proteção de dados e as normas de privacidade, garantindo a proteção da privacidade dos utilizadores e os seus direitos legais durante todo o processo de recolha, armazenamento e utilização dos dados. Todos os dados estão em conformidade com o RGPD, CCPA e PIPL.
Este é um conjunto de dado pagos destinando a uso comercial, fins de investigação e otras finalidades. Conjunto de dados licenciado e pronto ajuda a acelerar projetos d IA.
Características
Formato
1) Matriz de 16 microfones de campo longínquo: 48kHz, 16 bits, wav, 16 canais;
2) Matriz de 8 microfones de campo longínquo
48kHz, 16 bits, wav, 8 canais;
3) Microfone de campo longínquo de alta fidelidade
48kHz, 16 bits, wav, monoaural;
4) Telemóvel de campo próximo
16kHz, 16 bits, wav, monoaural;
Ambiente de Gravação
Quatro salas de reuniões com diferentes tamanhos, sendo que cada tamanho de área inclui três salas distintas
Conteúdo de Gravação
Conversas de reunião simulando cenários reais de reuniões
Equipamento
Matriz de 16 microfones, array de 8 microfones, microfones de alta fidelidade e telemóveis
Idioma
Mandarim chinês
Características de Anotação
Anotação textual, identificação do locotor, anotação do género e identificação da posição
Cenários de Aplicação
Reconhecimento de voz; Reconhecimento biométrico da voz