[{"@type":"PropertyValue","name":"Formato","value":"16kHz, 16 bit, WAV sem compressão, mono"},{"@type":"PropertyValue","name":"Ambiente de Gravação","value":"Ambiente interno relativamente silencioso, sem eco"},{"@type":"PropertyValue","name":"Conteúdo de Gravação","value":"Lista de tópicos fornecida; o locutor escolhe vários com os quais tem familiaridade para garantir naturalidade, e grava um diálogo com base nesses temas"},{"@type":"PropertyValue","name":"Pessoas Envolvidas","value":"Total de 480 pessoas da região de Taiwan, com distribuição de gênero equilibrada"},{"@type":"PropertyValue","name":"Características de Anotação","value":"Extração de sentenças válidas para anotação; os resultados incluem os pontos de início e fim de cada sentença válida, identificação do falante, conteúdo textual; anotação de ruído"},{"@type":"PropertyValue","name":"País","value":"China"},{"@type":"PropertyValue","name":"Língua","value":"Mandarim"},{"@type":"PropertyValue","name":"Cenário de Aplicação","value":"Reconhecimento de voz; reconhecimento de biometria vocal"},{"@type":"PropertyValue","name":"Taxa de Precisão","value":"Precisão de palavras: 95%"}]
{"id":1631,"datatype":"1","titleimg":"https://pt.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"166","type2str":null,"dataname":"534 horas de diálogos naturais em mandarim com sotaque de Taiwan coletados por celular","datazy":[{"title":"Formato","desc":"Formato","content":"16kHz, 16 bit, WAV sem compressão, mono"},{"title":"Ambiente de Gravação","desc":"Ambiente de Gravação","content":"Ambiente interno relativamente silencioso, sem eco"},{"title":"Conteúdo de Gravação","desc":"Conteúdo de Gravação","content":"Lista de tópicos fornecida; o locutor escolhe vários com os quais tem familiaridade para garantir naturalidade, e grava um diálogo com base nesses temas"},{"title":"Pessoas Envolvidas","desc":"Pessoas Envolvidas","content":"Total de 480 pessoas da região de Taiwan, com distribuição de gênero equilibrada"},{"title":"Características de Anotação","desc":"Características de Anotação","content":"Extração de sentenças válidas para anotação; os resultados incluem os pontos de início e fim de cada sentença válida, identificação do falante, conteúdo textual; anotação de ruído"},{"title":"País","desc":"País","content":"China"},{"title":"Língua","desc":"Língua","content":"Mandarim"},{"title":"Cenário de Aplicação","desc":"Cenário de Aplicação","content":"Reconhecimento de voz; reconhecimento de biometria vocal"},{"title":"Taxa de Precisão","desc":"Taxa de Precisão","content":"Precisão de palavras: 95%"}],"datatag":"Accent Mandarin,Taiwanese,Spontaneous Dialogue","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[],"officialSummary":"534 horas de diálogos naturais em mandarim com sotaque taiwanês, coletados via celular e baseados em 30+ temas comuns. Incluem anotações textuais, marcas de tempo por frase, identidade e gênero dos locutors. Gravados por pessoas de Taiwan, com alta precisão. Validado por empresas de IA. Coleta, uso e armazenamento seguem GDPR, CCPA e PIPL.","dataexampl":null,"datakeyword":["Mandarim com Sotaque"," Taiwanês"," Diálogo Espontâneo"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,PT,DE\"},{\"code\":\"3\",\"language\":\"EN\"}]","productNameEn":"534 Hours - Taiwanese Accent Mandarin Spontaneous Dialogue Smartphone speech dataset","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
534 horas de diálogos naturais em mandarim com sotaque de Taiwan coletados por celular
Mandarim com Sotaque
Taiwanês
Diálogo Espontâneo
534 horas de diálogos naturais em mandarim com sotaque taiwanês, coletados via celular e baseados em 30+ temas comuns. Incluem anotações textuais, marcas de tempo por frase, identidade e gênero dos locutors. Gravados por pessoas de Taiwan, com alta precisão. Validado por empresas de IA. Coleta, uso e armazenamento seguem GDPR, CCPA e PIPL.
Este é um conjunto de dado pagos destinando a uso comercial, fins de investigação e otras finalidades. Conjunto de dados licenciado e pronto ajuda a acelerar projetos d IA.
Características
Formato
16kHz, 16 bit, WAV sem compressão, mono
Ambiente de Gravação
Ambiente interno relativamente silencioso, sem eco
Conteúdo de Gravação
Lista de tópicos fornecida; o locutor escolhe vários com os quais tem familiaridade para garantir naturalidade, e grava um diálogo com base nesses temas
Pessoas Envolvidas
Total de 480 pessoas da região de Taiwan, com distribuição de gênero equilibrada
Características de Anotação
Extração de sentenças válidas para anotação; os resultados incluem os pontos de início e fim de cada sentença válida, identificação do falante, conteúdo textual; anotação de ruído
País
China
Língua
Mandarim
Cenário de Aplicação
Reconhecimento de voz; reconhecimento de biometria vocal