[{"@type":"PropertyValue","name":"Formato","value":"8kHz, 8 bit, u-law/a-law PCM, mono"},{"@type":"PropertyValue","name":"Categorias de Conteúdo","value":"Os locutores escolhem tópicos familiares de uma lista e gravam diálogos naturais e fluidos"},{"@type":"PropertyValue","name":"Condições de Gravação","value":"Ambiente interno relativamente silencioso, sem eco"},{"@type":"PropertyValue","name":"Equipamento de Gravação","value":"Sistema de gravação telefônica"},{"@type":"PropertyValue","name":"Informações dos Gravadores","value":"Total de 118 pessoas, sendo 64 homens e 54 mulheres"},{"@type":"PropertyValue","name":"País","value":"Brasil"},{"@type":"PropertyValue","name":"Código de Região Linguística","value":"pt-BR"},{"@type":"PropertyValue","name":"Língua","value":"Português"},{"@type":"PropertyValue","name":"Características de Anotação","value":"Anotação de conteúdo textual, marca de tempo de frase, identificação do locutor, género, anotação de ruído"},{"@type":"PropertyValue","name":"Taxa de Precisão","value":"Precisão de palavras: 98%"}]
{"id":1313,"datatype":"1","titleimg":"https://pt.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"166","type2str":null,"dataname":"104 horas de Dados de voz em português do Brasil – conversas por telefone","datazy":[{"title":"Formato","desc":"Formato","content":"8kHz, 8 bit, u-law/a-law PCM, mono"},{"title":"Categorias de Conteúdo","desc":"Categorias de Conteúdo","content":"Os locutores escolhem tópicos familiares de uma lista e gravam diálogos naturais e fluidos"},{"title":"Condições de Gravação","desc":"Condições de Gravação","content":"Ambiente interno relativamente silencioso, sem eco"},{"title":"Equipamento de Gravação","desc":"Equipamento de Gravação","content":"Sistema de gravação telefônica"},{"title":"Informações dos Gravadores","desc":"Informações dos Gravadores","content":"Total de 118 pessoas, sendo 64 homens e 54 mulheres"},{"title":"País","desc":"País","content":"Brasil"},{"title":"Código de Região Linguística","desc":"Código de Região Linguística","content":"pt-BR"},{"title":"Língua","desc":"Língua","content":"Português"},{"title":"Características de Anotação","desc":"Características de Anotação","content":"Anotação de conteúdo textual, marca de tempo de frase, identificação do locutor, género, anotação de ruído"},{"title":"Taxa de Precisão","desc":"Taxa de Precisão","content":"Precisão de palavras: 98%"}],"datatag":"Portuguese,Brazil,Conversational,Telephony","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"/data/apps/damp/temp/ziptemp/APY230729001_demo1729159203019/APY230729001_demo/0001_001_telephone-6.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230729001_demo1729159203019/APY230729001_demo/0001_001_telephone-6.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=n%2F03xMXXQELsJ6ZCImenqOFTawE%3D","intro":"Eu lembro que tinha algumas pessoas, e também lembro que eu estava montado numa tartaruga gigante.","size":0,"progress":100,"type":"mp3"},{"name":"/data/apps/damp/temp/ziptemp/APY230729001_demo1729159203019/APY230729001_demo/0001_001_telephone-5.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230729001_demo1729159203019/APY230729001_demo/0001_001_telephone-5.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=hy8HI3kgGisfsE56zNRgrUniQUs%3D","intro":"E as carteiras eram ilhas, eu não lembro quem estava lá.","size":0,"progress":100,"type":"mp3"},{"name":"/data/apps/damp/temp/ziptemp/APY230729001_demo1729159203019/APY230729001_demo/0001_001_telephone-2.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230729001_demo1729159203019/APY230729001_demo/0001_001_telephone-2.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=m%2BvRCMrXe90HjgdazZ6BjTSGNhk%3D","intro":"eu lembro de ter sonhado, que eu estava na minha, é, no meu ensino fundamental, na sala do meu ensino fundamental.","size":0,"progress":100,"type":"mp3"},{"name":"/data/apps/damp/temp/ziptemp/APY230729001_demo1729159203019/APY230729001_demo/0001_001_telephone-1.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230729001_demo1729159203019/APY230729001_demo/0001_001_telephone-1.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=xt5mEzcOU%2BxWwm%2FYIuvf9n3Rktk%3D","intro":"eu acabo misturando muita fantasia, muitas loucuras. Então um exemplo é, quando eu era jovem,","size":0,"progress":100,"type":"mp3"},{"name":"/data/apps/damp/temp/ziptemp/APY230729001_demo1729159203019/APY230729001_demo/0001_001_telephone-4.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230729001_demo1729159203019/APY230729001_demo/0001_001_telephone-4.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=XPPLi6FYQK%2FlKTa8gQiWqfjm6X0%3D","intro":"e eu lembro que esta sala de aula virou um, um mar, tipo um oceano, na verdade.","size":0,"progress":100,"type":"mp3"}],"officialSummary":"Áudio em português do Brasil – chamadas telefónicas – geradas a partir de cerca de trinta tópicos comuns do dia a dia. Este conjunto de dados está acompanhado de transcrições, pontes de tempo ao nível da frase, informação sobre o orador, género, entre outros rótulos. Foi recolhido por 118 falantes nativos do português do Brasil de diferentes regiões e contextos culturais. O conjunto é altamente preciso, foi revisado por várias empresas de IA e é ideal para investigação e utilização em sistemas de reconhecimento de voz em ambientes de trabalho. Todos os dados foram tratados de acordo com as leis de proteção de dados (GDPR, CCPA e PIPL).","dataexampl":null,"datakeyword":["Fala conversacional"," Dados de ASR em português"," Conjunto de dados de ASR em português"," Português"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,JP,PT,DE\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"104 Hours - Brazilian Portuguese Conversational Speech Data by Telephone","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
104 horas de Dados de voz em português do Brasil – conversas por telefone
Fala conversacional
Dados de ASR em português
Conjunto de dados de ASR em português
Português
Áudio em português do Brasil – chamadas telefónicas – geradas a partir de cerca de trinta tópicos comuns do dia a dia. Este conjunto de dados está acompanhado de transcrições, pontes de tempo ao nível da frase, informação sobre o orador, género, entre outros rótulos. Foi recolhido por 118 falantes nativos do português do Brasil de diferentes regiões e contextos culturais. O conjunto é altamente preciso, foi revisado por várias empresas de IA e é ideal para investigação e utilização em sistemas de reconhecimento de voz em ambientes de trabalho. Todos os dados foram tratados de acordo com as leis de proteção de dados (GDPR, CCPA e PIPL).
Este é um conjunto de dado pagos destinando a uso comercial, fins de investigação e otras finalidades. Conjunto de dados licenciado e pronto ajuda a acelerar projetos d IA.
Características
Formato
8kHz, 8 bit, u-law/a-law PCM, mono
Categorias de Conteúdo
Os locutores escolhem tópicos familiares de uma lista e gravam diálogos naturais e fluidos
Condições de Gravação
Ambiente interno relativamente silencioso, sem eco
Equipamento de Gravação
Sistema de gravação telefônica
Informações dos Gravadores
Total de 118 pessoas, sendo 64 homens e 54 mulheres
País
Brasil
Código de Região Linguística
pt-BR
Língua
Português
Características de Anotação
Anotação de conteúdo textual, marca de tempo de frase, identificação do locutor, género, anotação de ruído
Taxa de Precisão
Precisão de palavras: 98%
Amostra
Audio
Eu lembro que tinha algumas pessoas, e também lembro que eu estava montado numa tartaruga gigante.
Audio
E as carteiras eram ilhas, eu não lembro quem estava lá.
Audio
eu lembro de ter sonhado, que eu estava na minha, é, no meu ensino fundamental, na sala do meu ensino fundamental.
Audio
eu acabo misturando muita fantasia, muitas loucuras. Então um exemplo é, quando eu era jovem,
Audio
e eu lembro que esta sala de aula virou um, um mar, tipo um oceano, na verdade.