[{"@type":"PropertyValue","name":"Formato","value":"16kHz, 16 bit, WAV, mono"},{"@type":"PropertyValue","name":"Idade de Crianças","value":"12 anos ou menos"},{"@type":"PropertyValue","name":"Categorias de Conteúdo","value":"Tipos como diálogos, mídias sociais, programas de variedades etc."},{"@type":"PropertyValue","name":"Ambiente de Gravação","value":"Baixo ruído"},{"@type":"PropertyValue","name":"País","value":"Brasil"},{"@type":"PropertyValue","name":"Código de Região Linguística","value":"pt-BR"},{"@type":"PropertyValue","name":"Língua","value":"Português"},{"@type":"PropertyValue","name":"Características de Anotação","value":"Anotação de conteúdo textual, marca de tempo de frase, identificação do locutor, género, anotação de ruído"},{"@type":"PropertyValue","name":"Taxa de Precisão","value":"Precisão de palavras: 98%"}]
{"id":1326,"datatype":"1","titleimg":"https://pt.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"166","type2str":null,"dataname":"97 horas de dados de voz infantil em português do Brasil – estilo coloquial","datazy":[{"title":"Formato","desc":"Formato","content":"16kHz, 16 bit, WAV, mono"},{"title":"Idade de Crianças","desc":"Idade de Crianças","content":"12 anos ou menos"},{"title":"Categorias de Conteúdo","desc":"Categorias de Conteúdo","content":"Tipos como diálogos, mídias sociais, programas de variedades etc."},{"title":"Ambiente de Gravação","desc":"Ambiente de Gravação","content":"Baixo ruído"},{"title":"País","desc":"País","content":"Brasil"},{"title":"Código de Região Linguística","desc":"Código de Região Linguística","content":"pt-BR"},{"title":"Língua","desc":"Língua","content":"Português"},{"title":"Características de Anotação","desc":"Características de Anotação","content":"Anotação de conteúdo textual, marca de tempo de frase, identificação do locutor, género, anotação de ruído"},{"title":"Taxa de Precisão","desc":"Taxa de Precisão","content":"Precisão de palavras: 98%"}],"datatag":"Brazil,Portuguese,Casual Conversation,Monologue,Asr","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"/data/apps/damp/temp/ziptemp/APY230831001_demo1711101638546/APY230831001_demo/000002_10.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230831001_demo1711101638546/APY230831001_demo/000002_10.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=RjLvl0fcboVoJZGBcsx5BHs5H%2B8%3D","intro":"Então pessoal, vamos começar! Olha só, aqui é a porta da entrada. [N]","size":0,"progress":100,"type":"mp3"},{"name":"/data/apps/damp/temp/ziptemp/APY230831001_demo1711101638546/APY230831001_demo/000002_6.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230831001_demo1711101638546/APY230831001_demo/000002_6.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=2%2Fi9i9%2F9dvYZPxu43T%2BUwGjZVzw%3D","intro":"E eu vou mostrar tudinho pra vocês. Então vamos nessa! [N]","size":0,"progress":100,"type":"mp3"},{"name":"/data/apps/damp/temp/ziptemp/APY230831001_demo1711101638546/APY230831001_demo/000002_3.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230831001_demo1711101638546/APY230831001_demo/000002_3.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=FhiRuI%2FOC%2FEW81%2BNMt9y0ZhZv1k%3D","intro":"Pessoal, como vocês sabem eu me mudei de novo aqui no Canadá. [N]","size":0,"progress":100,"type":"mp3"},{"name":"/data/apps/damp/temp/ziptemp/APY230831001_demo1711101638546/APY230831001_demo/000002_11.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230831001_demo1711101638546/APY230831001_demo/000002_11.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=Zy5umsCaPU3TuAnlAGvZakc5d44%3D","intro":"E a primeira coisa que a gente vê quando a gente entra é o estúdio! [N]","size":0,"progress":100,"type":"mp3"},{"name":"/data/apps/damp/temp/ziptemp/APY230831001_demo1711101638546/APY230831001_demo/000002_7.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230831001_demo1711101638546/APY230831001_demo/000002_7.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=OesvKKZ86RA2Os%2Buex5l61Unb58%3D","intro":"Mas antes eu vou dar um tempinho para vocês darem o seu like. [N]","size":0,"progress":100,"type":"mp3"}],"officialSummary":"Dados de voz infantil em português do Brasil – estilo coloquialO conteúdo abrange áreas gerais como mídias sociais, diálogos, transmissões ao vivo, palestras e programas de variedades, refletindo situações reais de interação. Este conjunto de dados é anotado com conteúdo textual, identidade dos locutors, gênero, sotaque e outros atributos. As gravações foram feitas por várias crianças brasileiras de até 12 anos, provenientes de diferentes regiões e contextos culturais. Os dados apresentam alta precisão e são fáceis de utilizar, oferecendo recursos valiosos para pesquisas e aplicações em reconhecimento de fala. Foram validados por múltiplas empresas de IA, auxiliando os modelos a se destacarem diante da diversidade do mundo real. Seguimos rigorosamente as leis de proteção de dados e privacidade, garantindo que a coleta, o armazenamento e o uso das informações mantenham os direitos legais e a privacidade dos usuários. Todos os dados estão em conformidade com o GDPR, CCPA e PIPL.","dataexampl":null,"datakeyword":["Português brasileiro"," Fala espontânea"," Anotação de texto"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,JP,PT,DE\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"97 Hours - Brazilian Portuguese Child's Spontaneous Speech Data","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
97 horas de dados de voz infantil em português do Brasil – estilo coloquial
Português brasileiro
Fala espontânea
Anotação de texto
Dados de voz infantil em português do Brasil – estilo coloquialO conteúdo abrange áreas gerais como mídias sociais, diálogos, transmissões ao vivo, palestras e programas de variedades, refletindo situações reais de interação. Este conjunto de dados é anotado com conteúdo textual, identidade dos locutors, gênero, sotaque e outros atributos. As gravações foram feitas por várias crianças brasileiras de até 12 anos, provenientes de diferentes regiões e contextos culturais. Os dados apresentam alta precisão e são fáceis de utilizar, oferecendo recursos valiosos para pesquisas e aplicações em reconhecimento de fala. Foram validados por múltiplas empresas de IA, auxiliando os modelos a se destacarem diante da diversidade do mundo real. Seguimos rigorosamente as leis de proteção de dados e privacidade, garantindo que a coleta, o armazenamento e o uso das informações mantenham os direitos legais e a privacidade dos usuários. Todos os dados estão em conformidade com o GDPR, CCPA e PIPL.
Este é um conjunto de dado pagos destinando a uso comercial, fins de investigação e otras finalidades. Conjunto de dados licenciado e pronto ajuda a acelerar projetos d IA.
Características
Formato
16kHz, 16 bit, WAV, mono
Idade de Crianças
12 anos ou menos
Categorias de Conteúdo
Tipos como diálogos, mídias sociais, programas de variedades etc.
Ambiente de Gravação
Baixo ruído
País
Brasil
Código de Região Linguística
pt-BR
Língua
Português
Características de Anotação
Anotação de conteúdo textual, marca de tempo de frase, identificação do locutor, género, anotação de ruído
Taxa de Precisão
Precisão de palavras: 98%
Amostra
Audio
Então pessoal, vamos começar! Olha só, aqui é a porta da entrada. [N]
Audio
E eu vou mostrar tudinho pra vocês. Então vamos nessa! [N]
Audio
Pessoal, como vocês sabem eu me mudei de novo aqui no Canadá. [N]
Audio
E a primeira coisa que a gente vê quando a gente entra é o estúdio! [N]
Audio
Mas antes eu vou dar um tempinho para vocês darem o seu like. [N]