[{"@type":"PropertyValue","name":"Formato","value":"16kHz, 16 bit, WAV, mono"},{"@type":"PropertyValue","name":"Categorias de Conteúdo","value":"Abrange diversos termos técnicos do setor financeiro, divididos principalmente em conteúdo financeiro macroeconômico (economia geral, tendências de mercado, políticas financeiras, variações cambiais etc.) e conteúdo financeiro microeconômico (empresas individuais, ações, títulos, carteiras de investimento etc.)"},{"@type":"PropertyValue","name":"Ambiente de Gravação","value":"Ambiente interno relativamente silencioso"},{"@type":"PropertyValue","name":"País","value":"Brasil"},{"@type":"PropertyValue","name":"Código de Região Linguística","value":"pt-BR"},{"@type":"PropertyValue","name":"Língua","value":"Português"},{"@type":"PropertyValue","name":"Características de Anotação","value":"Anotação do conteúdo textual, tempo de início e fim das sentenças válidas, identificação do locutor, gênero, anotações de ruído, anotação de informações sensíveis, Anotação de entidades (pessoa, local, data/hora, produto financeiro, sistema/software, organização), anotação de uso de maiúsculas e minúsculas"},{"@type":"PropertyValue","name":"Taxa de Precisão","value":"Precisão de palavras: 98%"}]
{"id":1543,"datatype":"1","titleimg":"https://pt.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"166","type2str":null,"dataname":"Conjunto de 200 horas de dados de voz em português brasileiro para o setor financeiro, incluindo anotações de entidades e expressões em linguagem coloquial","datazy":[{"title":"Formato","desc":"Formato","content":"16kHz, 16 bit, WAV, mono"},{"title":"Categorias de Conteúdo","desc":"Categorias de Conteúdo","content":"Abrange diversos termos técnicos do setor financeiro, divididos principalmente em conteúdo financeiro macroeconômico (economia geral, tendências de mercado, políticas financeiras, variações cambiais etc.) e conteúdo financeiro microeconômico (empresas individuais, ações, títulos, carteiras de investimento etc.)"},{"title":"Ambiente de Gravação","desc":"Ambiente de Gravação","content":"Ambiente interno relativamente silencioso"},{"title":"País","desc":"País","content":"Brasil"},{"title":"Código de Região Linguística","desc":"Código de Região Linguística","content":"pt-BR"},{"title":"Língua","desc":"Língua","content":"Português"},{"title":"Características de Anotação","desc":"Características de Anotação","content":"Anotação do conteúdo textual, tempo de início e fim das sentenças válidas, identificação do locutor, gênero, anotações de ruído, anotação de informações sensíveis, Anotação de entidades (pessoa, local, data/hora, produto financeiro, sistema/software, organização), anotação de uso de maiúsculas e minúsculas"},{"title":"Taxa de Precisão","desc":"Taxa de Precisão","content":"Precisão de palavras: 98%"}],"datatag":"Brazilian Portuguese,Spontaneous Dialogue,Financial","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"/data/apps/damp/temp/ziptemp/APY240709008_demo1733911200342/APY240709008_demo/category/107805_11.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY240709008_demo1733911200342/APY240709008_demo/category/107805_11.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=1NWoEbKNdmVJuNfsM68NO79sT0s%3D","intro":"Você vai ter um leilão para térmica.","size":0,"progress":100,"type":"mp3"},{"name":"/data/apps/damp/temp/ziptemp/APY240709008_demo1733911200342/APY240709008_demo/category/107805_9.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY240709008_demo1733911200342/APY240709008_demo/category/107805_9.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=CDVi7r7CcbHfykcLWFYGNVT9t%2BU%3D","intro":"Então, é, to- vou te te explicar. Então, tenho marcado o leilão para mil megawatts no norte, mil megawatts no nordeste.","size":0,"progress":100,"type":"mp3"},{"name":"/data/apps/damp/temp/ziptemp/APY240709008_demo1733911200342/APY240709008_demo/category/107805_2.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY240709008_demo1733911200342/APY240709008_demo/category/107805_2.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=UaOMnfWQn4WVwKMUm254BUgIFYo%3D","intro":"E a termoelétrica, ela faz um papel de âncora. [N]","size":0,"progress":100,"type":"mp3"},{"name":"/data/apps/damp/temp/ziptemp/APY240709008_demo1733911200342/APY240709008_demo/category/107805_6.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY240709008_demo1733911200342/APY240709008_demo/category/107805_6.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=JodW2jVrMO2332aokE8W7B%2BeknA%3D","intro":"Vai ser- vai ser exclusivamente so- pelo capital privado.","size":0,"progress":100,"type":"mp3"},{"name":"/data/apps/damp/temp/ziptemp/APY240709008_demo1733911200342/APY240709008_demo/category/107805_4.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY240709008_demo1733911200342/APY240709008_demo/category/107805_4.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=jYKIPukPx%2BgQQdWDKBxEJb%2F2fys%3D","intro":"Você faz um shopping, se foi a loja âncora, você não vializa- não viabiliza as lojas menores.","size":0,"progress":100,"type":"mp3"}],"officialSummary":"Este conjunto de dados contém gravações de voz em português do Brasil no domínio financeiro, com linguagem coloquial e anotações de entidades. Abrange termos financeiros macro e microeconômicos, refletindo situações reais de interação. Cada gravação inclui transcrição, gênero do locutor e entidades comuns. Validado por empresas de IA, este recurso auxilia na melhoria da adaptabilidade de modelos a cenários reais. A coleta, armazenamento e uso dos dados seguem rigorosamente as normas GDPR, CCPA e PIPL.","dataexampl":null,"datakeyword":["Português Brasileiro"," Entidade"," Diálogo Espontâneo"," Financeiro"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,JP,PT,DE\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"200 Hours - Portuguese(Brazil) Financial Entities Real-world Casual Conversation and Monologue speech dataset","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
Conjunto de 200 horas de dados de voz em português brasileiro para o setor financeiro, incluindo anotações de entidades e expressões em linguagem coloquial
Português Brasileiro
Entidade
Diálogo Espontâneo
Financeiro
Este conjunto de dados contém gravações de voz em português do Brasil no domínio financeiro, com linguagem coloquial e anotações de entidades. Abrange termos financeiros macro e microeconômicos, refletindo situações reais de interação. Cada gravação inclui transcrição, gênero do locutor e entidades comuns. Validado por empresas de IA, este recurso auxilia na melhoria da adaptabilidade de modelos a cenários reais. A coleta, armazenamento e uso dos dados seguem rigorosamente as normas GDPR, CCPA e PIPL.
Este é um conjunto de dado pagos destinando a uso comercial, fins de investigação e otras finalidades. Conjunto de dados licenciado e pronto ajuda a acelerar projetos d IA.
Características
Formato
16kHz, 16 bit, WAV, mono
Categorias de Conteúdo
Abrange diversos termos técnicos do setor financeiro, divididos principalmente em conteúdo financeiro macroeconômico (economia geral, tendências de mercado, políticas financeiras, variações cambiais etc.) e conteúdo financeiro microeconômico (empresas individuais, ações, títulos, carteiras de investimento etc.)
Ambiente de Gravação
Ambiente interno relativamente silencioso
País
Brasil
Código de Região Linguística
pt-BR
Língua
Português
Características de Anotação
Anotação do conteúdo textual, tempo de início e fim das sentenças válidas, identificação do locutor, gênero, anotações de ruído, anotação de informações sensíveis, Anotação de entidades (pessoa, local, data/hora, produto financeiro, sistema/software, organização), anotação de uso de maiúsculas e minúsculas
Taxa de Precisão
Precisão de palavras: 98%
Amostra
Audio
Você vai ter um leilão para térmica.
Audio
Então, é, to- vou te te explicar. Então, tenho marcado o leilão para mil megawatts no norte, mil megawatts no nordeste.
Audio
E a termoelétrica, ela faz um papel de âncora. [N]
Audio
Vai ser- vai ser exclusivamente so- pelo capital privado.
Audio
Você faz um shopping, se foi a loja âncora, você não vializa- não viabiliza as lojas menores.