[{"@type":"PropertyValue","name":"Formato","value":"8kHz, 8 bit, u-law/a-law PCM, mono"},{"@type":"PropertyValue","name":"Categorias de Conteúdo","value":"Os locutores escolhem tópicos familiares de uma lista e gravam diálogos naturais e fluidos"},{"@type":"PropertyValue","name":"Condições de Gravação","value":"Ambiente interno relativamente silencioso, sem eco"},{"@type":"PropertyValue","name":"Equipamento de Gravação","value":"Sistema de gravação telefônica"},{"@type":"PropertyValue","name":"Informações dos Gravadores","value":"No total, 270 pessoas, entre elas 150 homens e 120 mulheres"},{"@type":"PropertyValue","name":"País","value":"Paquistão"},{"@type":"PropertyValue","name":"Código de Região Linguística","value":"ur-PK"},{"@type":"PropertyValue","name":"Língua","value":"Urdu"},{"@type":"PropertyValue","name":"Características de Anotação","value":"Anotação do conteúdo textual, marcação de tempo das frases, identificação do locutor, gênero"},{"@type":"PropertyValue","name":"Taxa de Precisão","value":"Precisão de palavras: 95%"}]
{"id":1242,"datatype":"1","titleimg":"https://pt.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"166","type2str":null,"dataname":"196 horas de dados de voz em urdu – Diálogos (telefone)","datazy":[{"title":"Formato","desc":"Formato","content":"8kHz, 8 bit, u-law/a-law PCM, mono"},{"title":"Categorias de Conteúdo","desc":"Categorias de Conteúdo","content":"Os locutores escolhem tópicos familiares de uma lista e gravam diálogos naturais e fluidos"},{"title":"Condições de Gravação","desc":"Condições de Gravação","content":"Ambiente interno relativamente silencioso, sem eco"},{"title":"Equipamento de Gravação","desc":"Equipamento de Gravação","content":"Sistema de gravação telefônica"},{"title":"Informações dos Gravadores","desc":"Informações dos Gravadores","content":"No total, 270 pessoas, entre elas 150 homens e 120 mulheres"},{"title":"País","desc":"País","content":"Paquistão"},{"title":"Código de Região Linguística","desc":"Código de Região Linguística","content":"ur-PK"},{"title":"Língua","desc":"Língua","content":"Urdu"},{"title":"Características de Anotação","desc":"Características de Anotação","content":"Anotação do conteúdo textual, marcação de tempo das frases, identificação do locutor, gênero"},{"title":"Taxa de Precisão","desc":"Taxa de Precisão","content":"Precisão de palavras: 95%"}],"datatag":"Conversational Speech,Telephone,Urdu","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"/data/apps/damp/temp/ziptemp/APY230716001_demo1725530400187/APY230716001_demo/cov_001_00202_8k-7.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230716001_demo1725530400187/APY230716001_demo/cov_001_00202_8k-7.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=9OFuuaPAmeNan5off2%2F6oj%2BT6%2Bw%3D","intro":"کہ یہ کرو، اور وہ کرو، اور احتیاطی تدابیر وغیرہ بھی نا۔","size":0,"progress":100,"type":"mp3"},{"name":"/data/apps/damp/temp/ziptemp/APY230716001_demo1725530400187/APY230716001_demo/cov_001_00202_8k-9.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230716001_demo1725530400187/APY230716001_demo/cov_001_00202_8k-9.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=SRkh%2BMPsFh9MiaZbCmASEAV82LA%3D","intro":"اچھا اور جب دیکھیں، ہمارا پہلے ہوتا تھا، یہ نزلہ وغیرہ اور ہم کہتے تھے، چلو ہم،","size":0,"progress":100,"type":"mp3"},{"name":"/data/apps/damp/temp/ziptemp/APY230716001_demo1725530400187/APY230716001_demo/cov_001_00202_8k-6.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230716001_demo1725530400187/APY230716001_demo/cov_001_00202_8k-6.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=ve42CpgQON0aVljdvvM9DEJh7%2B4%3D","intro":"ہمم، اور دیکھیں ذرا، covid کا اور کورونا کا آج کل جو ہے، وہ اخبار اور ٹی وی میں بھی اتنا بتا رہے ہیں،","size":0,"progress":100,"type":"mp3"},{"name":"/data/apps/damp/temp/ziptemp/APY230716001_demo1725530400187/APY230716001_demo/cov_001_00202_8k-1.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230716001_demo1725530400187/APY230716001_demo/cov_001_00202_8k-1.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=4Rr5svFZ%2B0AjTuqo2uuw%2BcbWjmY%3D","intro":"ہاں تمہیں پتہ ہے نا، پچھلے دو سالوں سے سردی زیادہ ہوتی ہے، تو سردی کے موسم میں کورونا کے پھیلنے کا خطرہ بھی زیادہ ہوتا ہے۔","size":0,"progress":100,"type":"mp3"},{"name":"/data/apps/damp/temp/ziptemp/APY230716001_demo1725530400187/APY230716001_demo/cov_001_00202_8k-5.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230716001_demo1725530400187/APY230716001_demo/cov_001_00202_8k-5.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=15Ai6ApMMr3pFZ%2FpXohi3SeWm6U%3D","intro":"سال میں دو، تین دفعہ تو سکول یہ کہہ کر بند کر دیے جاتے ہیں کہ کورونا کے پھیلنے کا خطرہ ہے۔","size":0,"progress":100,"type":"mp3"}],"officialSummary":"Dados de voz em urdu – diálogos (telefone), gravados com base na simulação de cerca de vinte temas comuns. Este conjunto de dados inclui anotações de conteúdo textual, marcação de tempo das frases, identidade dos locutors, gênero e outros atributos. Foi gravado por 270 locutors nativos de diferentes regiões e contextos culturais, garantindo alta precisão. Trata-se de um recurso valioso para pesquisas e aplicações relacionadas ao reconhecimento de voz, já validado por múltiplas empresas de IA: ajuda os modelos a apresentarem bom desempenho diante da diversidade do mundo real. Seguimos rigorosamente as leis de proteção de dados e regulamentos de privacidade, garantindo que a coleta, armazenamento e uso dos dados respeitem a privacidade e os direitos legais dos usuários. Todos os dados estão em conformidade com o GDPR, CCPA e PIPL.","dataexampl":null,"datakeyword":["Áudio"," Dados"," Conjunto de dados"," Conversacional"," Dados de reconhecimento automático de fala"," Urdu"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Language,Data Type","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,JP,PT,DE\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"196 Hours - Urdu Conversational Speech Data by Telephone","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
196 horas de dados de voz em urdu – Diálogos (telefone)
Áudio
Dados
Conjunto de dados
Conversacional
Dados de reconhecimento automático de fala
Urdu
Dados de voz em urdu – diálogos (telefone), gravados com base na simulação de cerca de vinte temas comuns. Este conjunto de dados inclui anotações de conteúdo textual, marcação de tempo das frases, identidade dos locutors, gênero e outros atributos. Foi gravado por 270 locutors nativos de diferentes regiões e contextos culturais, garantindo alta precisão. Trata-se de um recurso valioso para pesquisas e aplicações relacionadas ao reconhecimento de voz, já validado por múltiplas empresas de IA: ajuda os modelos a apresentarem bom desempenho diante da diversidade do mundo real. Seguimos rigorosamente as leis de proteção de dados e regulamentos de privacidade, garantindo que a coleta, armazenamento e uso dos dados respeitem a privacidade e os direitos legais dos usuários. Todos os dados estão em conformidade com o GDPR, CCPA e PIPL.
Este é um conjunto de dado pagos destinando a uso comercial, fins de investigação e otras finalidades. Conjunto de dados licenciado e pronto ajuda a acelerar projetos d IA.
Características
Formato
8kHz, 8 bit, u-law/a-law PCM, mono
Categorias de Conteúdo
Os locutores escolhem tópicos familiares de uma lista e gravam diálogos naturais e fluidos
Condições de Gravação
Ambiente interno relativamente silencioso, sem eco
Equipamento de Gravação
Sistema de gravação telefônica
Informações dos Gravadores
No total, 270 pessoas, entre elas 150 homens e 120 mulheres
País
Paquistão
Código de Região Linguística
ur-PK
Língua
Urdu
Características de Anotação
Anotação do conteúdo textual, marcação de tempo das frases, identificação do locutor, gênero
Taxa de Precisão
Precisão de palavras: 95%
Amostra
Audio
کہ یہ کرو، اور وہ کرو، اور احتیاطی تدابیر وغیرہ بھی نا۔
Audio
اچھا اور جب دیکھیں، ہمارا پہلے ہوتا تھا، یہ نزلہ وغیرہ اور ہم کہتے تھے، چلو ہم،
Audio
ہمم، اور دیکھیں ذرا، covid کا اور کورونا کا آج کل جو ہے، وہ اخبار اور ٹی وی میں بھی اتنا بتا رہے ہیں،
Audio
ہاں تمہیں پتہ ہے نا، پچھلے دو سالوں سے سردی زیادہ ہوتی ہے، تو سردی کے موسم میں کورونا کے پھیلنے کا خطرہ بھی زیادہ ہوتا ہے۔
Audio
سال میں دو، تین دفعہ تو سکول یہ کہہ کر بند کر دیے جاتے ہیں کہ کورونا کے پھیلنے کا خطرہ ہے۔