[{"@type":"PropertyValue","name":"Formato","value":"16kHz, 16 bit, WAV, mono"},{"@type":"PropertyValue","name":"Categorias de Conteúdo","value":"Tipos como diálogos, mídias sociais, programas de variedades etc."},{"@type":"PropertyValue","name":"Ambiente de Gravação","value":"Baixo ruído"},{"@type":"PropertyValue","name":"País","value":"Tailândia"},{"@type":"PropertyValue","name":"Código de Região Linguística","value":"th-TH"},{"@type":"PropertyValue","name":"Língua","value":"Tailandês"},{"@type":"PropertyValue","name":"Características de Anotação","value":"Anotação de conteúdo textual, marca de tempo de frase, identificação do locutor, género, anotação de ruído"},{"@type":"PropertyValue","name":"Taxa de Precisão","value":"Precisão de palavras: 98% (etiquetas, identificação de gênero, identificação do falante, sotaque e tópico não são incluídos na estatística de precisão)"}]
{"id":1687,"datatype":"1","titleimg":"https://pt.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"166","type2str":null,"dataname":"900 horas de dados de voz em tailandês – linguagem coloquial","datazy":[{"title":"Formato","desc":"Formato","content":"16kHz, 16 bit, WAV, mono"},{"title":"Categorias de Conteúdo","desc":"Categorias de Conteúdo","content":"Tipos como diálogos, mídias sociais, programas de variedades etc."},{"title":"Ambiente de Gravação","desc":"Ambiente de Gravação","content":"Baixo ruído"},{"title":"País","desc":"País","content":"Tailândia"},{"title":"Código de Região Linguística","desc":"Código de Região Linguística","content":"th-TH"},{"title":"Língua","desc":"Língua","content":"Tailandês"},{"title":"Características de Anotação","desc":"Características de Anotação","content":"Anotação de conteúdo textual, marca de tempo de frase, identificação do locutor, género, anotação de ruído"},{"title":"Taxa de Precisão","desc":"Taxa de Precisão","content":"Precisão de palavras: 98% (etiquetas, identificação de gênero, identificação do falante, sotaque e tópico não são incluídos na estatística de precisão)"}],"datatag":"Thai,Casual Conversation,ASR","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"500001_6.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250721175406/500001_6.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=2OvhfaFaWY3zdwE%2BIHh5Rg8oXJg%3D","intro":"คุณผู้ฟังมีความคิดแบบนี้ไหมคะ ในวันที่เราเหนื่อยมากมาก เราท้อมากมาก เราเริ่มไม่อยากจะมีชีวิตอยู่แล้ว","size":241800,"progress":100,"type":"mp3"},{"name":"500002_8.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250721175406/500002_8.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=%2BXu1ouOHCx9fViVsDUxgWwASHxw%3D","intro":"อยู่ที่โคราช แล้วจะมีการซ้อมรบกันอยู่ ฝึกซ้อมรบกันอยู่น่ะ ก็ตั้งชื่อผมอะคลอดพอดี ก็ตั้งชื่อผมว่าประลองยุทธ์","size":253750,"progress":100,"type":"mp3"},{"name":"500004_4.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250721175406/500004_4.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=UI2MbKqovKI%2Fx0Rl8er4Ho3658w%3D","intro":"ปรุงแต่งอยู่ในนั้น","size":45930,"progress":100,"type":"mp3"},{"name":"500004_8.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250721175406/500004_8.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=7Bd6uuRU0TtemREj9fJavah7cRI%3D","intro":"มันก็จะทำให้ใจรู้สึกปฏิเสธมากมาก เนี่ย แล้วมันก็เลยส่งผลออกมาเป็นความจำความรู้สึก","size":185224,"progress":100,"type":"mp3"}],"officialSummary":"Dados de voz coloquial em tailandês, abrangendo diálogos, mídias sociais, programas de variedades e outras áreas comuns, refletindo situações reais de interação no mundo real. Este conjunto de dados está anotado com o conteúdo textual, identidade e gênero dos locutors, possui alta precisão e é de fácil utilização, oferecendo recursos valiosos para pesquisas e aplicações relacionadas ao reconhecimento de fala. Isso ajuda os modelos a se destacarem diante da diversidade do mundo real. Seguimos rigorosamente as leis de proteção de dados e privacidade, garantindo a privacidade e os direitos legais dos usuários durante a coleta, armazenamento e uso dos dados. Todos os dados estão em conformidade com GDPR, CCPA e PIPL.","dataexampl":null,"datakeyword":["Tailandês"," Conversa Informal"," ASR"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,PT,DE\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"1004 Hours - Thai(Thailand) Real-world Casual Conversation and Monologue speech dataset","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
900 horas de dados de voz em tailandês – linguagem coloquial
Tailandês
Conversa Informal
ASR
Dados de voz coloquial em tailandês, abrangendo diálogos, mídias sociais, programas de variedades e outras áreas comuns, refletindo situações reais de interação no mundo real. Este conjunto de dados está anotado com o conteúdo textual, identidade e gênero dos locutors, possui alta precisão e é de fácil utilização, oferecendo recursos valiosos para pesquisas e aplicações relacionadas ao reconhecimento de fala. Isso ajuda os modelos a se destacarem diante da diversidade do mundo real. Seguimos rigorosamente as leis de proteção de dados e privacidade, garantindo a privacidade e os direitos legais dos usuários durante a coleta, armazenamento e uso dos dados. Todos os dados estão em conformidade com GDPR, CCPA e PIPL.
Este é um conjunto de dado pagos destinando a uso comercial, fins de investigação e otras finalidades. Conjunto de dados licenciado e pronto ajuda a acelerar projetos d IA.
Características
Formato
16kHz, 16 bit, WAV, mono
Categorias de Conteúdo
Tipos como diálogos, mídias sociais, programas de variedades etc.
Ambiente de Gravação
Baixo ruído
País
Tailândia
Código de Região Linguística
th-TH
Língua
Tailandês
Características de Anotação
Anotação de conteúdo textual, marca de tempo de frase, identificação do locutor, género, anotação de ruído
Taxa de Precisão
Precisão de palavras: 98% (etiquetas, identificação de gênero, identificação do falante, sotaque e tópico não são incluídos na estatística de precisão)