[{"@type":"PropertyValue","name":"Formato","value":"16kHz, 16 bit, WAV não comprimido, monoaural"},{"@type":"PropertyValue","name":"Ambiente de Gravação","value":"Ambiente interior relativamente silencioso, sem reverberação"},{"@type":"PropertyValue","name":"Conteúdo de Gravação","value":"Dados uma lista de tópicos, os locutores selecionam vários tópicos familiares para garantir que o diálogo seja fluido e natural. Em torno de cada tema, um diálogo é desenvolvido e gravado."},{"@type":"PropertyValue","name":"Características de Anotação","value":"Anotação do conteúdo textual, marcas de tempo de início/fim para frases válidas, identificação do locutor"},{"@type":"PropertyValue","name":"Equipamento","value":"Telemóveis Android, iOS"},{"@type":"PropertyValue","name":"Língua","value":"Inglês americano, inglês britânico, inglês filipino, inglês australiano, inglês indiano, francês, alemão, italiano, japonês, coreano, português, russo, espanhol, tailandês, vietnamita."}]
{"id":1892,"datatype":"1","titleimg":"https://pt.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"166","type2str":null,"dataname":"Conjunto de Dados da Competição de Diálogo Multilíngue Interspeech 2025-MLC- SLM","datazy":[{"title":"Formato","desc":"Formato","content":"16kHz, 16 bit, WAV não comprimido, monoaural"},{"title":"Ambiente de Gravação","desc":"Ambiente de Gravação","content":"Ambiente interior relativamente silencioso, sem reverberação"},{"title":"Conteúdo de Gravação","desc":"Conteúdo de Gravação","content":"Dados uma lista de tópicos, os locutores selecionam vários tópicos familiares para garantir que o diálogo seja fluido e natural. Em torno de cada tema, um diálogo é desenvolvido e gravado."},{"title":"Características de Anotação","desc":"Características de Anotação","content":"Anotação do conteúdo textual, marcas de tempo de início/fim para frases válidas, identificação do locutor"},{"title":"Equipamento","desc":"Equipamento","content":"Telemóveis Android, iOS"},{"title":"Língua","desc":"Língua","content":"Inglês americano, inglês britânico, inglês filipino, inglês australiano, inglês indiano, francês, alemão, italiano, japonês, coreano, português, russo, espanhol, tailandês, vietnamita."}],"datatag":"Challenge ,interspeech,mlc-slm,Conversational ","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"0022_001-1.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250815102905/0022_001-1.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=hzFnDSJljVWVQ0tPwyC0lHgLpLY%3D","intro":"one direction is the first thing like in the mind","size":89964,"progress":100,"type":"mp3"},{"name":"0019_001_phone-1.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250815102905/0019_001_phone-1.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=brQmectqi5gBtR5JBtozW2AZlcI%3D","intro":"Parce que j'ai plus l'ancien, j'en ai que celui-là dorénavant.","size":133452,"progress":100,"type":"mp3"},{"name":"0019_001_phone-2.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250815102905/0019_001_phone-2.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=PYIHEbEPwyvvnnaw3QcxA6RDBUI%3D","intro":"D'accord très bien l'autre, je vais l'effacer alors.","size":90220,"progress":100,"type":"mp3"},{"name":"0001_001-1.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250815102905/0001_001-1.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=N9kseFImwstZ6%2BVdh6JcvzEmqz8%3D","intro":"조금 이제 날씨도 더워지는데 덜 답답하구","size":136620,"progress":100,"type":"mp3"},{"name":"0001_001-6.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250815102905/0001_001-6.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=9WxMMMfd0avEp9uywfxFpTf7RZ4%3D","intro":"이천치십 년이랑 이천이십일 년 진짜 학교 못 간게","size":169036,"progress":100,"type":"mp3"}],"officialSummary":"O contexto do Conjunto de Dados da Competição de Diálogo Multilíngue Interspeech 2025-MLC-SLM tem origem na organização da Competição de Diálogo Multilíngue MLC-SLM pela Datatang em 2025. O conjunto de dados provém da recolha de quinze conjuntos de dados de diálogos por Datatang. Caracterizado por alta precisão de dados e forte usabilidade, foi projetado especificamente para superar gargalos técnicos no reconhecimento de fala multilíngue e compreensão de contexto longo. O conjunto de dados captura de forma autêntica cenários interativos complexos, como sobreposição de falantes e interrupções espontâneas, fornecendo recursos ricos para pesquisas e aplicações relacionadas com reconhecimento de voz, ajudando os modelos a desempenharem-se excelentemente face à diversidade do mundo real. Cumprimos rigorosamente as leis de proteção de dados e as normas de privacidade, garantindo a proteção da privacidade dos utilizadores e os seus direitos legais durante todo o processo de recolha, armazenamento e utilização dos dados. Todos os dados estão em conformidade com o RGPD, CCPA e PIPL.","dataexampl":null,"datakeyword":["Conjunto de Dados de Áudio de Workshop"," Conjunto de Dados MLC-SLM"," Dados de Reconhecimento de Fala ASR"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,PT,DE\"},{\"code\":\"3\",\"language\":\"EN\"}]","productNameEn":"INTERSPEECH 2025 MLC-SLM Challenge Dataset","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
Conjunto de Dados da Competição de Diálogo Multilíngue Interspeech 2025-MLC- SLM
Conjunto de Dados de Áudio de Workshop
Conjunto de Dados MLC-SLM
Dados de Reconhecimento de Fala ASR
O contexto do Conjunto de Dados da Competição de Diálogo Multilíngue Interspeech 2025-MLC-SLM tem origem na organização da Competição de Diálogo Multilíngue MLC-SLM pela Datatang em 2025. O conjunto de dados provém da recolha de quinze conjuntos de dados de diálogos por Datatang. Caracterizado por alta precisão de dados e forte usabilidade, foi projetado especificamente para superar gargalos técnicos no reconhecimento de fala multilíngue e compreensão de contexto longo. O conjunto de dados captura de forma autêntica cenários interativos complexos, como sobreposição de falantes e interrupções espontâneas, fornecendo recursos ricos para pesquisas e aplicações relacionadas com reconhecimento de voz, ajudando os modelos a desempenharem-se excelentemente face à diversidade do mundo real. Cumprimos rigorosamente as leis de proteção de dados e as normas de privacidade, garantindo a proteção da privacidade dos utilizadores e os seus direitos legais durante todo o processo de recolha, armazenamento e utilização dos dados. Todos os dados estão em conformidade com o RGPD, CCPA e PIPL.
Este é um conjunto de dado pagos destinando a uso comercial, fins de investigação e otras finalidades. Conjunto de dados licenciado e pronto ajuda a acelerar projetos d IA.
Características
Formato
16kHz, 16 bit, WAV não comprimido, monoaural
Ambiente de Gravação
Ambiente interior relativamente silencioso, sem reverberação
Conteúdo de Gravação
Dados uma lista de tópicos, os locutores selecionam vários tópicos familiares para garantir que o diálogo seja fluido e natural. Em torno de cada tema, um diálogo é desenvolvido e gravado.
Características de Anotação
Anotação do conteúdo textual, marcas de tempo de início/fim para frases válidas, identificação do locutor