[{"@type":"PropertyValue","name":"Volume de Dados","value":"100 mil"},{"@type":"PropertyValue","name":"Finalidade dos Dado","value":"Usado para treinar e melhorar a capacidade de seguir instruções de grandes modelos"},{"@type":"PropertyValue","name":"Conteúdo dos Dados","value":"Diversos prompts complexos, com comprimento entre 50 e 400 palavras, cada prompt contendo pelo menos 3 condições ou restrições"},{"@type":"PropertyValue","name":"Cobertura de categoria","value":"Geração de conteúdo (escrita de releases, roteiros de entrevista, criação de textos publicitários, revisão de textos, redação em chinês e inglês, aprendizado de gramática, relatórios de pesquisa, planos de estudo, criação de poesias, descrições gastronômicas, textos publicitários, scripts de vendas, apoio na redação oficial, revisão de documentos oficiais, perguntas e respostas sobre políticas, etc.); reescrita (reformular frases, correção de texto, fusão de sentenças, simplificação de textos); resumo (resumos de conteúdo); extração (extração de elementos de eventos, extração de opiniões, extração de palavras-chave, extração de posições, extração de entidades)"},{"@type":"PropertyValue","name":"Método de Produção","value":"Todos os prompts são escritos manualmente, garantindo cobertura diversificada"},{"@type":"PropertyValue","name":"Língua","value":"Chinês"}]
{"id":1456,"datatype":"1","titleimg":"https://pt.nexdata.ai/shujutang/static/image/index/datatang_tuxiang_default.webp","type1":"226","type1str":null,"type2":"228","type2str":null,"dataname":"100 mil pares de textos com instruções complexas para ajuste fino SFT em chinês em domínio geral","datazy":[{"title":"Volume de Dados","desc":"Volume de Dados","content":"100 mil"},{"title":"Finalidade dos Dado","desc":"Finalidade dos Dado","content":"Usado para treinar e melhorar a capacidade de seguir instruções de grandes modelos"},{"title":"Conteúdo dos Dados","desc":"Conteúdo dos Dados","content":"Diversos prompts complexos, com comprimento entre 50 e 400 palavras, cada prompt contendo pelo menos 3 condições ou restrições"},{"title":"Cobertura de categoria","desc":"Cobertura de categoria","content":"Geração de conteúdo (escrita de releases, roteiros de entrevista, criação de textos publicitários, revisão de textos, redação em chinês e inglês, aprendizado de gramática, relatórios de pesquisa, planos de estudo, criação de poesias, descrições gastronômicas, textos publicitários, scripts de vendas, apoio na redação oficial, revisão de documentos oficiais, perguntas e respostas sobre políticas, etc.); reescrita (reformular frases, correção de texto, fusão de sentenças, simplificação de textos); resumo (resumos de conteúdo); extração (extração de elementos de eventos, extração de opiniões, extração de palavras-chave, extração de posições, extração de entidades)"},{"title":"Método de Produção","desc":"Método de Produção","content":"Todos os prompts são escritos manualmente, garantindo cobertura diversificada"},{"title":"Língua","desc":"Língua","content":"Chinês"}],"datatag":"LLM,Instruction-Following,SFT","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"生成类样例.png","url":"https://storage-product.datatang.com/damp/product/samplePresentation_ipad/20250718135224/%E7%94%9F%E6%88%90%E7%B1%BB%E6%A0%B7%E4%BE%8B.png?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=j2dYaUZzrFuOBpHy%2BbE9IzU0uZU%3D","intro":"","size":58978,"progress":100,"type":"jpg"},{"name":"提取类样例.png","url":"https://storage-product.datatang.com/damp/product/samplePresentation_ipad/20250718135224/%E6%8F%90%E5%8F%96%E7%B1%BB%E6%A0%B7%E4%BE%8B.png?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=H5qxm0wOjJhXG2j%2Fs%2FjYogclTzE%3D","intro":"","size":29336,"progress":100,"type":"jpg"},{"name":"摘要类样例.png","url":"https://storage-product.datatang.com/damp/product/samplePresentation_ipad/20250718135224/%E6%91%98%E8%A6%81%E7%B1%BB%E6%A0%B7%E4%BE%8B.png?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=vLGxT%2FdoEGEPX5%2F0WVVEAF7y7AE%3D","intro":"","size":65076,"progress":100,"type":"jpg"}],"officialSummary":"100,000 pares de prompts complexos em chinês, com tamanho entre 50 e 400 caracteres. Cada prompt contém pelo menos três restrições, sendo usados para treinar a capacidade de seguimento de instruções em grandes modelos. As categorias incluem: Geração: redação de artigos, roteiros de entrevista, criação de textos publicitários, revisão de manuscritos, redação em inglês e chinês, aprendizagem gramatical, relatórios de pesquisa, planos de estudo, poesia, descrições culinárias, anúncios, scripts de vendas, escrita e revisão de documentos oficiais, perguntas e respostas sobre políticas públicas; Reescrita: reformulação de frases, correção de texto, combinação de sentenças, simplificação de conteúdo; Resumo: resumo de conteúdo; Extração: extração de elementos de eventos, opiniões, palavras-chave, posições, entidades. Todos os prompts foram escritos manualmente, com ampla variedade.","dataexampl":null,"datakeyword":["LLM"," Instruções"," SFT"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Type","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"llm","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,JP,PT,DE\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"100,000 Instruction-Following Evaluation SFT for Chinese LLM Text Data","BGimg":"","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"],"firstList":[{"name":"重写类样例.png","url":"https://storage-product.datatang.com/damp/product/samplePresentation_ipad/20250718135224/%E9%87%8D%E5%86%99%E7%B1%BB%E6%A0%B7%E4%BE%8B.png?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=SgPlb%2FRyoOnK4YX2Efnr0ZuCJgY%3D","intro":"","size":32077,"progress":100,"type":"jpg"}]}
https://pt.nexdata.ai/shujutang/static/image/index/datatang_tuxiang_default.webp
[{"@type":"ImageObject","embedUrl":"https://storage-product.datatang.com/damp/product/samplePresentation_ipad/20250718135224/%E7%94%9F%E6%88%90%E7%B1%BB%E6%A0%B7%E4%BE%8B.png?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=j2dYaUZzrFuOBpHy%2BbE9IzU0uZU%3D"},{"@type":"ImageObject","embedUrl":"https://storage-product.datatang.com/damp/product/samplePresentation_ipad/20250718135224/%E6%8F%90%E5%8F%96%E7%B1%BB%E6%A0%B7%E4%BE%8B.png?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=H5qxm0wOjJhXG2j%2Fs%2FjYogclTzE%3D"},{"@type":"ImageObject","embedUrl":"https://storage-product.datatang.com/damp/product/samplePresentation_ipad/20250718135224/%E6%91%98%E8%A6%81%E7%B1%BB%E6%A0%B7%E4%BE%8B.png?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=vLGxT%2FdoEGEPX5%2F0WVVEAF7y7AE%3D"},{"@type":"ImageObject","embedUrl":"https://storage-product.datatang.com/damp/product/samplePresentation_ipad/20250718135224/%E9%87%8D%E5%86%99%E7%B1%BB%E6%A0%B7%E4%BE%8B.png?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=SgPlb%2FRyoOnK4YX2Efnr0ZuCJgY%3D"}]
100 mil pares de textos com instruções complexas para ajuste fino SFT em chinês em domínio geral
LLM
Instruções
SFT
100,000 pares de prompts complexos em chinês, com tamanho entre 50 e 400 caracteres. Cada prompt contém pelo menos três restrições, sendo usados para treinar a capacidade de seguimento de instruções em grandes modelos. As categorias incluem: Geração: redação de artigos, roteiros de entrevista, criação de textos publicitários, revisão de manuscritos, redação em inglês e chinês, aprendizagem gramatical, relatórios de pesquisa, planos de estudo, poesia, descrições culinárias, anúncios, scripts de vendas, escrita e revisão de documentos oficiais, perguntas e respostas sobre políticas públicas; Reescrita: reformulação de frases, correção de texto, combinação de sentenças, simplificação de conteúdo; Resumo: resumo de conteúdo; Extração: extração de elementos de eventos, opiniões, palavras-chave, posições, entidades. Todos os prompts foram escritos manualmente, com ampla variedade.
Este é um conjunto de dado pagos destinando a uso comercial, fins de investigação e otras finalidades. Conjunto de dados licenciado e pronto ajuda a acelerar projetos d IA.
![Especificações]()
Características
Finalidade dos Dado
Usado para treinar e melhorar a capacidade de seguir instruções de grandes modelos
Conteúdo dos Dados
Diversos prompts complexos, com comprimento entre 50 e 400 palavras, cada prompt contendo pelo menos 3 condições ou restrições
Cobertura de categoria
Geração de conteúdo (escrita de releases, roteiros de entrevista, criação de textos publicitários, revisão de textos, redação em chinês e inglês, aprendizado de gramática, relatórios de pesquisa, planos de estudo, criação de poesias, descrições gastronômicas, textos publicitários, scripts de vendas, apoio na redação oficial, revisão de documentos oficiais, perguntas e respostas sobre políticas, etc.); reescrita (reformular frases, correção de texto, fusão de sentenças, simplificação de textos); resumo (resumos de conteúdo); extração (extração de elementos de eventos, extração de opiniões, extração de palavras-chave, extração de posições, extração de entidades)
Método de Produção
Todos os prompts são escritos manualmente, garantindo cobertura diversificada
![Amostra]()
Amostra
![Conjuntos de Dados Recomendados]()
Conjuntos de Dados Recomendados
Informe-nos das Suas Necessidades Específicas
f7ff4deb-f82f-44a9-a0fe-1e1d0bfff160