[{"@type":"PropertyValue","name":"Conteúdo dos Dados","value":"Dados de instruções de segurança de conteúdo para grandes modelos"},{"@type":"PropertyValue","name":"Escala dos Dados","value":"Aproximadamente 570,000 pares de perguntas e respostas; cobrindo 31 categorias da Administração do Ciberespaço da China + outras categorias adicionais"},{"@type":"PropertyValue","name":"Tipo dos Dados","value":"Total de 41 categorias"},{"@type":"PropertyValue","name":"Método de Recolha","value":"Elaborado por anotadores profissionais"},{"@type":"PropertyValue","name":"Formato de Armazenamento","value":"Excel"},{"@type":"PropertyValue","name":"Língua","value":"Chinês"}]
{"id":1349,"datatype":"1","titleimg":"https://pt.nexdata.ai/shujutang/static/image/index/datatang_tuxiang_default.webp","type1":"226","type1str":null,"type2":"228","type2str":null,"dataname":"Dados de texto para segurança de conteúdo em modelos de linguagem grande","datazy":[{"title":"Conteúdo dos Dados","desc":"Conteúdo dos Dados","content":"Dados de instruções de segurança de conteúdo para grandes modelos"},{"title":"Escala dos Dados","desc":"Escala dos Dados","content":"Aproximadamente 570,000 pares de perguntas e respostas; cobrindo 31 categorias da Administração do Ciberespaço da China + outras categorias adicionais"},{"title":"Tipo dos Dados","desc":"Tipo dos Dados","content":"Total de 41 categorias"},{"title":"Método de Recolha","desc":"Método de Recolha","content":"Elaborado por anotadores profissionais"},{"title":"Formato de Armazenamento","desc":"Formato de Armazenamento","content":"Excel"},{"title":"Língua","desc":"Língua","content":"Chinês"}],"datatag":"Content safety,Text,LLM","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"1.png","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250728171244/1.png?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=lnfxkT02wujIvCXVtMn1z%2FLf1FU%3D","intro":"","size":76405,"progress":100,"type":"jpg"},{"name":"2.png","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250728171244/2.png?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=V%2B9qZ5uTxJ0SrEHqswGTY7v6HBo%3D","intro":"","size":78372,"progress":100,"type":"jpg"},{"name":"3.png","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250728171244/3.png?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=TGcBdIpdyEbp87EwlBGD6pwZvMA%3D","intro":"","size":72724,"progress":100,"type":"jpg"}],"officialSummary":"Dados de segurança de conteúdo para grandes modelos de linguagem, com cerca de 570.000 conjuntos de textos. Este conjunto pode ser utilizado para o treinamento de LLMs (modelos de linguagem de grande escala), como o ChatGPT.","dataexampl":null,"datakeyword":["Dados de texto sobre considerações de segurança de conteúdo em grandes modelos de linguagem"," LLM"," Modelo de linguagem de grande escala"," Modelo Grande"," Dados do ChatGPT"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Type","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"llm","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,PT,DE\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"Chinese Large Language Model content safety considerations text data","BGimg":"","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
Dados de texto para segurança de conteúdo em modelos de linguagem grande
Dados de texto sobre considerações de segurança de conteúdo em grandes modelos de linguagem
LLM
Modelo de linguagem de grande escala
Modelo Grande
Dados do ChatGPT
Dados de segurança de conteúdo para grandes modelos de linguagem, com cerca de 570.000 conjuntos de textos. Este conjunto pode ser utilizado para o treinamento de LLMs (modelos de linguagem de grande escala), como o ChatGPT.
Este é um conjunto de dado pagos destinando a uso comercial, fins de investigação e otras finalidades. Conjunto de dados licenciado e pronto ajuda a acelerar projetos d IA.
Características
Conteúdo dos Dados
Dados de instruções de segurança de conteúdo para grandes modelos
Escala dos Dados
Aproximadamente 570,000 pares de perguntas e respostas; cobrindo 31 categorias da Administração do Ciberespaço da China + outras categorias adicionais