en

Please fill in your name

Mobile phone format error

Por favor, insira o telefone

Por favor, insira o nome da sua empresa

Por favor, insira o e-mail da sua empresa

Por favor, insira a solicitação de dados

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

A solicitação de dados não pode conter menos de 5 palavras nem conter apenas números

Datasets para LLM

Melhore instantaneamente o desempenho dos seus modelos de IA com conjuntos de dados prontos para uso e de alta qualidade.

Tipo

Todos
33
Descrição de Imagen
13
Conjuntos de Dados SFT
5
Texto para Pré-Treino
17

250 mil questões de banco de dados do setor financeiro

Este conjunto de dados foca na área financeira, com 250,000 questões subdivididas em produtos, mercado, comportamento e princípios. São 125,000 questões de múltipla escolha e 125,000 questões discursivas. Os dados estão em formato JSONL, servindo como recurso para estudos e pesquisas sobre conhecimento financeiro.
Finanças Questões de teste Seleção Perguntas e respostas

1,5 Milhões - Dados de Análise Estruturada de Exercícios K12 em Coreano

Dados de Análise Estruturada de Exercícios K12 em Coreano, contêm cerca de 1,5 milhões de questões. Cada entrada inclui o tipo de questão, enunciado, resposta e solução explicativa. Abrangem disciplinas do ensino Primário (Língua Coreana, Matemática, Inglês, Estudos Sociais, Ciências), Secundário Básico (Língua Coreana, Inglês, Matemática, Ciências, Estudos Sociais) e Secundário (Língua Coreana, Inglês, Matemática, Física, Química, Biologia, História, Geografia). Os formatos de questões incluem escolha múltipla, preenchimento de lacunas, verdadeiro/falso e respostas dissertativas. Estes dados podem ser aplicados em tarefas como aprimoramento de conhecimento académico em grande modelo linguístico.
Exercícios K12 Texto LLM (Grande Modelo Linguístico) Coreano

Dados textuais da plataforma de perguntas e respostas japonesa OKWAVE

Dados de texto da plataforma japonesa de perguntas e respostas OKWAVE, incluindo perguntas, respostas, categorias, data de publicação, autores e outros campos. Os dados estão em atualização contínua; até o final de abril de 2025, havia 8,4 milhões de perguntas com 2,3 bilhões de caracteres, 27 milhões de respostas com 7,6 bilhões de caracteres, 15,5 milhões de agradecimentos (expressões de gratidão dos perguntadores aos respondentes) com 1,7 bilhão de caracteres, e 2,1 milhões de esclarecimentos adicionais com 360 milhões de caracteres. Esses dados podem ser usados para treinamento de modelos gerais de grande porte.
Perguntas e Respostas Texto Japonês

32 milhões de questões estruturadas em disciplinas de ciência e engenharia

32 milhões de questões de ciências exatas e engenharia: abrangendo matemática, física, química, biologia nos níveis fundamental, médio, superior e universitário. Cada questão inclui enunciado, resposta, explicação, tipo, disciplina e nível. Indicadas para reforçar conhecimento acadêmico em grandes modelos.
Questões de Disciplinas Científicas LLM Texto

1 milhão de questões estruturadas sobre código em chinês

1 milhão de questões de programação em chinês (C, C++, Python, Java, JavaScript). Cada questão contém enunciado, resposta, explicação e linguagem. Indicadas para treinar habilidades de programação em modelos.
Questões de Código LLM Texto

50,000 conjuntos de dados de edição de imagem

50,000 conjuntos de dados de edição de imagem. Tipos de edição: remover, adicionar, modificar ou substituir objetos (pessoas, animais, produtos, plantas, paisagens). As anotações incluem recorte do alvo e a ação realizada. Indicadas para síntese de imagem e geração de cenários virtuais.
Edição de Imagem

25,000 pessoas em vídeos com múltiplos estilos

Vídeos de 25,000 pessoas em múltiplos estilos e cenários, pele branca, amarela, marrom ou preta, idades jovem, adulto ou idoso. Resolução mínima 1920×1080, duração ≥10 segundos. Indicados para geração de vídeo realista de pessoas.
Vídeo relacionado a Pessoas Humano Digital Geração de Vídeo

100 mil pares de textos com instruções complexas para ajuste fino SFT em chinês em domínio geral

100,000 pares de prompts complexos em chinês, com tamanho entre 50 e 400 caracteres. Cada prompt contém pelo menos três restrições, sendo usados para treinar a capacidade de seguimento de instruções em grandes modelos. As categorias incluem: Geração: redação de artigos, roteiros de entrevista, criação de textos publicitários, revisão de manuscritos, redação em inglês e chinês, aprendizagem gramatical, relatórios de pesquisa, planos de estudo, poesia, descrições culinárias, anúncios, scripts de vendas, escrita e revisão de documentos oficiais, perguntas e respostas sobre políticas públicas; Reescrita: reformulação de frases, correção de texto, combinação de sentenças, simplificação de conteúdo; Resumo: resumo de conteúdo; Extração: extração de elementos de eventos, opiniões, palavras-chave, posições, entidades. Todos os prompts foram escritos manualmente, com ampla variedade.
LLM Instruções SFT

114,000 questões de competições em chinês com texto estruturado

114,000 questões de competição em chinês com estrutura organizada, cobrindo matemática, física, química e biologia nos níveis fundamental, médio e superior. Cada questão inclui enunciado, resposta, explicação, disciplina, série e tipo de pergunta. Indicadas para reforço acadêmico em grandes modelos.
Questões de Concurso LLM Texto

loading

Personalize os Seus Dados Agora

Porquê escolher conjuntos de dados prontos?

  • Direitos de Autor

    Direitos de Autor

    Direitos claros e verificáveis
  • Segurança

    Segurança

    Autorização adequada Utilização segura
  • Profissionalismo

    Profissionalismo

    Produzido por especialistas em dados de IA
  • Diversidade

    Diversidade

    Coletado a partir de múltiplos cenários reais
  • Rentabilidade

    Rentabilidade

    Mais económico do que dados personalizados
  • Eficiência

    Eficiência

    Prontos a usar em segundos
76cfe995-afa0-4f0b-8e04-af595ddd059b