pt

Please fill in your name

Mobile phone format error

Por favor, insira o telefone

Por favor, insira o nome da sua empresa

Por favor, insira o e-mail da sua empresa

Por favor, insira a solicitação de dados

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

A solicitação de dados não pode conter menos de 5 palavras nem conter apenas números

Datasets para LLM

Melhore instantaneamente o desempenho dos seus modelos de IA com conjuntos de dados prontos para uso e de alta qualidade.

Tipo

Todos
19
Descrição de Imagen
7
Conjuntos de Dados SFT
4
Texto para Pré-Treino
10

250 mil questões de banco de dados do setor financeiro

Este conjunto de dados foca na área financeira, com 250,000 questões subdivididas em produtos, mercado, comportamento e princípios. São 125,000 questões de múltipla escolha e 125,000 questões discursivas. Os dados estão em formato JSONL, servindo como recurso para estudos e pesquisas sobre conhecimento financeiro.
Finanças Questões de teste Seleção Perguntas e respostas

50,000 conjuntos de dados de edição de imagem

50,000 conjuntos de dados de edição de imagem. Tipos de edição: remover, adicionar, modificar ou substituir objetos (pessoas, animais, produtos, plantas, paisagens). As anotações incluem recorte do alvo e a ação realizada. Indicadas para síntese de imagem e geração de cenários virtuais.
Edição de Imagem

1,5 Milhões - Dados de Análise Estruturada de Exercícios K12 em Coreano

Dados de Análise Estruturada de Exercícios K12 em Coreano, contêm cerca de 1,5 milhões de questões. Cada entrada inclui o tipo de questão, enunciado, resposta e solução explicativa. Abrangem disciplinas do ensino Primário (Língua Coreana, Matemática, Inglês, Estudos Sociais, Ciências), Secundário Básico (Língua Coreana, Inglês, Matemática, Ciências, Estudos Sociais) e Secundário (Língua Coreana, Inglês, Matemática, Física, Química, Biologia, História, Geografia). Os formatos de questões incluem escolha múltipla, preenchimento de lacunas, verdadeiro/falso e respostas dissertativas. Estes dados podem ser aplicados em tarefas como aprimoramento de conhecimento académico em grande modelo linguístico.
Exercícios K12 Texto LLM (Grande Modelo Linguístico) Coreano

32 milhões de questões estruturadas em disciplinas de ciência e engenharia

32 milhões de questões de ciências exatas e engenharia: abrangendo matemática, física, química, biologia nos níveis fundamental, médio, superior e universitário. Cada questão inclui enunciado, resposta, explicação, tipo, disciplina e nível. Indicadas para reforçar conhecimento acadêmico em grandes modelos.
Questões de Disciplinas Científicas LLM Texto

1 milhão de questões estruturadas sobre código em chinês

1 milhão de questões de programação em chinês (C, C++, Python, Java, JavaScript). Cada questão contém enunciado, resposta, explicação e linguagem. Indicadas para treinar habilidades de programação em modelos.
Questões de Código LLM Texto

25,000 pessoas em vídeos com múltiplos estilos

Vídeos de 25,000 pessoas em múltiplos estilos e cenários, pele branca, amarela, marrom ou preta, idades jovem, adulto ou idoso. Resolução mínima 1920×1080, duração ≥10 segundos. Indicados para geração de vídeo realista de pessoas.
Vídeo relacionado a Pessoas Humano Digital Geração de Vídeo

1 milhão de conjuntos de descrições detalhadas de imagens em cenários gerais

1 milhão de pares de imagens e descrições. Os tipos de imagens abrangem paisagens, animais, flores e árvores, pessoas, carros, esportes, indústria e arquitetura, além de um subconjunto com foco estético. As descrições abordam o cenário geral da imagem, detalhes da cena e emoções expressas pela imagem, escritas em inglês e chinês.
Descrição de texto Multimodalidade Conjunto de dados de cenas gerais Legenda em inglês Legenda em chinês

Dados textuais da plataforma de perguntas e respostas japonesa OKWAVE

Dados de texto da plataforma japonesa de perguntas e respostas OKWAVE, incluindo perguntas, respostas, categorias, data de publicação, autores e outros campos. Os dados estão em atualização contínua; até o final de abril de 2025, havia 8,4 milhões de perguntas com 2,3 bilhões de caracteres, 27 milhões de respostas com 7,6 bilhões de caracteres, 15,5 milhões de agradecimentos (expressões de gratidão dos perguntadores aos respondentes) com 1,7 bilhão de caracteres, e 2,1 milhões de esclarecimentos adicionais com 360 milhões de caracteres. Esses dados podem ser usados para treinamento de modelos gerais de grande porte.
Perguntas e Respostas Texto Japonês

114,000 questões de competições em chinês com texto estruturado

114,000 questões de competição em chinês com estrutura organizada, cobrindo matemática, física, química e biologia nos níveis fundamental, médio e superior. Cada questão inclui enunciado, resposta, explicação, disciplina, série e tipo de pergunta. Indicadas para reforço acadêmico em grandes modelos.
Questões de Concurso LLM Texto

loading

Personalize os Seus Dados Agora

Porquê escolher conjuntos de dados prontos?

  • Direitos de Autor

    Direitos de Autor

    Direitos claros e verificáveis
  • Segurança

    Segurança

    Autorização adequada Utilização segura
  • Profissionalismo

    Profissionalismo

    Produzido por especialistas em dados de IA
  • Diversidade

    Diversidade

    Coletado a partir de múltiplos cenários reais
  • Rentabilidade

    Rentabilidade

    Mais económico do que dados personalizados
  • Eficiência

    Eficiência

    Prontos a usar em segundos
374a422a-0960-4e50-a084-5c2a45746831