Conjuntos de Dados para Grandes Modelos de Linguagem – Nexdata

pt

Please fill in your name

Mobile phone format error

Por favor, insira o telefone

Por favor, insira o nome da sua empresa

Por favor, insira o e-mail da sua empresa

Por favor, insira a solicitação de dados

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

A solicitação de dados não pode conter menos de 5 palavras nem conter apenas números

Início > Todos os Datasets por Categoria > Datasets para LLM

Tipo

Todos

19

Descrição de Imagen

7

Conjuntos de Dados SFT

4

Texto para Pré-Treino

10

250 mil questões de banco de dados do setor financeiro

Este conjunto de dados foca na área financeira, com 250,000 questões subdivididas em produtos, mercado, comportamento e princípios. São 125,000 questões de múltipla escolha e 125,000 questões discursivas. Os dados estão em formato JSONL, servindo como recurso para estudos e pesquisas sobre conhecimento financeiro.

Finanças Questões de teste Seleção Perguntas e respostas

1,5 Milhões - Dados de Análise Estruturada de Exercícios K12 em Coreano

Dados de Análise Estruturada de Exercícios K12 em Coreano, contêm cerca de 1,5 milhões de questões. Cada entrada inclui o tipo de questão, enunciado, resposta e solução explicativa. Abrangem disciplinas do ensino Primário (Língua Coreana, Matemática, Inglês, Estudos Sociais, Ciências), Secundário Básico (Língua Coreana, Inglês, Matemática, Ciências, Estudos Sociais) e Secundário (Língua Coreana, Inglês, Matemática, Física, Química, Biologia, História, Geografia). Os formatos de questões incluem escolha múltipla, preenchimento de lacunas, verdadeiro/falso e respostas dissertativas. Estes dados podem ser aplicados em tarefas como aprimoramento de conhecimento académico em grande modelo linguístico.

Exercícios K12 Texto LLM (Grande Modelo Linguístico) Coreano

50,000 conjuntos de dados de edição de imagem

50,000 conjuntos de dados de edição de imagem. Tipos de edição: remover, adicionar, modificar ou substituir objetos (pessoas, animais, produtos, plantas, paisagens). As anotações incluem recorte do alvo e a ação realizada. Indicadas para síntese de imagem e geração de cenários virtuais.

Edição de Imagem

32 milhões de questões estruturadas em disciplinas de ciência e engenharia

32 milhões de questões de ciências exatas e engenharia: abrangendo matemática, física, química, biologia nos níveis fundamental, médio, superior e universitário. Cada questão inclui enunciado, resposta, explicação, tipo, disciplina e nível. Indicadas para reforçar conhecimento acadêmico em grandes modelos.

Questões de Disciplinas Científicas LLM Texto

1 milhão de questões estruturadas sobre código em chinês

1 milhão de questões de programação em chinês (C, C++, Python, Java, JavaScript). Cada questão contém enunciado, resposta, explicação e linguagem. Indicadas para treinar habilidades de programação em modelos.

Questões de Código LLM Texto

25,000 pessoas em vídeos com múltiplos estilos

Vídeos de 25,000 pessoas em múltiplos estilos e cenários, pele branca, amarela, marrom ou preta, idades jovem, adulto ou idoso. Resolução mínima 1920×1080, duração ≥10 segundos. Indicados para geração de vídeo realista de pessoas.

Vídeo relacionado a Pessoas Humano Digital Geração de Vídeo

20,011 imagens de cenários naturais com dados de OCR e descrição

20,011 imagens de cenas naturais com descrições para OCR, cobrindo línguas asiáticas e europeias, totalizando 14 idiomas. Os cenários de coleta incluem letreiros de lojas, placas de estação, pôsteres, placas de trânsito, entre outros, capturados de vários ângulos. As descrições, em inglês, tratam do layout dos textos, conteúdo textual, cores e outras informações.

AIGC Legenda em inglês Legenda OCR Dados OCR multilíngues Dados OCR multilíngues Dados OCR Conjunto de dados OCR

6,9 milhões de questões estruturadas em múltiplas disciplinas em chinês

6,9 milhões de questões multidisciplinares em chinês, cobrindo vários níveis de ensino. Cada item inclui enunciado, resposta, explicação, tipo, disciplina e nível. Indicadas para reforço acadêmico em modelos de linguagem.

Questões Multidisciplinares em Chinês LLM Texto

20,846 conjuntos de receitas com descrição textual e imagens

20,846 conjuntos de dados com descrições de receitas em imagem e texto. Cada conjunto inclui de 4 a 18 fotos, com uma descrição textual correspondente para cada imagem. As receitas abrangem diferentes cozinhas, como chinesa, ocidental, coreana e japonesa. As descrições estão em chinês e inglês. Em termos de comprimento, as descrições em chinês têm no mínimo 15 caracteres, e as em inglês, no mínimo 30 palavras. Esses dados são úteis para recomendações de receitas, educação culinária e outras aplicações relacionadas.

Livro de Receitas Legenda de Imagem AIGC

loading

Personalize os Seus Dados Agora

Porquê escolher conjuntos de dados prontos?

Direitos de Autor
Direitos claros e verificáveis
Segurança
Autorização adequada Utilização segura
Profissionalismo
Produzido por especialistas em dados de IA
Diversidade
Coletado a partir de múltiplos cenários reais
Rentabilidade
Mais económico do que dados personalizados
Eficiência
Prontos a usar em segundos

Subscreva a Nossa Newsletter

Seja o primeiro a receber os últimos lançamentos de produtos, soluções de dados e novidades empresariais da Nexdata.

Datasets Pré-Processados: Todos os Datasets por Categoria; Datasets para LLM; Datasets para Visão Computacional; Datasets para ASR; Datasets para TTS; Datasets para OCR; Dicionário de Pronúncia; Datasets para NLU

Serviços de Dados: Dados de 3D PCD; Dados de Vista de Rua; Dados para OCR; Dados para Comportamento; Dados para Identidade; Dados para ASR; Dados para Síntese de Fala; Dados Multimodais

Setores: Embodied AI; IA Generativa; Veículos Autónomos; RA e RV; IA Conversacional; Casa Inteligente; Retalho; Cuidados de Saúde Inteligentes

Empresa: Sobre Nós; Notícias; Parceiros; Qualidade & Segurança; Eventos
Ligações Úteis: OPENMPD; DataPlus; Datarade

Plataforma: Plataforma
Competição: Competição
Recursos: Datasets Patrocinados

Aprimore a Sua IA com Dados de Alta Qualidade

+1(626)594-5598

[email protected]

nexdata_ai facebook

nexdata_ai twitter

nexdata_ai linkedin

nexdata_ai youtube

Copyright © 2023 NEXDATA TECHNOLOGY INC

Mapa do Site Termos e Condições

Utilizamos cookies para melhorar a sua experiência de navegação, apresentar anúncios ou conteúdos personalizados e analisar o tráfego do nosso website. Ao clicar em “Aceitar Todos”, concorda com a utilização de cookies.

9f06206e-29ee-429c-8de4-c57d7d94dd1a