O melhor da semana

models-page.best-models.alt-title

Claude Sonnet 4

Claude Sonnet 4 supera significativamente o Sonnet 3.7, apresentando excelentes resultados em programação e raciocínio com alta precisão e controlabilidade. Alcança desempenho recorde no benchmark SWE (72,7%) e é ideal para uma ampla gama de aplicações, desde tarefas rotineiras até projetos complexos de desenvolvimento de software

o4 Mini High

O modelo o4-mini com um alto nível de reasoning_effort para raciocínio minucioso. Combina velocidade e multimodalidade com precisão em tarefas STEM e visuais em um contexto de 200K tokens.

Veo 3

models-page.best-models.veo-3.description

GPT-5

GPT-5 é um modelo avançado da OpenAI com capacidades aprimoradas de raciocínio, precisão e qualidade de código. É otimizado para tarefas complexas que exigem pensamento passo a passo e seguimento de instruções. Destaca-se pela redução de erros e maior eficiência em programação, escrita e tarefas relacionadas à saúde.

Flux-1.1 Pro Ultra

Versão aprimorada do modelo de geração de imagens com suporte para resolução 4 vezes maior (até 4 MP), mantendo uma velocidade de geração de 10 segundos por imagem. O modelo oferece um 'modo bruto' para criar imagens mais naturais.

Gemini-2.5 Pro Preview

Modelo do Google capaz de 'pensar' antes de responder para maior precisão e desempenho. Líder na plataforma LMArena com capacidades avançadas em raciocínio, codificação e multimodalidade (texto, áudio, imagens, vídeo).

models-page.best-models.link

Modelos de rede neural disponíveis

ELITE

DELUXE

PREMIUM

BASIC

Modelos com API

Custo em Caps

			Custo em Caps
Modelo	Tamanho do contexto (em tokens)	Tamanho da saída (em tokens)	Prompt (por 1 token)	Prompt de imagem (por 1k token)	Resposta (por 1 token)
gpt-5	400 000	128 000	0,94	0	7,5
gpt-4.1	1 047 576	32 768	1,5	0	6
gpt-4o-mini	128 000	16 384	0,11	162,75	0,45
gpt-5-pro	400 000	128 000	11,25	0	90
gpt-5.1	400 000	128 000	0,94	0	7,5
gpt-5-mini	400 000	128 000	0,19	0	1,5
gpt-4o	128 000	16 384	1,88	2 709,75	7,5
gpt-5-chat	400 000	16 384	0,94	0	7,5

* Nossa margem sobre esses preços é de 5%, que está incluída no custo dos pacotes exceto Básico (Premium e superior)

Solicitação ao LLM

Custo de uma única solicitação no painel

Todas as tarifas

Tokens usados + 0.01 $por 1 solicitação

Atenção: o uso do Easy Writer é cobrado de forma diferente. Para cada geração de texto, o Easy Writer cobra 0.1 $ adicionais por solicitação + o custo dos tokens, conforme especificado acima para uma solicitação normal de LLM.

Geração de Imagens

Custo de uma única geração por modelos

MidJourney — Relax

26 000 CAPS / 0,04 $ Por 1 geração

MidJourney — Fast

52 000 CAPS / 0,08 $ Por 1 geração

MidJourney — Turbo

104 000 CAPS / 0,16 $ Por 1 geração

Dall-E

33 000 CAPS / 0,05 $ Por 1 geração

Flux

1 666 CAPS / 0 $ Por 1 geração

Stable Diffusion

26 250 CAPS / 0,04 $ Por 1 geração

Pesquisa na Web

Custo de uma única utilização de pesquisa na web

Todas as tarifas

Tokens usados + 0.01 $por 1 solicitação

Análise de Links

0,01 Capspor 1 caractere

Geração de vídeo

Custo de criação de um segundo de vídeo

GoogleVeo

168 750 Caps / 0.25 $por 1 segundo

Runway

30 000 Caps / 0.04 $por 1 segundo

Para geração de vídeo em qualidade 1080p usando veo-3, é adicionada uma taxa adicional de +20%

Transcrição

O custo de uma transcrição

AssemblyAI — nano

2 000 Caps / 0.003 $Por 1 minuto

AssemblyAI — best

5 500 Caps / 0.008 $Por 1 minuto

Uma sobretaxa fixa em todas as solicitações: $0.05 por solicitação, $0.10 por arquivos acima de 50 MB, $0.50 por arquivos acima de 500 MB

Incorporações:

Incorporações de modelos disponíveis através da nossa API.

		Custo em Caps	Custo em dólares
Modelo	Dimensão da incorporação	Custo do prompt (por 1 token)	Custo do prompt (por 100.000 tokens)
text-embedding-3-largeO modelo de incorporação mais eficiente	3 072	0,12	0,16
text-embedding-3-smallDesempenho aumentado em comparação com o modelo de incorporação ada de segunda geração	1 536	0,02	0,02
text-embedding-ada-002-2models-page.additional-costs.embedding.text-embedding-ada-002-2		1	1,33

text-embedding-3-largeO modelo de incorporação mais eficiente

3 072Dimensão da incorporação

0,12Custo do prompt (por 100.000 tokens)

0,16Custo do prompt (por 100.000 tokens)

text-embedding-3-smallDesempenho aumentado em comparação com o modelo de incorporação ada de segunda geração

1 536Dimensão da incorporação

0,02Custo do prompt (por 100.000 tokens)

text-embedding-ada-002-2models-page.additional-costs.embedding.text-embedding-ada-002-2

Dimensão da incorporação

1Custo do prompt (por 100.000 tokens)

1,33Custo do prompt (por 100.000 tokens)

O que são os Caps?

Os Caps são a moeda interna do serviço, usada para medir o custo das solicitações e respostas das redes neurais. É fixa e depende da complexidade do modelo: número de parâmetros, multimodalidade e poder total.

Por exemplo:

ChatGPT-3.5 — ~1 Cap por token

ChatGPT o1-Pro — ~400+ Caps por token

Quanto mais alto for o seu plano, melhor será o preço: 1 milhão de Caps é mais barato no Elite do que no Basic.

Ainda tem dúvidas?

O que são tokens?

Tokens são unidades de processamento de texto pela rede neural, representando partes de palavras, palavras inteiras ou sinais de pontuação que determinam o custo das solicitações.

Quanto tempo durará 1 milhão de tokens?

Um milhão de tokens do modelo GPT-4o são suficientes para reescrever 'Os Irmãos Karamazov' de F. M. Dostoiévski.

O que fazer se eu ficar sem tokens?

Adquira Caps adicionais na sua conta pessoal — https://bothub.chat/profile

Por que a rede neural se passa por outra?

A rede neural não sabe que modelo é se não estiver especificado no prompt do sistema. A 'autoidentificação' do modelo sem instrução é influenciada por muitos fatores, um deles sendo o conjunto de dados de treinamento do modelo.

O que é contexto em uma rede neural?

Contexto é a quantidade de informação que a rede neural retém na memória durante um diálogo, afetando a coerência das respostas e a compreensão das solicitações anteriores.

Qual é o contexto dos diferentes modelos de redes neurais?

GPT o1 Pro e Claude 3.7 Sonnet suportam até 200K tokens, Gemini 2.5 Pro trabalha com 1KK, enquanto Gemini 2.0 Pro suporta até 2KK tokens.

Quais formatos de arquivos os modelos leem?

Redes neurais processam TXT, PDF, DOCX, XLSX, CSV, JSON, XML, HTML, bem como imagens JPG, PNG e arquivos de áudio MP3, MP4.

É possível usar redes neurais gratuitamente?

Existem modelos gratuitos com o sufixo ':free' e '-exp' que podem ser usados gratuitamente por meio de uma mini-janela na página principal, assim como na página do modelo.

Em que os modelos de redes neurais diferem uns dos outros?

Os modelos diferem no volume de dados de treinamento, tamanho do contexto, velocidade de processamento, especialização em tarefas específicas e capacidade de trabalhar com conteúdo multimodal.

Como usar modelos via API?

Para integrar modelos em seus aplicativos, você precisa obter uma chave API em sua conta pessoal. Mais detalhes podem ser encontrados aqui: https://bothub.chat/api/documentation/ru.

É possível usar redes neurais para automatizar processos empresariais?

Redes neurais automatizam efetivamente tarefas rotineiras de gestão documental, processamento de dados, suporte ao cliente e análise, integrando-se com sistemas empresariais existentes via API.

Serviço de SuporteAberto das 07:00 às 12:00