Лучшее за неделю

models-page.best-models.alt-title

Claude Sonnet 4

Claude Sonnet 4 значительно превосходит Sonnet 3.7, показывая отличные результаты в программировании и рассуждениях с высокой точностью и управляемостью. Он достигает рекордной производительности на бенчмарке SWE (72,7%) и идеально подходит для широкого спектра приложений, от рутинных задач до сложных проектов разработки ПО

o4 Mini High

Модель o4-mini с высоким уровнем reasoning_effort для тщательного рассуждения. Сочетает быстроту и мультимодальность с точностью в STEM и визуальных задачах при контексте 200K токенов.

Veo 3

models-page.best-models.veo-3.description

GPT-5

GPT-5 — продвинутая модель OpenAI с улучшенными возможностями рассуждения, точности и качества кода. Оптимизирована для сложных задач, требующих пошагового мышления и следования инструкциям. Отличается снижением числа ошибок и повышенной эффективностью в программировании, написании текстов и задачах, связанных со здоровьем.

Flux-1.1 Pro Ultra

Усовершенствованная версия модели для генерации изображений с поддержкой разрешения в 4 раза выше (до 4 МП), сохраняющая скорость генерации 10 секунд на изображение. Модель предлагает режим 'raw mode' для создания более естественных изображений.

Gemini-2.5 Pro Preview

Модель Google, способная «мыслить» перед ответом для большей точности и производительности. Лидер на платформе LMArena с передовыми возможностями в рассуждениях, кодинге и мультимодальности (текст, аудио, изображения, видео).

models-page.best-models.link

Доступные модели нейросетей

ELITE

DELUXE

PREMIUM

BASIC

Модели с API

Стоимость в Caps

			Стоимость в Caps
Модель	Размер контекста (в токенах)	Размер вывода (в токенах)	Промпт (за 1 токен)	Картинка-промпт (за 1к токенов)	Ответ (за 1 токен)
gpt-5	400 000	128 000	0,94	0	7,5
gpt-4.1	1 047 576	32 768	1,5	0	6
gpt-4.1-nano	1 047 576	32 768	0,07	0	0,3
gpt-4.1-mini	1 047 576	32 768	0,3	0	1,2
gpt-4-turbo	128 000	4 096	7,5	10 837,5	22,5
gpt-5-chat	400 000	16 384	0,94	0	7,5
gpt-5.1	400 000	128 000	0,94	0	7,5
gpt-5.1-codex	400 000	128 000	0,94	0	7,5

Запрос к LLM

Стоимость одного запроса в дашборде

Все тарифы

Использованные токены + 1 ₽за 1 запрос

Особое внимание: использование Easy Writer тарифицируется иначе. Для каждой генерации текста Easy Writer дополнительно списывается 10 ₽ за запрос + стоимость токенов, чем указано выше для обычного запроса к LLM.

Генерация изображений

Стоимость одной генерации по моделям

MidJourney — Relax

20 000 CAPS / 3,14 ₽ За 1 генерацию

MidJourney — Fast

40 000 CAPS / 6,29 ₽ За 1 генерацию

MidJourney — Turbo

80 000 CAPS / 12,57 ₽ За 1 генерацию

Dall-E

33 000 CAPS / 5,19 ₽ За 1 генерацию

Flux

1 666 CAPS / 0,26 ₽ За 1 генерацию

Stable Diffusion

26 250 CAPS / 4,13 ₽ За 1 генерацию

GPT Image - Square

8 160 CAPS / 1,28 ₽ За 1 генерацию

GPT Image - Portrait

12 240 CAPS / 1,92 ₽ За 1 генерацию

GPT Image - Landscape

12 000 CAPS / 1,89 ₽ За 1 генерацию

Веб-поиск

Стоимость одного использования веб-поиска

Все тарифы

Использованные токены + 1 ₽за 1 запрос

Анализ ссылок

0,01 Capsза 1 символ

Генерация видео

Стоимость одной секунды создания видео

GoogleVeo

168 750 Caps / 26.52 ₽за 1 секунду

Runway

30 000 Caps / 4.71 ₽за 1 секунду

Для генерации видео в качестве 1080p с использованием veo-3 добавляется доплата +20%.

Синтез речи

Стоимость одного синтеза речи

TTS

11 250 Caps / 1.77 ₽за 1 000 символов

TTS HD

27 225 Caps / 4.28 ₽за 1 000 символов

Транскрибация

Стоимость расшифровки текста за одну минуту

AssemblyAI — nano

2 000 Caps / 0.314 ₽За 1 минуту

AssemblyAI — best

5 500 Caps / 0.864 ₽За 1 минуту

Прибавка 5р за любой запрос, 10р за файлы свыше 50 МБ, 50р за файлы свыше 500 МБ

Эмбеддинги

Эмбеддинг модели, доступные через наш API.

		Стоимость в Caps	Стоимость в рублях
Модель	Размерность эмбеддинга	Стоимость промта (за 1 токен)	Стоимость промта (за 1M токенов)
text-embedding-3-largeНаиболее эффективная embedding модель	3 072	0,12	15,8
text-embedding-3-smallПовышенная производительность по сравнению с embedding моделью ada 2-го поколения	1 536	0,02	2,5
text-embedding-ada-002-2models-page.additional-costs.embedding.text-embedding-ada-002-2		1	133,33

text-embedding-3-largeНаиболее эффективная embedding модель

3 072Размерность эмбеддинга

0,12Стоимость промта (за 1M токенов)

15,8Стоимость промта (за 1M токенов)

text-embedding-3-smallПовышенная производительность по сравнению с embedding моделью ada 2-го поколения

1 536Размерность эмбеддинга

0,02Стоимость промта (за 1M токенов)

2,5Стоимость промта (за 1M токенов)

text-embedding-ada-002-2models-page.additional-costs.embedding.text-embedding-ada-002-2

Размерность эмбеддинга

1Стоимость промта (за 1M токенов)

133,33Стоимость промта (за 1M токенов)

Стоимость Caps для корпоративных клиентов фиксирована и составляет 216 рублей за 1 000 000 Caps с 1 июня 2025 года.

Что такое Caps?

Caps — это внутренняя валюта сервиса, в которой измеряется стоимость запросов и ответов нейросетей. Она фиксированная и зависит от сложности модели: количества параметров, мультимодальности и общей мощности.

Например:

ChatGPT-3.5 — ~1 Caps за токен

ChatGPT o1-Pro — ~400+ Caps за токен

Чем выше ваш тариф, тем выгоднее цена: 1 млн Caps дешевле на Elite, чем на Basic.

Остались вопросы?

Что такое токены?

Токены — это единицы обработки текста нейросетью, представляющие части слов, целые слова или знаки пунктуации, которые определяют стоимость запросов.

На сколько хватит 1 миллиона токенов?

Одного миллиона токенов модели GPT-4o хватит, чтобы переписать “Братья Карамазовы” Ф. М. Достоевского.

Что делать, если у меня закончились токены?

Приобретите дополнительные Caps в личном кабинете — https://bothub.chat/profile

Почему нейросеть выдает себя за другую?

Нейросеть не знает какая она модель, если это не прописано в системном промте. На “самоидентификацию” модели без инструкции влияет множество факторов, один из них — обучающая выборка данных модели.

Что такое контекст у нейросети?

Контекст — это объем информации, который нейросеть удерживает в памяти во время диалога, влияющий на связность ответов и понимание предыдущих запросов.

Какой контекст у разных моделей нейросетей?

GPT o1 Pro и Claude 3.7 Sonnet поддерживают до 200K токенов, Gemini 2.5 Pro работает с 1KK, в то время как Gemini 2.0 Pro поддерживает до 2KK токенов.

Какие форматы файлов читают модели?

Нейросети обрабатывают TXT, PDF, DOCX, XLSX, CSV, JSON, XML, HTML, а также изображения JPG, PNG и аудиофайлы MP3, MP4.

Можно ли использовать нейросети бесплатно?

Есть бесплатные модели с постфиксом “:free” и “-exp”, которые можно использовать бесплатно через мини-окно на главной странице, а также странице модели.

Чем модели нейросетей отличаются друг от друга?

Модели различаются объемом обучающих данных, размером контекста, скоростью обработки, специализацией на конкретных задачах и способностью работать с мультимодальным контентом.

Как использовать модели через API?

Для интеграции моделей в свои приложения вам необходимо получить ключ API в личном кабинете. Более подробно можно ознакомиться здесь: https://bothub.chat/api/documentation/ru.

Можно ли использовать нейросеть для автоматизации бизнес-процессов?

Нейросети эффективно автоматизируют рутинные задачи документооборота, обработки данных, клиентской поддержки и аналитики, интегрируясь с существующими бизнес-системами через API.

Служба поддержкиРаботаем с 07:00 до 12:00