Gemini
8 декабря 2025 г.
Обзор на Gemini 3 Pro
Цифры впечатляют: 37,5% на Humanity’s Last Exam, 1 048 576 токенов контекста, 13 миллионов активных юзеров‑разработчиков. За ними стоит Gemini 3 Pro — новая вершина в линейке ИИ‑моделей Google.Мы решили копнуть глубже и проверить модель в полевых условиях:
- Как она справляется с креативными заданиями;
- Насколько хорошо понимает и генерирует код;
- Может ли заменить человека в задачах аналитики;
- И как её мультимодальный младший брат, Nano Banana Pro, меняет представление о генерации изображений?

TL;DR;
- Gemini 3 Pro — свежайший флагман Google (релиз: 18 ноября 2025-го), от которого у многих моделей, кажется, слегка подогнулась матрица. Он объединяет работу с текстом, кодом, изображениями, аудио и видео, выдавая рассуждения уровня профессора.
- На вход модель ест всё: документы, кодовые базы, картинки, звук, видео — и аккуратно прожёвывает это в контексте 1 048 576 токенов.
- В большинстве задач Gemini 3 Pro уверенно переигрывает ChatGPT 5.1 и даже GPT 5 Pro. ChatGPT держит позиции лишь там, где важна строгая математическая логика и другие знакомые подходы.
- Google сообщает: уже 13 млн разработчиков заселили Gemini в свои IDE и скрипты.
- Про изображения: наряду с Gemini 3 Pro вышла Nano Banana Pro — визуальный модуль, который справляется с композициями из 14 файлов, встраивает длинные надписи, рисует инфографику и редактирует фото.
Что такое Gemini 3 Pro
Gemini 3 Pro — это флагманская LLM от Google, новейшее поколение, которое объединило все возможности поколения 1, 2 и 2.5. Google называет её самым интеллектуальным и фактологически точным ИИ на сегодня.DeepMind описывает модель как «заметно превосходящую» предшественника практически по всему, что можно измерить: рассуждения, кодинг, мультимодальность; даже умение аккуратно нести чушь, когда нужно, — улучшилось.Google активно рекламирует Gemini 3 Pro как «новый шаг в эволюции разума»:- Она показывает «PhD‑уровень рассуждений» (Humanity’s Last Exam 37,5% без помощи инструментов, при 26% у ChatGPT 5 и 31,6% у GPT 5 Pro).
Устанавливает новый рекорд по тестам математики (MathArena Apex 23,4%).- На лидерборде LMArena у неё 1501 Elo.
- GPQA Diamond — 91,9%.
В техническом отчёте Google пишут, что Gemini 3 Pro «стал самым продвинутым решателем в серии Gemini для сложных задач» и может «понять огромные объемы данных из разных источников».В дополнение к базовой модели Google планирует выпустить режим Gemini 3 Deep Think для особо сложных задач (он уже превзошёл Pro на высокоуровневых IQ‑тестах).Тарифы: входные токены стоят около 2 $ за 1M (контекст до 200к) и 4 $ за 1M токенов (если длинный контекст), выходные — 12/18 $ за 1M. Это дороже ChatGPT 5.1, но если вы собираетесь скормить модели три тома технической документации и попросить выжать из неё план миграции сервера, то оно наверняка окупится.Технические характеристики
У Gemini 3 Pro контекстного окна — как у романиста, который решил писать эпопею в один том: до миллиона токенов на вход. Это значит, что модель спокойно проглатывает целую монорепу, пачку логов за сутки, пару PDF’ов толщиной с «Трое в лодке» и ещё останется место на десерт. А на выходе — 65 536 токенов. То есть если попросить её «пояснить, как работает всё», она вполне может попытаться.Для сравнения, ChatGPT 5.1 в режиме рассуждений держит 196k, а через API — 400k.Под капотом Gemini 3 Pro работает на архитектуре SMoE — разреженном микшере экспертов. Представьте себе не одного всезнающего гения, а толпу специалистов — один по математике, другой по коду, третий по видео. И модель сама решает, кого из них звать на сцену.Gemini 3 Pro изначально тренировали так, словно она должна понимать всё: и инструкцию к видеомагнитофону, и комиксы, и диаграмму, и расписание электричек. Поэтому она нативно мультимодальна:- Можно загрузить фото рецептов, перевести их в кулинарные статьи или построить на основе серии видео обучающие карточки.
- Разработка часто включает скриншоты интерфейсов, логи, PDF со схемами и даже короткие видеофрагменты — Gemini 3 Pro умеет учитывать всё это в одном запросе.
- Вы можете дать модели целый файл PDF или длинный видеофайл (до 45 минут с аудио) — и модель постарается понять и ответить.
- Объединить ReadMe + 10 файлов кода + CI‑логи в один контекст и попросить найти возможную причину падения билда — здесь это работает намного стабильнее, чем раньше.
Как Gemini 3 Pro ведёт себя в полях: бенчмарки
Если верить обзорам, тестам и впечатлениям журналистов, Gemini 3 Pro ворвался в мир бенчмарков как новый отличник, который не просто выучил параграф, а ещё и переписал учебник «чтобы было правильнее».

- Gemini 3 Pro и Gemini 3 Pro Image показали рекордные результаты на reasoning‑бенчмарках Humanity’s Last Exam — 37,5%/45,8% (без инструментов и с ними), ARC‑AGI-2 — 31,1%, MMMU‑Pro — 81,0%.
- Модель решает математические задачи на принципиально новом уровне — новый рекорд 23,4% на MathArena Apex.
- 81% на MMMU‑Pro (понимание изображений) и 87.6% на Video‑MMMU (понимание видео) — тоже очередные рекорды для крупных моделей.
- Модель превосходно справляется с фактическими вопросами: 72,1% на SimpleQA Verified.
Тесты и сравнения исследователей
Gemini 3 Pro вышел на ринг ровно в тот момент, когда конкуренты тоже подтянули перчатки и сделали разминку. Поэтому сравнения получились особенно показательные.Авторский батл из 11 испытаний Tom’s Guide показал явное преимущество Gemini 3: 7 побед из 11. Особенно хорошо он проявил себя в анализе документов, стратегических задачах и креативных заданиях, где нужно не просто «написать», а «написать умно».Например, в одном из экспериментов редакции Gemini 3 Pro блестяще решил творческую задачу со строгими ограничениями на количество 300 слов — он не просто следовал ограничениям, а творчески использовал их для усиления структуры текста, что сделало историю более оригинальной и впечатляющей.
«ChatGPT-5.1 успешно соблюдал ограничение на использование слов, начинающихся на буквы A–M, и представил связный рассказ с тремя сюжетными поворотами и клиффхэнгером, однако повествование ощущалось несколько натянутым, а поворот с „отражённой Амарой“ является распространённым научно‑фантастическим тропом. Gemini 3 мастерски использовал ограничение A–M, чтобы создать отчётливый, роботизированный повествовательный голос, и его три сюжетных поворота оказались более захватывающими и неожиданными, увеличивая масштаб истории от галлюцинации — до метакомментария о самом существовании».ChatGPT 5.1 перещёлкивал Gemini лишь в рутинной математике (там, где важны привычные конвенции) и в одном тесте про бизнес‑этикет. То есть реальная ситуация — обе системы сильны, просто у них разные сильные зоны.Одна из сильных сторон Gemini 3 — генерация кода. TechRadar показал пример «веб‑игры на пальцах», которую автор описал текстом, а Gemini 3 Pro мгновенно реализовал в рабочий прототип. Причём не просто «запилил что‑то», а реализовал нужное управление, дорисовал графику, улучшил механику — и, в общем, с каждой итерацией доводил игру до состояния «ну это уже хоть на itch.io выкладывай».
«В этом эксперименте Gemini 3 Pro „интуитивно угадал моё намерение“ и в итоге обошёл как ChatGPT 5.1, так и Claude 4.5 по скорости и качеству результата. В конечном итоге это едва ли можно было назвать соперничеством. Gemini 3 Pro оказался быстрее и умнее. Там, где я давал лишь минимальные ориентиры, он заполнял пробелы и воплощал мою идею игры в реальность. Казалось, Gemini 3 Pro почти интуитивно считывал мой замысел и в целом выдавал, с учётом ограничений, максимально возможный результат».Авторы отметили, что Gemini будто сам дописывал промпты. Он брал «идею между строк», достраивал недостающие части и аккуратно делал игру всё лучше. К финалу там уже была не плоская сцена, а полноценная маленькая 3D‑арена, камера тряслась при столкновениях — ну красота же.ChatGPT 5.1 и Claude Sonnet 4.5 в том же задании тоже справились добротно, но с меньшей гибкостью.
«Ежедневные» задачи: оба на равных
В бытовых запросах — вроде «подскажи подарок», «помоги с домашкой», «сделай маршрут», «разберись с умным домом» — разница между Gemini 3 и ChatGPT 5.1 становится почти косметической.TechRadar проверил:- Gemini отвечает чётко, системно, по делу.
- ChatGPT добавляет больше человечности, эмоций, небольших «историй внутри ответа».
Nano Banana Pro — что важно знать

Если текстовая версия Gemini 3 Pro — это такой академик в белом халате, который рассуждает, опираясь на стопку графиков, то Nano Banana Pro — её младший брат‑художник, который забрал у академика ноутбук, включил музыку и начал творить. Формально его ещё называют Gemini 3 Pro Image, но это уже тонкости номенклатуры.Официальный анонс Nano Banana Pro показывает богатые возможности редактирования и монтажа. Он строится на тех же алгоритмах, что и текстовая модель, поэтому может использовать расширенное понимание мира.Итак, что же умеет этот банановый гигант?
- Текст на картинке. В эпоху, когда первые генераторы рисовали надписи так, будто их писали маркером в поезде на кочках, Nano Banana Pro выглядит как звезда каллиграфии. Он почти не ошибается в буквах, шрифтах, межбуквенных расстояниях. Хочешь афишу, хочешь инфографику, хочешь табличку «Осторожно, кот!» на хинди — пожалуйста. И да, локализацию текста он умеет тоже.




- Это не магия и не зелье из подвала профессора — просто алгоритмы. Но выглядит именно как магия: до 14 исходников можно собрать в единую композицию. Причём модель сохраняет форму, выражение, структуру объектов так тщательно, что кажется, будто лично знакома с каждым персонажем. Например, 14 кукольных эскизов, собранных в единую сцену на диване. И хочешь — перекрась одежду, хочешь — поменяй прическу. Достаточно указать номер исходного файла или пару описательных слов в промпте. Сценографы, художники, дизайнеры — готовьте шампанское.

- Gemini 3 Pro Image умеет управлять параметрами снимка как профессиональный фоторедактор: — смещать фокус, — менять ракурс, — переставлять освещение — хоть симулируй съёмку на фонарик под одеялом, — менять угол съемки, — настраивать глубину резкости, — добавить другие эффекты по описанию. Всё это напоминает работу продвинутого 3D‑редактора, но делает ИИ сам, буквально по простой текстовой подсказке.


- Суперспособность: он ещё и знает, что рисует. Поскольку Nano Banana Pro подключён к знаниям Google‑поиска, он умеет проверять факты прямо во время генерации. Нужно построить карту давления воздуха на завтра? Нарисовать диаграмму электросхемы по ГОСТу? Смоделировать план завода? — Пожалуйста, заказывайте, пока горячо. По сути, это первый генератор изображений, который не просто «рисует красиво», но и подтверждает данные, на которых строит визуал.
результат Gemini 3 Pro оказался более правильным:
- В демке от Gemini я не обнаружил глюков — ввод правок происходит правильнее, даже когда «Анна» и «Борис» вводят текст одновременно.
- В прототипе модели Opus 4.5 не учтены требования к коду, связанные с перерасчётом отступов (для 2-го, 3-го и так далее пользователя): из‑за этого, как только пользователи начинают печатать одновременно, слова текста превращаются в кракозябры. Начинается нечто, напоминающее криптографию времён Шифровального отдела республики.
- разбивки на этапы,
- планирования,
- пересчёта позиций,
- создания реалистичного поведения,
- и понимания логики более расширенной, чем простое «сгенерируй HTML».

ИИ — это новый яд энергии, придающей скорость разработке и бизнесу. Gemini 3 несёт новый заряд этой энергии: и он, и другие модели уже подключили моторы GPT‑авторазума. А мы — посвящённые в эти технологии — ощущаем себя мастерами в хитроумном ангаре прогресса: знаем коды, крутим гайки, знаем, куда поставить конденсатор, чтобы модель не взорвалась эмоцией.В целом Gemini 3 Pro — это большой шаг. Gemini 3 Pro — яркий пример того, как быстро развивается ниша больших ИИ‑моделей. Он не просто чуть‑чуть лучше старого Gemini, это чуть ли не иной класс моделей.
В ближайшем будущем ждём Deep‑Think‑режим — особо «мозговитую» версию модели.
В ближайшем будущем ждём Deep‑Think‑режим — особо «мозговитую» версию модели.