AI Модели и Цены
Возможности и цены генеративных моделей и моделей эмбеддингов.
Цены указаны за 1 000 000 токенов, если не указано иное.
Супербыстрые и экономичные
Gemini 2.5 Flash Lite
Gemini 2.5 Flash-Lite — это облегченная модель логического вывода из семейства Gemini 2.5, оптимизированная для сверхнизкой задержки и экономичности. Она обеспечивает улучшенную пропускную способность, более быструю генерацию токенов и лучшую производительность в распространенных бенчмарках по сравнению с более ранними моделями Flash.
Модальность ввода
Модальность вывода
Ввод
50 ₽
Вывод
200 ₽
Google: Gemini 3.1 Flash Lite Preview
Gemini 3.1 Flash Lite Preview — это высокоэффективная модель от Google, оптимизированная для сценариев с большим объемом работы. Она превосходит Gemini 2.5 Flash Lite по общему качеству и приближается к производительности Gemini 2.5 Flash по ключевым параметрам. Улучшения охватывают ввод аудио/ASR, ранжирование фрагментов RAG, перевод, извлечение данных и автозавершение кода. Поддерживает все уровни сложности (минимальный, низкий, средний, высокий) для точного выбора оптимального соотношения цены и производительности. Цена вдвое ниже, чем у Gemini 3 Flash.
Модальность ввода
Модальность вывода
Ввод
125 ₽
Вывод
750 ₽
OpenAI: gpt-oss-120b
gpt-oss-120b — это открытая языковая модель смешанного экспертного обучения (Mixture-of-Experts, MoE) с 117 миллиардами параметров от OpenAI, разработанная для задач, требующих глубокого логического мышления, агентного подхода и общего назначения. Она активирует 5,1 миллиарда параметров за один проход и оптимизирована для работы на одном графическом процессоре H100 с нативным квантованием MXFP4. Модель поддерживает настраиваемую глубину логического мышления, полный доступ к цепочке рассуждений и использование нативных инструментов, включая вызов функций, просмотр и генерацию структурированных выходных данных.
Модальность ввода
Модальность вывода
Ввод
19,5 ₽
Вывод
95 ₽
Qwen: Qwen3.5-27B
Встроенная модель обработки изображений и языка Qwen3.5 27B использует линейный механизм внимания, обеспечивая быстрое время отклика при одновременном балансе между скоростью и производительностью обработки данных. Ее общие возможности сопоставимы с возможностями Qwen3.5-122B-A10B.
Модальность ввода
Модальность вывода
Ввод
97,5 ₽
Вывод
780 ₽
Быстрые модели
Anthropic: Claude Haiku 4.5
Claude Haiku 4.5 — самая быстрая и эффективная модель Anthropic, обеспечивающая возможности интеллекта, близкие к передовым, при значительно меньших затратах и задержках по сравнению с более крупными моделями Claude. Сопоставляя производительность Claude Sonnet 4 с задачами рассуждения, программирования и использования компьютера, Haiku 4.5 обеспечивает возможности передового уровня для приложений реального времени и больших объемов данных.
Модальность ввода
Модальность вывода
Ввод
500 ₽
Вывод
2500 ₽
Anthropic: Claude Sonnet 4.6
Sonnet 4.6 — это самая мощная модель класса Sonnet от Anthropic на сегодняшний день, демонстрирующая передовые показатели производительности в программировании, работе с агентами и профессиональной деятельности. Она превосходно подходит для итеративной разработки, навигации по сложной кодовой базе, сквозного управления проектами с использованием памяти, создания качественной документации и уверенного использования компьютера для веб-тестирования и автоматизации рабочих процессов.
Модальность ввода
Модальность вывода
Ввод
1500 ₽
Вывод
7500 ₽
Gemini 3 Flash
Gemini 3 Flash Preview — это высокоскоростная и высокоэффективная модель мышления, разработанная для агентных рабочих процессов, многоходовых чатов и помощи в программировании. Она обеспечивает производительность, близкую к профессиональному уровню, в плане логического мышления и использования инструментов, со значительно меньшей задержкой, чем более крупные варианты Gemini, что делает её хорошо подходящей для интерактивной разработки, длительных циклов работы агентов и задач совместного программирования. По сравнению с Gemini 2.5 Flash, она обеспечивает значительное улучшение качества в области логического мышления, мультимодального понимания и надежности.
Модальность ввода
Модальность вывода
Ввод
250 ₽
Вывод
1500 ₽
Google: Gemini 2.5 Flash
Gemini 2.5 Flash — это передовая рабочая модель Google, специально разработанная для сложных задач логического мышления, программирования, математики и научных исследований. Она включает в себя встроенные возможности «размышления», позволяющие ей предоставлять ответы с большей точностью и учитывать нюансы контекста.
Модальность ввода
Модальность вывода
Ввод
150 ₽
Вывод
1250 ₽
OpenAI: GPT-4o-mini
GPT-4o mini — новейшая модель OpenAI после [GPT-4 Omni](/models/openai/gpt-4o), поддерживающая ввод текста и изображений с выводом текста. Как самая продвинутая компактная модель, она во много раз доступнее по цене, чем другие модели последних лет, и более чем на 60% дешевле, чем [GPT-3.5 Turbo](/models/openai/gpt-3.5-turbo). Она сохраняет передовые интеллектуальные возможности, будучи при этом значительно более экономичной. GPT-4o mini достигает 82% баллов в MMLU и в настоящее время занимает более высокое место, чем GPT-4, в рейтингах чатов [common leaderboards](https://arena.lmsys.org/).
Модальность ввода
Модальность вывода
Ввод
75 ₽
Вывод
300 ₽
xAI: Grok 3 Mini
Легковесная модель, которая думает, прежде чем ответить. Быстрая, умная и отлично подходит для логических задач, не требующих глубоких знаний в предметной области. Доступны исходные данные о ходе мыслительной деятельности.
Модальность ввода
Модальность вывода
Ввод
150 ₽
Вывод
250 ₽
xAI: Grok 4.1 Fast
Grok 4.1 Fast — лучшая модель вызова агентского инструмента от xAI, которая отлично зарекомендовала себя в реальных сценариях использования, таких как поддержка клиентов и углублённые исследования. Окно контекста 2 млн.
Модальность ввода
Модальность вывода
Ввод
100 ₽
Вывод
250 ₽
Сбалансированные
Anthropic: Claude Opus 4.5
Claude Opus 4.5 — это передовая модель логического мышления от Anthropic, оптимизированная для сложных задач разработки программного обеспечения, агентных рабочих процессов и долгосрочного использования вычислительных ресурсов. Она предлагает мощные многомодальные возможности, конкурентоспособную производительность в реальных тестах кодирования и логического мышления, а также улучшенную устойчивость к внедрению подсказок. Модель разработана для эффективной работы на разных уровнях сложности, позволяя разработчикам выбирать между скоростью, глубиной и использованием токенов в зависимости от требований задачи. Она включает новый параметр для управления эффективностью использования токенов, доступ к которому можно получить с помощью параметра OpenRouter Verbosity, выбрав низкий, средний или высокий уровень. Opus 4.5 поддерживает расширенное использование инструментов, расширенное управление контекстом и скоординированные многоагентные конфигурации, что делает её хорошо подходящей для автономных исследований, отладки, многоэтапного планирования и работы с электронными таблицами/браузерами. Она обеспечивает существенное улучшение структурированного логического мышления, надежности выполнения и согласованности по сравнению с предыдущими поколениями Opus, одновременно снижая накладные расходы на токены и повышая производительность в длительных задачах.
Модальность ввода
Модальность вывода
Ввод
2500 ₽
Вывод
12500 ₽
Anthropic: Claude Sonnet 4.5
Claude Sonnet 4.5 — это самая продвинутая на сегодняшний день модель Sonnet от Anthropic, оптимизированная для реальных агентов и рабочих процессов кодирования. Она обеспечивает высочайшую производительность в тестах кодирования, таких как SWE-bench Verified, с улучшениями в проектировании системы, безопасности кода и соблюдении спецификаций. Модель разработана для длительной автономной работы, поддерживая непрерывность задач между сессиями и обеспечивая отслеживание прогресса на основе фактов. Sonnet 4.5 также представляет более мощные возможности для агентов, включая улучшенную оркестрацию инструментов, спекулятивное параллельное выполнение и более эффективное управление контекстом и памятью. Благодаря улучшенному отслеживанию контекста и учету использования токенов при вызове инструментов, она особенно хорошо подходит для многоконтекстных и длительных рабочих процессов. Примеры использования охватывают разработку программного обеспечения, кибербезопасность, финансовый анализ, исследовательские агенты и другие области, требующие постоянного анализа и использования инструментов.
Модальность ввода
Модальность вывода
Ввод
1500 ₽
Вывод
7500 ₽
ChatGPT V5 Mini
GPT-5 Mini — это компактная версия GPT-5, разработанная для решения более простых задач логического вывода. Она обеспечивает те же преимущества в отслеживании инструкций и настройке безопасности, что и GPT-5, но с меньшей задержкой и стоимостью. GPT-5 Mini является преемником модели o4-mini от OpenAI.
Модальность ввода
Модальность вывода
Ввод
125 ₽
Вывод
1000 ₽
DeepSeek v3.2
DeepSeek-V3.2 — это большая языковая модель, разработанная для гармоничного сочетания высокой вычислительной эффективности с мощными функциями рассуждения и производительностью использования агентных инструментов. В ней представлен механизм DeepSeek Sparse Attention (DSA), тонкозернистый механизм разреженного внимания, который снижает затраты на обучение и вывод, сохраняя при этом качество в сценариях с длинным контекстом. Масштабируемая структура постобучения с подкреплением дополнительно улучшает рассуждения, о чем свидетельствует производительность в классе GPT-5, а модель продемонстрировала результаты, достойные золотой медали на IMO и IOI 2025 года. V3.2 также использует крупномасштабный конвейер синтеза агентных задач для лучшей интеграции рассуждений в настройки использования инструментов, повышая соответствие требованиям и обобщающую способность в интерактивных средах.
Модальность ввода
Модальность вывода
Ввод
130 ₽
Вывод
190 ₽
OpenAI: GPT-4o
GPT-4o («o» означает «омни») — это новейшая модель ИИ от OpenAI, поддерживающая ввод текста и изображений с выводом текста. Она сохраняет уровень интеллекта [GPT-4 Turbo](/models/openai/gpt-4-turbo), при этом вдвое быстрее и на 50% экономичнее. GPT-4o также предлагает улучшенную производительность при обработке языков, отличных от английского, и расширенные визуальные возможности.
Модальность ввода
Модальность вывода
Ввод
1250 ₽
Вывод
5000 ₽
OpenAI: GPT-5.4 Mini
GPT-5.4 mini переносит основные возможности GPT-5.4 в более быструю и эффективную модель, оптимизированную для высокопроизводительных рабочих нагрузок. Он поддерживает ввод текста и изображений с высокой производительностью в процессах логического вывода, кодирования и использования инструментов, одновременно снижая задержку и стоимость для крупномасштабных развертываний.
Модальность ввода
Модальность вывода
Ввод
375 ₽
Вывод
2250 ₽
OpenAI: GPT-5.4 Nano
GPT-5.4 nano — это наиболее облегченный и экономичный вариант семейства GPT-5.4, оптимизированный для задач, критичных к скорости и больших объемов данных. Он поддерживает текстовый и графический ввод и предназначен для сценариев использования с низкой задержкой, таких как классификация, извлечение данных, ранжирование и выполнение подсистем агентов.
Модальность ввода
Модальность вывода
Ввод
100 ₽
Вывод
625 ₽
xAI: Grok 3
Grok 3 — это новейшая модель от xAI. Это флагманская модель, превосходно подходящая для корпоративных задач, таких как извлечение данных, программирование и суммаризация текста. Обладает глубокими знаниями в области финансов, здравоохранения, права и науки.
Модальность ввода
Модальность вывода
Ввод
1500 ₽
Вывод
7500 ₽
xAI: Grok 4 Fast
Grok 4 Fast — это новейшая многомодальная модель xAI с высочайшей эффективностью и контекстным окном в 2 миллиона токенов. Она доступна в двух вариантах: без логического вывода и с логическим выводом. Подробнее о модели читайте в [новостной публикации](http://x.ai/news/grok-4-fast) xAI.
Модальность ввода
Модальность вывода
Ввод
100 ₽
Вывод
250 ₽