AI Модели и Цены
Возможности и цены генеративных моделей и моделей эмбеддингов.
Цены указаны за 1 000 000 токенов, если не указано иное.
Супербыстрые и экономичные
Gemini 2.5 Flash Lite
Gemini 2.5 Flash-Lite — это облегченная модель логического вывода из семейства Gemini 2.5, оптимизированная для сверхнизкой задержки и экономичности. Она обеспечивает улучшенную пропускную способность, более быструю генерацию токенов и лучшую производительность в распространенных бенчмарках по сравнению с более ранними моделями Flash.
Модальность ввода
Модальность вывода
Ввод
50 ₽
Вывод
200 ₽
Google: Gemini 3.1 Flash Lite Preview
Gemini 3.1 Flash Lite Preview — это высокоэффективная модель от Google, оптимизированная для сценариев с большим объемом работы. Она превосходит Gemini 2.5 Flash Lite по общему качеству и приближается к производительности Gemini 2.5 Flash по ключевым параметрам. Улучшения охватывают ввод аудио/ASR, ранжирование фрагментов RAG, перевод, извлечение данных и автозавершение кода. Поддерживает все уровни сложности (минимальный, низкий, средний, высокий) для точного выбора оптимального соотношения цены и производительности. Цена вдвое ниже, чем у Gemini 3 Flash.
Модальность ввода
Модальность вывода
Ввод
125 ₽
Вывод
750 ₽
Google: Gemini 3.5 Flash
Gemini 3.5 Flash Lite Preview — это высокоэффективная модель от Google, оптимизированная для сценариев с большим объемом работы. Она превосходит Gemini 2.5 Flash Lite по общему качеству и приближается к производительности Gemini 2.5 Flash по ключевым параметрам. Улучшения охватывают ввод аудио/ASR, ранжирование фрагментов RAG, перевод, извлечение данных и автозавершение кода. Поддерживает все уровни сложности (минимальный, низкий, средний, высокий) для точного выбора оптимального соотношения цены и производительности. Цена вдвое ниже, чем у Gemini 3 Flash.
Модальность ввода
Модальность вывода
Ввод
125 ₽
Вывод
750 ₽
OpenAI: gpt-oss-120b
gpt-oss-120b — это открытая языковая модель смешанного экспертного обучения (Mixture-of-Experts, MoE) с 117 миллиардами параметров от OpenAI, разработанная для задач, требующих глубокого логического мышления, агентного подхода и общего назначения. Она активирует 5,1 миллиарда параметров за один проход и оптимизирована для работы на одном графическом процессоре H100 с нативным квантованием MXFP4. Модель поддерживает настраиваемую глубину логического мышления, полный доступ к цепочке рассуждений и использование нативных инструментов, включая вызов функций, просмотр и генерацию структурированных выходных данных.
Модальность ввода
Модальность вывода
Ввод
19,5 ₽
Вывод
95 ₽
Qwen: Qwen3.5-27B
Встроенная модель обработки изображений и языка Qwen3.5 27B использует линейный механизм внимания, обеспечивая быстрое время отклика при одновременном балансе между скоростью и производительностью обработки данных. Ее общие возможности сопоставимы с возможностями Qwen3.5-122B-A10B.
Модальность ввода
Модальность вывода
Ввод
97,5 ₽
Вывод
780 ₽
Быстрые модели
Anthropic: Claude Haiku 4.5
Claude Haiku 4.5 — самая быстрая и эффективная модель Anthropic, обеспечивающая возможности интеллекта, близкие к передовым, при значительно меньших затратах и задержках по сравнению с более крупными моделями Claude. Сопоставляя производительность Claude Sonnet 4 с задачами рассуждения, программирования и использования компьютера, Haiku 4.5 обеспечивает возможности передового уровня для приложений реального времени и больших объемов данных.
Модальность ввода
Модальность вывода
Ввод
500 ₽
Вывод
2500 ₽
Anthropic: Claude Sonnet 4.6
Sonnet 4.6 — это самая мощная модель класса Sonnet от Anthropic на сегодняшний день, демонстрирующая передовые показатели производительности в программировании, работе с агентами и профессиональной деятельности. Она превосходно подходит для итеративной разработки, навигации по сложной кодовой базе, сквозного управления проектами с использованием памяти, создания качественной документации и уверенного использования компьютера для веб-тестирования и автоматизации рабочих процессов.
Модальность ввода
Модальность вывода
Ввод
1500 ₽
Вывод
7500 ₽
DeepSeek: DeepSeek V4 Flash
DeepSeek V4 Flash — это оптимизированная по эффективности модель типа «смесь экспертов» (Mixture-of-Experts) от компании DeepSeek, насчитывающая в общей сложности 284 млрд параметров (из которых 13 млрд являются активными) и поддерживающая контекстное окно объемом 1 млн токенов. Она разработана для быстрого инференса и...
Модальность ввода
Модальность вывода
Ввод
100 ₽
Вывод
250 ₽
Gemini 3 Flash
Gemini 3 Flash Preview — это высокоскоростная и высокоэффективная модель мышления, разработанная для агентных рабочих процессов, многоходовых чатов и помощи в программировании. Она обеспечивает производительность, близкую к профессиональному уровню, в плане логического мышления и использования инструментов, со значительно меньшей задержкой, чем более крупные варианты Gemini, что делает её хорошо подходящей для интерактивной разработки, длительных циклов работы агентов и задач совместного программирования. По сравнению с Gemini 2.5 Flash, она обеспечивает значительное улучшение качества в области логического мышления, мультимодального понимания и надежности.
Модальность ввода
Модальность вывода
Ввод
250 ₽
Вывод
1500 ₽
Google: Gemini 2.5 Flash
Gemini 2.5 Flash — это передовая рабочая модель Google, специально разработанная для сложных задач логического мышления, программирования, математики и научных исследований. Она включает в себя встроенные возможности «размышления», позволяющие ей предоставлять ответы с большей точностью и учитывать нюансы контекста.
Модальность ввода
Модальность вывода
Ввод
150 ₽
Вывод
1250 ₽
OpenAI: GPT-4o-mini
GPT-4o mini — новейшая модель OpenAI после [GPT-4 Omni](/models/openai/gpt-4o), поддерживающая ввод текста и изображений с выводом текста. Как самая продвинутая компактная модель, она во много раз доступнее по цене, чем другие модели последних лет, и более чем на 60% дешевле, чем [GPT-3.5 Turbo](/models/openai/gpt-3.5-turbo). Она сохраняет передовые интеллектуальные возможности, будучи при этом значительно более экономичной. GPT-4o mini достигает 82% баллов в MMLU и в настоящее время занимает более высокое место, чем GPT-4, в рейтингах чатов [common leaderboards](https://arena.lmsys.org/).
Модальность ввода
Модальность вывода
Ввод
75 ₽
Вывод
300 ₽
xAI: Grok 3 Mini
Легковесная модель, которая думает, прежде чем ответить. Быстрая, умная и отлично подходит для логических задач, не требующих глубоких знаний в предметной области. Доступны исходные данные о ходе мыслительной деятельности.
Модальность ввода
Модальность вывода
Ввод
150 ₽
Вывод
250 ₽
xAI: Grok 4 Fast
Grok 4 Fast — это новейшая многомодальная модель xAI с высочайшей эффективностью и контекстным окном в 2 миллиона токенов. Она доступна в двух вариантах: без логического вывода и с логическим выводом. Подробнее о модели читайте в [новостной публикации](http://x.ai/news/grok-4-fast) xAI.
Модальность ввода
Модальность вывода
Ввод
100 ₽
Вывод
250 ₽
xAI: Grok 4.1 Fast
Grok 4.1 Fast — лучшая модель вызова агентского инструмента от xAI, которая отлично зарекомендовала себя в реальных сценариях использования, таких как поддержка клиентов и углублённые исследования. Окно контекста 2 млн.
Модальность ввода
Модальность вывода
Ввод
100 ₽
Вывод
250 ₽
Xiaomi: MiMo-V2-Flash
MiMo-V2-Flash — это модель языка программирования с открытым исходным кодом, разработанная компанией Xiaomi. Это модель типа «смесь экспертов» с общим количеством параметров 309 млрд и активными параметрами 15 млрд, использующая гибридную архитектуру внимания. MiMo-V2-Flash поддерживает переключение между гибридным и контекстным мышлением и контекстное окно размером 256 тыс. пикселей, и отлично подходит для сценариев логического мышления, программирования и работы с агентами. По результатам SWE-bench Verified и SWE-bench Multilingual, MiMo-V2-Flash занимает первое место среди моделей с открытым исходным кодом в мире, демонстрируя производительность, сравнимую с Claude Sonnet 4.5, при этом обходясь всего примерно на 3,5% дешевле.
Модальность ввода
Модальность вывода
Ввод
300 ₽
Вывод
900 ₽
Сбалансированные
Anthropic: Claude Opus 4.6
Opus 4.6 — это самая мощная модель Anthropic для программирования и выполнения длительных профессиональных задач. Она создана для агентов, работающих в рамках целых рабочих процессов, а не отдельных запросов, что делает её особенно эффективной для больших кодовых баз, сложных рефакторингов и многоэтапной отладки, разворачивающейся во времени. Модель демонстрирует более глубокое контекстное понимание, более сильную декомпозицию проблем и большую надёжность при решении сложных инженерных задач, чем предыдущие поколения. Помимо программирования, Opus 4.6 превосходно справляется с длительной работой с знаниями. Она создаёт практически готовые к использованию документы, планы и анализы за один проход и сохраняет согласованность в очень длинных выходных данных и продолжительных сессиях.
Модальность ввода
Модальность вывода
Ввод
2500 ₽
Вывод
12500 ₽
Anthropic: Claude Opus 4.7
Opus 4.7 представляет собой следующее поколение семейства моделей Opus от компании Anthropic, разработанное специально для работы с долгосрочными асинхронными агентами. Опираясь на сильные стороны версии Opus 4.6 в области написания кода и агентских функций, новая модель демонстрирует повышенную эффективность при решении сложных многоэтапных задач, а также обеспечивает более надежное выполнение агентских операций в рамках продолжительных рабочих процессов. Она проявляет особую результативность в асинхронных агентских конвейерах, где задачи разворачиваются во времени: при работе с крупными кодовыми базами, многостадийной отладке и комплексной оркестрации проектов. Помимо задач программирования, Opus 4.7 предлагает расширенные возможности для интеллектуальной работы — от подготовки черновых версий документов и создания презентаций до анализа данных. Модель сохраняет смысловую связность даже при формировании очень объемных выходных данных и в ходе длительных рабочих сессий, что делает её оптимальным выбором по умолчанию для задач, требующих последовательности, взвешенности суждений и доведения дела до конца.
Модальность ввода
Модальность вывода
Ввод
2500 ₽
Вывод
12500 ₽
Anthropic: Claude Sonnet 4.5
Claude Sonnet 4.5 — это самая продвинутая на сегодняшний день модель Sonnet от Anthropic, оптимизированная для реальных агентов и рабочих процессов кодирования. Она обеспечивает высочайшую производительность в тестах кодирования, таких как SWE-bench Verified, с улучшениями в проектировании системы, безопасности кода и соблюдении спецификаций. Модель разработана для длительной автономной работы, поддерживая непрерывность задач между сессиями и обеспечивая отслеживание прогресса на основе фактов. Sonnet 4.5 также представляет более мощные возможности для агентов, включая улучшенную оркестрацию инструментов, спекулятивное параллельное выполнение и более эффективное управление контекстом и памятью. Благодаря улучшенному отслеживанию контекста и учету использования токенов при вызове инструментов, она особенно хорошо подходит для многоконтекстных и длительных рабочих процессов. Примеры использования охватывают разработку программного обеспечения, кибербезопасность, финансовый анализ, исследовательские агенты и другие области, требующие постоянного анализа и использования инструментов.
Модальность ввода
Модальность вывода
Ввод
1500 ₽
Вывод
7500 ₽
ChatGPT V5 Mini
GPT-5 Mini — это компактная версия GPT-5, разработанная для решения более простых задач логического вывода. Она обеспечивает те же преимущества в отслеживании инструкций и настройке безопасности, что и GPT-5, но с меньшей задержкой и стоимостью. GPT-5 Mini является преемником модели o4-mini от OpenAI.
Модальность ввода
Модальность вывода
Ввод
125 ₽
Вывод
1000 ₽
DeepSeek v3.2
DeepSeek-V3.2 — это большая языковая модель, разработанная для гармоничного сочетания высокой вычислительной эффективности с мощными функциями рассуждения и производительностью использования агентных инструментов. В ней представлен механизм DeepSeek Sparse Attention (DSA), тонкозернистый механизм разреженного внимания, который снижает затраты на обучение и вывод, сохраняя при этом качество в сценариях с длинным контекстом. Масштабируемая структура постобучения с подкреплением дополнительно улучшает рассуждения, о чем свидетельствует производительность в классе GPT-5, а модель продемонстрировала результаты, достойные золотой медали на IMO и IOI 2025 года. V3.2 также использует крупномасштабный конвейер синтеза агентных задач для лучшей интеграции рассуждений в настройки использования инструментов, повышая соответствие требованиям и обобщающую способность в интерактивных средах.
Модальность ввода
Модальность вывода
Ввод
130 ₽
Вывод
190 ₽
DeepSeek: DeepSeek V4 Pro
DeepSeek V4 Pro — это масштабная модель типа «смесь экспертов» (Mixture-of-Experts) от компании DeepSeek, насчитывающая в общей сложности 1,6 трлн параметров (из которых 49 млрд являются активированными) и поддерживающая контекстное окно объемом 1 млн токенов. Она предназначена для решения задач повышенной сложности, требующих глубокой логической аргументации, написания кода и т. д.
Модальность ввода
Модальность вывода
Ввод
200 ₽
Вывод
900 ₽
Google: Gemini 3.1 Pro Preview
Gemini 3.1 Pro Preview — это передовая модель рассуждений от Google, обеспечивающая повышенную эффективность в задачах программной инженерии, более высокую надежность работы агентов и более эффективное использование токенов в рамках сложных рабочих процессов. Опираясь на мультимодальную основу серии Gemini 3, эта модель сочетает в себе высокоточное рассуждение на основе текста, изображений, видео, аудио и кода с контекстным окном объемом 1 миллион токенов.
Модальность ввода
Модальность вывода
Ввод
600 ₽
Вывод
3600 ₽
Google: Gemini 3.1 Pro Preview Custom Tools
Gemini 3.1 Pro Preview Custom Tools — это вариант модели Gemini 3.1 Pro, который улучшает механизм выбора инструментов, предотвращая чрезмерное использование универсального инструмента Bash в тех случаях, когда доступны более эффективные сторонние или пользовательские функции. Эта специализированная предварительная версия API-интерфейса существенно повышает надежность вызова функций и гарантирует, что модель будет выбирать наиболее подходящий инструмент при работе с агентами для написания кода, а также в сложных рабочих процессах, задействующих множество инструментов. Модель сохраняет ключевые преимущества Gemini 3.1 Pro, включая мультимодальные возможности анализа текста, изображений, видео, аудио и программного кода, контекстное окно объемом 1 миллион токенов, а также высокую эффективность в задачах программной инженерии.
Модальность ввода
Модальность вывода
Ввод
600 ₽
Вывод
3600 ₽
OpenAI: GPT-4o
GPT-4o («o» означает «омни») — это новейшая модель ИИ от OpenAI, поддерживающая ввод текста и изображений с выводом текста. Она сохраняет уровень интеллекта [GPT-4 Turbo](/models/openai/gpt-4-turbo), при этом вдвое быстрее и на 50% экономичнее. GPT-4o также предлагает улучшенную производительность при обработке языков, отличных от английского, и расширенные визуальные возможности.
Модальность ввода
Модальность вывода
Ввод
1250 ₽
Вывод
5000 ₽
OpenAI: GPT-5.4 Mini
GPT-5.4 mini переносит основные возможности GPT-5.4 в более быструю и эффективную модель, оптимизированную для высокопроизводительных рабочих нагрузок. Он поддерживает ввод текста и изображений с высокой производительностью в процессах логического вывода, кодирования и использования инструментов, одновременно снижая задержку и стоимость для крупномасштабных развертываний.
Модальность ввода
Модальность вывода
Ввод
375 ₽
Вывод
2250 ₽
OpenAI: GPT-5.4 Nano
GPT-5.4 nano — это наиболее облегченный и экономичный вариант семейства GPT-5.4, оптимизированный для задач, критичных к скорости и больших объемов данных. Он поддерживает текстовый и графический ввод и предназначен для сценариев использования с низкой задержкой, таких как классификация, извлечение данных, ранжирование и выполнение подсистем агентов.
Модальность ввода
Модальность вывода
Ввод
100 ₽
Вывод
625 ₽
xAI: Grok 3
Grok 3 — это новейшая модель от xAI. Это флагманская модель, превосходно подходящая для корпоративных задач, таких как извлечение данных, программирование и суммаризация текста. Обладает глубокими знаниями в области финансов, здравоохранения, права и науки.
Модальность ввода
Модальность вывода
Ввод
1500 ₽
Вывод
7500 ₽
xAI: Grok 4.20
Grok 4.20 — новейшая флагманская модель от xAI, отличающаяся лидирующей в отрасли скоростью и расширенными возможностями агентского вызова инструментов. Она сочетает в себе самый низкий на рынке уровень галлюцинаций со строгим соблюдением инструкций промптов, обеспечивая неизменно точные и достоверные ответы.
Модальность ввода
Модальность вывода
Ввод
1000 ₽
Вывод
3000 ₽
Xiaomi: MiMo-V2-Pro
MiMo-V2-Pro — это флагманская базовая модель компании Xiaomi, насчитывающая более 1 триллиона параметров и обладающая длиной контекста в 1 миллион токенов; она глубоко оптимизирована для использования в агентских сценариях. Модель отличается высокой адаптивностью к универсальным агентским фреймворкам, таким как OpenClaw. В стандартных бенчмарках PinchBench и ClawBench она занимает место среди мировых лидеров, а её воспринимаемая производительность приближается к уровню модели Opus 4.6. MiMo-V2-Pro спроектирована так, чтобы выступать в роли «мозга» агентских систем, обеспечивая оркестрацию сложных рабочих процессов, решение производственных инженерных задач и надежное достижение результатов.
Модальность ввода
Модальность вывода
Ввод
300 ₽
Вывод
900 ₽