Цены и модели нейросетей

AI Модели и Цены

Возможности и цены генеративных моделей и моделей эмбеддингов.
Цены указаны за 1 000 000 токенов, если не указано иное.

Супербыстрые и экономичные

Gemini 2.5 Flash Lite

Размышление

Доступность: 99,89%

Gemini 2.5 Flash-Lite — это облегченная модель логического вывода из семейства Gemini 2.5, оптимизированная для сверхнизкой задержки и экономичности. Она обеспечивает улучшенную пропускную способность, более быструю генерацию токенов и лучшую производительность в распространенных бенчмарках по сравнению с более ранними моделями Flash.

Модальность ввода

Текст

Изображение

Файл

Аудио

Видео

Модальность вывода

Текст

Ввод

50 ₽

Вывод

200 ₽

Google: Gemini 3.1 Flash Lite Preview

Размышление

Доступность: 99,79%

Gemini 3.1 Flash Lite Preview — это высокоэффективная модель от Google, оптимизированная для сценариев с большим объемом работы. Она превосходит Gemini 2.5 Flash Lite по общему качеству и приближается к производительности Gemini 2.5 Flash по ключевым параметрам. Улучшения охватывают ввод аудио/ASR, ранжирование фрагментов RAG, перевод, извлечение данных и автозавершение кода. Поддерживает все уровни сложности (минимальный, низкий, средний, высокий) для точного выбора оптимального соотношения цены и производительности. Цена вдвое ниже, чем у Gemini 3 Flash.

Модальность ввода

Текст

Изображение

Видео

Файл

Аудио

Модальность вывода

Текст

Ввод

125 ₽

Вывод

750 ₽

Google: Gemini 3.5 Flash

Размышление

Доступность: 99,60%

Gemini 3.5 Flash Lite Preview — это высокоэффективная модель от Google, оптимизированная для сценариев с большим объемом работы. Она превосходит Gemini 2.5 Flash Lite по общему качеству и приближается к производительности Gemini 2.5 Flash по ключевым параметрам. Улучшения охватывают ввод аудио/ASR, ранжирование фрагментов RAG, перевод, извлечение данных и автозавершение кода. Поддерживает все уровни сложности (минимальный, низкий, средний, высокий) для точного выбора оптимального соотношения цены и производительности. Цена вдвое ниже, чем у Gemini 3 Flash.

Модальность ввода

Текст

Изображение

Видео

Файл

Аудио

Модальность вывода

Текст

Ввод

125 ₽

Вывод

750 ₽

OpenAI: gpt-oss-120b

Размышление

Доступность: 99,97%

gpt-oss-120b — это открытая языковая модель смешанного экспертного обучения (Mixture-of-Experts, MoE) с 117 миллиардами параметров от OpenAI, разработанная для задач, требующих глубокого логического мышления, агентного подхода и общего назначения. Она активирует 5,1 миллиарда параметров за один проход и оптимизирована для работы на одном графическом процессоре H100 с нативным квантованием MXFP4. Модель поддерживает настраиваемую глубину логического мышления, полный доступ к цепочке рассуждений и использование нативных инструментов, включая вызов функций, просмотр и генерацию структурированных выходных данных.

Модальность ввода

Текст

Модальность вывода

Текст

Ввод

19,5 ₽

Вывод

95 ₽

Qwen: Qwen3.5-27B

Размышление

Доступность: 99,96%

Встроенная модель обработки изображений и языка Qwen3.5 27B использует линейный механизм внимания, обеспечивая быстрое время отклика при одновременном балансе между скоростью и производительностью обработки данных. Ее общие возможности сопоставимы с возможностями Qwen3.5-122B-A10B.

Модальность ввода

Текст

Изображение

Видео

Модальность вывода

Текст

Ввод

97,5 ₽

Вывод

780 ₽

Быстрые модели

Anthropic: Claude Haiku 4.5

Размышление

Доступность: 99,74%

Claude Haiku 4.5 — самая быстрая и эффективная модель Anthropic, обеспечивающая возможности интеллекта, близкие к передовым, при значительно меньших затратах и задержках по сравнению с более крупными моделями Claude. Сопоставляя производительность Claude Sonnet 4 с задачами рассуждения, программирования и использования компьютера, Haiku 4.5 обеспечивает возможности передового уровня для приложений реального времени и больших объемов данных.

Модальность ввода

Текст

Изображение

Файл

Модальность вывода

Текст

Ввод

500 ₽

Вывод

2500 ₽

Anthropic: Claude Sonnet 4.6

Размышление

Доступность: 99,93%

Sonnet 4.6 — это самая мощная модель класса Sonnet от Anthropic на сегодняшний день, демонстрирующая передовые показатели производительности в программировании, работе с агентами и профессиональной деятельности. Она превосходно подходит для итеративной разработки, навигации по сложной кодовой базе, сквозного управления проектами с использованием памяти, создания качественной документации и уверенного использования компьютера для веб-тестирования и автоматизации рабочих процессов.

Модальность ввода

Текст

Изображение

Файл

Модальность вывода

Текст

Ввод

1500 ₽

Вывод

7500 ₽

DeepSeek: DeepSeek V4 Flash

Размышление

Доступность: 99,52%

DeepSeek V4 Flash — это оптимизированная по эффективности модель типа «смесь экспертов» (Mixture-of-Experts) от компании DeepSeek, насчитывающая в общей сложности 284 млрд параметров (из которых 13 млрд являются активными) и поддерживающая контекстное окно объемом 1 млн токенов. Она разработана для быстрого инференса и...

Модальность ввода

Текст

Модальность вывода

Текст

Ввод

100 ₽

Вывод

250 ₽

Gemini 3 Flash

Размышление

Доступность: 96,09%

Gemini 3 Flash Preview — это высокоскоростная и высокоэффективная модель мышления, разработанная для агентных рабочих процессов, многоходовых чатов и помощи в программировании. Она обеспечивает производительность, близкую к профессиональному уровню, в плане логического мышления и использования инструментов, со значительно меньшей задержкой, чем более крупные варианты Gemini, что делает её хорошо подходящей для интерактивной разработки, длительных циклов работы агентов и задач совместного программирования. По сравнению с Gemini 2.5 Flash, она обеспечивает значительное улучшение качества в области логического мышления, мультимодального понимания и надежности.

Модальность ввода

Текст

Изображение

Файл

Аудио

Видео

Модальность вывода

Текст

Ввод

250 ₽

Вывод

1500 ₽

Google: Gemini 2.5 Flash

Размышление

Доступность: 99,82%

Gemini 2.5 Flash — это передовая рабочая модель Google, специально разработанная для сложных задач логического мышления, программирования, математики и научных исследований. Она включает в себя встроенные возможности «размышления», позволяющие ей предоставлять ответы с большей точностью и учитывать нюансы контекста.

Модальность ввода

Файл

Изображение

Текст

Аудио

Видео

Модальность вывода

Текст

Ввод

150 ₽

Вывод

1250 ₽

OpenAI: GPT-4o-mini

Размышление

Доступность: 99,90%

GPT-4o mini — новейшая модель OpenAI после [GPT-4 Omni](/models/openai/gpt-4o), поддерживающая ввод текста и изображений с выводом текста. Как самая продвинутая компактная модель, она во много раз доступнее по цене, чем другие модели последних лет, и более чем на 60% дешевле, чем [GPT-3.5 Turbo](/models/openai/gpt-3.5-turbo). Она сохраняет передовые интеллектуальные возможности, будучи при этом значительно более экономичной. GPT-4o mini достигает 82% баллов в MMLU и в настоящее время занимает более высокое место, чем GPT-4, в рейтингах чатов [common leaderboards](https://arena.lmsys.org/).

Модальность ввода

Текст

Изображение

Файл

Модальность вывода

Текст

Ввод

75 ₽

Вывод

300 ₽

xAI: Grok 3 Mini

Размышление

Доступность: 99,78%

Легковесная модель, которая думает, прежде чем ответить. Быстрая, умная и отлично подходит для логических задач, не требующих глубоких знаний в предметной области. Доступны исходные данные о ходе мыслительной деятельности.

Модальность ввода

Текст

Модальность вывода

Текст

Ввод

150 ₽

Вывод

250 ₽

xAI: Grok 4 Fast

Размышление

Доступность: 99,95%

Grok 4 Fast — это новейшая многомодальная модель xAI с высочайшей эффективностью и контекстным окном в 2 миллиона токенов. Она доступна в двух вариантах: без логического вывода и с логическим выводом. Подробнее о модели читайте в [новостной публикации](http://x.ai/news/grok-4-fast) xAI.

Модальность ввода

Текст

Изображение

Файл

Модальность вывода

Текст

Ввод

100 ₽

Вывод

250 ₽

xAI: Grok 4.3

Размышление

Доступность: 100,00%

Grok 4.3 Fast — лучшая модель вызова агентского инструмента от xAI, которая отлично зарекомендовала себя в реальных сценариях использования, таких как поддержка клиентов и углублённые исследования. Окно контекста 2 млн.

Модальность ввода

Текст

Изображение

Файл

Модальность вывода

Текст

Ввод

325 ₽

Вывод

750 ₽

Xiaomi: MiMo-V2-Flash

Размышление

Доступность: 99,98%

MiMo-V2-Flash — это модель языка программирования с открытым исходным кодом, разработанная компанией Xiaomi. Это модель типа «смесь экспертов» с общим количеством параметров 309 млрд и активными параметрами 15 млрд, использующая гибридную архитектуру внимания. MiMo-V2-Flash поддерживает переключение между гибридным и контекстным мышлением и контекстное окно размером 256 тыс. пикселей, и отлично подходит для сценариев логического мышления, программирования и работы с агентами. По результатам SWE-bench Verified и SWE-bench Multilingual, MiMo-V2-Flash занимает первое место среди моделей с открытым исходным кодом в мире, демонстрируя производительность, сравнимую с Claude Sonnet 4.5, при этом обходясь всего примерно на 3,5% дешевле.

Модальность ввода

Текст

Модальность вывода

Текст

Ввод

300 ₽

Вывод

900 ₽

Сбалансированные

Anthropic: Claude Opus 4.6

Размышление

Доступность: 100,00%

Opus 4.6 — это самая мощная модель Anthropic для программирования и выполнения длительных профессиональных задач. Она создана для агентов, работающих в рамках целых рабочих процессов, а не отдельных запросов, что делает её особенно эффективной для больших кодовых баз, сложных рефакторингов и многоэтапной отладки, разворачивающейся во времени. Модель демонстрирует более глубокое контекстное понимание, более сильную декомпозицию проблем и большую надёжность при решении сложных инженерных задач, чем предыдущие поколения. Помимо программирования, Opus 4.6 превосходно справляется с длительной работой с знаниями. Она создаёт практически готовые к использованию документы, планы и анализы за один проход и сохраняет согласованность в очень длинных выходных данных и продолжительных сессиях.

Модальность ввода

Текст

Изображение

Файл

Модальность вывода

Текст

Ввод

2500 ₽

Вывод

12500 ₽

Anthropic: Claude Opus 4.7

Размышление

Доступность: 99,99%

Opus 4.7 представляет собой следующее поколение семейства моделей Opus от компании Anthropic, разработанное специально для работы с долгосрочными асинхронными агентами. Опираясь на сильные стороны версии Opus 4.6 в области написания кода и агентских функций, новая модель демонстрирует повышенную эффективность при решении сложных многоэтапных задач, а также обеспечивает более надежное выполнение агентских операций в рамках продолжительных рабочих процессов. Она проявляет особую результативность в асинхронных агентских конвейерах, где задачи разворачиваются во времени: при работе с крупными кодовыми базами, многостадийной отладке и комплексной оркестрации проектов. Помимо задач программирования, Opus 4.7 предлагает расширенные возможности для интеллектуальной работы — от подготовки черновых версий документов и создания презентаций до анализа данных. Модель сохраняет смысловую связность даже при формировании очень объемных выходных данных и в ходе длительных рабочих сессий, что делает её оптимальным выбором по умолчанию для задач, требующих последовательности, взвешенности суждений и доведения дела до конца.

Модальность ввода

Текст

Изображение

Файл

Модальность вывода

Текст

Ввод

2500 ₽

Вывод

12500 ₽

Anthropic: Claude Sonnet 4.5

Размышление

Доступность: 99,95%

Claude Sonnet 4.5 — это самая продвинутая на сегодняшний день модель Sonnet от Anthropic, оптимизированная для реальных агентов и рабочих процессов кодирования. Она обеспечивает высочайшую производительность в тестах кодирования, таких как SWE-bench Verified, с улучшениями в проектировании системы, безопасности кода и соблюдении спецификаций. Модель разработана для длительной автономной работы, поддерживая непрерывность задач между сессиями и обеспечивая отслеживание прогресса на основе фактов. Sonnet 4.5 также представляет более мощные возможности для агентов, включая улучшенную оркестрацию инструментов, спекулятивное параллельное выполнение и более эффективное управление контекстом и памятью. Благодаря улучшенному отслеживанию контекста и учету использования токенов при вызове инструментов, она особенно хорошо подходит для многоконтекстных и длительных рабочих процессов. Примеры использования охватывают разработку программного обеспечения, кибербезопасность, финансовый анализ, исследовательские агенты и другие области, требующие постоянного анализа и использования инструментов.

Модальность ввода

Текст

Изображение

Файл

Модальность вывода

Текст

Ввод

1500 ₽

Вывод

7500 ₽

ChatGPT V5 Mini

Размышление

Доступность: 96,81%

GPT-5 Mini — это компактная версия GPT-5, разработанная для решения более простых задач логического вывода. Она обеспечивает те же преимущества в отслеживании инструкций и настройке безопасности, что и GPT-5, но с меньшей задержкой и стоимостью. GPT-5 Mini является преемником модели o4-mini от OpenAI.

Модальность ввода

Текст

Изображение

Файл

Модальность вывода

Текст

Ввод

125 ₽

Вывод

1000 ₽

DeepSeek v3.2

Размышление

Доступность: 99,84%

DeepSeek-V3.2 — это большая языковая модель, разработанная для гармоничного сочетания высокой вычислительной эффективности с мощными функциями рассуждения и производительностью использования агентных инструментов. В ней представлен механизм DeepSeek Sparse Attention (DSA), тонкозернистый механизм разреженного внимания, который снижает затраты на обучение и вывод, сохраняя при этом качество в сценариях с длинным контекстом. Масштабируемая структура постобучения с подкреплением дополнительно улучшает рассуждения, о чем свидетельствует производительность в классе GPT-5, а модель продемонстрировала результаты, достойные золотой медали на IMO и IOI 2025 года. V3.2 также использует крупномасштабный конвейер синтеза агентных задач для лучшей интеграции рассуждений в настройки использования инструментов, повышая соответствие требованиям и обобщающую способность в интерактивных средах.

Модальность ввода

Текст

Модальность вывода

Текст

Ввод

130 ₽

Вывод

190 ₽

DeepSeek: DeepSeek V4 Pro

Размышление

Доступность: 99,83%

DeepSeek V4 Pro — это масштабная модель типа «смесь экспертов» (Mixture-of-Experts) от компании DeepSeek, насчитывающая в общей сложности 1,6 трлн параметров (из которых 49 млрд являются активированными) и поддерживающая контекстное окно объемом 1 млн токенов. Она предназначена для решения задач повышенной сложности, требующих глубокой логической аргументации, написания кода и т. д.

Модальность ввода

Текст

Модальность вывода

Текст

Ввод

200 ₽

Вывод

900 ₽

Google: Gemini 3.1 Pro Preview

Размышление

Доступность: 84,84%

Gemini 3.1 Pro Preview — это передовая модель рассуждений от Google, обеспечивающая повышенную эффективность в задачах программной инженерии, более высокую надежность работы агентов и более эффективное использование токенов в рамках сложных рабочих процессов. Опираясь на мультимодальную основу серии Gemini 3, эта модель сочетает в себе высокоточное рассуждение на основе текста, изображений, видео, аудио и кода с контекстным окном объемом 1 миллион токенов.

Модальность ввода

Аудио

Файл

Изображение

Текст

Видео

Модальность вывода

Текст

Ввод

600 ₽

Вывод

3600 ₽

Google: Gemini 3.1 Pro Preview Custom Tools

Размышление

Доступность: 100,00%

Gemini 3.1 Pro Preview Custom Tools — это вариант модели Gemini 3.1 Pro, который улучшает механизм выбора инструментов, предотвращая чрезмерное использование универсального инструмента Bash в тех случаях, когда доступны более эффективные сторонние или пользовательские функции. Эта специализированная предварительная версия API-интерфейса существенно повышает надежность вызова функций и гарантирует, что модель будет выбирать наиболее подходящий инструмент при работе с агентами для написания кода, а также в сложных рабочих процессах, задействующих множество инструментов. Модель сохраняет ключевые преимущества Gemini 3.1 Pro, включая мультимодальные возможности анализа текста, изображений, видео, аудио и программного кода, контекстное окно объемом 1 миллион токенов, а также высокую эффективность в задачах программной инженерии.

Модальность ввода

Текст

Аудио

Изображение

Видео

Файл

Модальность вывода

Текст

Ввод

600 ₽

Вывод

3600 ₽

OpenAI: GPT-4o

Размышление

Доступность: 99,90%

GPT-4o («o» означает «омни») — это новейшая модель ИИ от OpenAI, поддерживающая ввод текста и изображений с выводом текста. Она сохраняет уровень интеллекта [GPT-4 Turbo](/models/openai/gpt-4-turbo), при этом вдвое быстрее и на 50% экономичнее. GPT-4o также предлагает улучшенную производительность при обработке языков, отличных от английского, и расширенные визуальные возможности.

Модальность ввода

Текст

Изображение

Файл

Модальность вывода

Текст

Ввод

1250 ₽

Вывод

5000 ₽

OpenAI: GPT-5.4 Mini

Размышление

Доступность: 99,70%

GPT-5.4 mini переносит основные возможности GPT-5.4 в более быструю и эффективную модель, оптимизированную для высокопроизводительных рабочих нагрузок. Он поддерживает ввод текста и изображений с высокой производительностью в процессах логического вывода, кодирования и использования инструментов, одновременно снижая задержку и стоимость для крупномасштабных развертываний.

Модальность ввода

Файл

Изображение

Текст

Модальность вывода

Текст

Ввод

375 ₽

Вывод

2250 ₽

OpenAI: GPT-5.4 Nano

Размышление

Доступность: 99,70%

GPT-5.4 nano — это наиболее облегченный и экономичный вариант семейства GPT-5.4, оптимизированный для задач, критичных к скорости и больших объемов данных. Он поддерживает текстовый и графический ввод и предназначен для сценариев использования с низкой задержкой, таких как классификация, извлечение данных, ранжирование и выполнение подсистем агентов.

Модальность ввода

Файл

Изображение

Текст

Модальность вывода

Текст

Ввод

100 ₽

Вывод

625 ₽

xAI: Grok 3

Размышление

Доступность: 94,52%

Grok 3 — это новейшая модель от xAI. Это флагманская модель, превосходно подходящая для корпоративных задач, таких как извлечение данных, программирование и суммаризация текста. Обладает глубокими знаниями в области финансов, здравоохранения, права и науки.

Модальность ввода

Текст

Модальность вывода

Текст

Ввод

1500 ₽

Вывод

7500 ₽

xAI: Grok 4.20

Размышление

Доступность: 99,94%

Grok 4.20 — новейшая флагманская модель от xAI, отличающаяся лидирующей в отрасли скоростью и расширенными возможностями агентского вызова инструментов. Она сочетает в себе самый низкий на рынке уровень галлюцинаций со строгим соблюдением инструкций промптов, обеспечивая неизменно точные и достоверные ответы.

Модальность ввода

Текст

Изображение

Файл

Модальность вывода

Текст

Ввод

1000 ₽

Вывод

3000 ₽

Xiaomi: MiMo-V2-Pro

Размышление

Доступность: 99,90%

MiMo-V2-Pro — это флагманская базовая модель компании Xiaomi, насчитывающая более 1 триллиона параметров и обладающая длиной контекста в 1 миллион токенов; она глубоко оптимизирована для использования в агентских сценариях. Модель отличается высокой адаптивностью к универсальным агентским фреймворкам, таким как OpenClaw. В стандартных бенчмарках PinchBench и ClawBench она занимает место среди мировых лидеров, а её воспринимаемая производительность приближается к уровню модели Opus 4.6. MiMo-V2-Pro спроектирована так, чтобы выступать в роли «мозга» агентских систем, обеспечивая оркестрацию сложных рабочих процессов, решение производственных инженерных задач и надежное достижение результатов.

Модальность ввода

Текст

Модальность вывода

Текст

Ввод

300 ₽

Вывод

900 ₽

Публичная оферта Политика конфиденциальности

AI Модели и Цены

Супербыстрые и экономичные

Gemini 2.5 Flash Lite

Google: Gemini 3.1 Flash Lite Preview

Google: Gemini 3.5 Flash

OpenAI: gpt-oss-120b

Qwen: Qwen3.5-27B

Быстрые модели

Anthropic: Claude Haiku 4.5

Anthropic: Claude Sonnet 4.6

DeepSeek: DeepSeek V4 Flash

Gemini 3 Flash

Google: Gemini 2.5 Flash

OpenAI: GPT-4o-mini

xAI: Grok 3 Mini

xAI: Grok 4 Fast

xAI: Grok 4.3

Xiaomi: MiMo-V2-Flash

Сбалансированные

Anthropic: Claude Opus 4.6

Anthropic: Claude Opus 4.7

Anthropic: Claude Sonnet 4.5

ChatGPT V5 Mini

DeepSeek v3.2

DeepSeek: DeepSeek V4 Pro

Google: Gemini 3.1 Pro Preview

Google: Gemini 3.1 Pro Preview Custom Tools

OpenAI: GPT-4o

OpenAI: GPT-5.4 Mini

OpenAI: GPT-5.4 Nano

xAI: Grok 3

xAI: Grok 4.20

Xiaomi: MiMo-V2-Pro

Связь прервана

Попытка подключения

Нет соединения

Ошибка сессии