Обзор · Все направления
Полная карта AI 2026
Все категории, архитектуры и лидеры. Нажмите на строку, чтобы перейти в раздел.
| Категория | Что делает | Архитектура | Топ-инструменты | Лидер 2026 |
|---|---|---|---|---|
| 🧠 LLM | Текст, код, рассуждение | Transformer | Claude · GPT-5.5 · Gemini · Grok | Claude Opus 4.8 |
| 🖼 Изображения | Генерация из текста | Diffusion | GPT Image 2 · Midjourney · FLUX 2 · Imagen 4 | GPT Image 2 |
| 🎬 Видео | Текст/фото → клип | Diffusion Transformer | Kling v3 · HappyHorse-1.0 · Seedance 2.0 · Veo 3.1 | Kling v3 / HappyHorse |
| 🎵 Музыка | Текст → трек с вокалом | Audio Diffusion | Suno · Udio · AIVA · Lyria | Suno v5.5 |
| 🎙 Голос/TTS | Синтез речи, STT | STT + LLM + TTS | ElevenLabs · Deepgram · Cartesia | ElevenLabs |
| 💻 Код/Dev | AI-ассистент разработчика | LLM + IDE | Claude Code · Cursor · Copilot | Cursor + Claude Code |
| ⚡ Vibe Coding | Описание → приложение | LLM + Scaffolding | Lovable · Bolt.new · v0 · Replit | Lovable |
| 🤖 Агенты | Автономные задачи | LLM + Tools + Memory | LangGraph · Make · Vapi | LangGraph / Make |
| 🧊 3D | Текст/фото → 3D-модель | Diffusion + NeRF | Meshy · Tripo · FlashWorld | Meshy / Tripo |
| 🔍 AI Search | Поиск с источниками | LLM + Search index | Perplexity · Grok · Gemini | Perplexity |
Ключевой инсайт
LLM — мозг почти всего. Картинки, видео и музыка создаются диффузионными моделями — отдельной архитектурой. Но граница стирается: GPT-5.5 и Gemini работают с текстом, изображениями, аудио и видео одновременно. Агент — это LLM с инструментами и циклом планирования.
Категория 1 · Основа большинства AI-продуктов
LLM — Большие языковые модели
Трансформерные нейросети, обученные на огромных текстовых массивах. Понимают и генерируют текст, пишут код, рассуждают, строят планы. Это «мозг» почти всех современных AI-продуктов: чат-ботов, агентов, поиска, инструментов разработки.
61.4
Claude Opus 4.8 · Intelligence Index #1
500+
models released in Q1 2026
2M
token context · Grok 4
94.3%
GPQA Diamond · Gemini 3.1 Pro
✦
Лучшая модель июня 2026 по общему индексу (61.4). Лидирует в коде и работе с длинными документами. Claude Code — основа Cursor и Windsurf.
AI
Лучший универсал. На 60% меньше галлюцинаций. Самая большая экосистема: плагины, Canvas, ChatGPT, API у 77% компаний Fortune 500.
G
Лидер по научному рассуждению: GPQA Diamond 94.3%. Встроен в Google Workspace. Лучшее соотношение цена/качество среди фронтирных моделей.
𝕏
2M токенов контекста — рекорд рынка. Реальные данные через X/Twitter. Сильные агентные сценарии по цене ниже GPT-5.5.
f
Лучшие открытые веса рынка. Запускается локально, файн-тюнинг без подписки. Основа тысяч корпоративных решений.
DS
90% качества GPT-5 при стоимости в 50 раз ниже. R1 — рассуждатель с открытым chain-of-thought.
MI
Единственный сильный европейский игрок. GDPR by design, данные в ЕС. Ключевой выбор для европейских компаний.
CO
Не чат-бот — инфраструктурная модель. RAG поверх корпоративных данных, Embeddings, поиск по базам знаний.
Уровни мышления модели
Instant
Standard / Fast
Мгновенный ответ без обдумывания. Подходит для простых задач: перевод, саммари, короткий текст, быстрый вопрос-ответ. Самый дешёвый и быстрый режим.
Перевод
Саммари
Простые ответы
GPT-4o · Claude Sonnet · Gemini Flash
Thinking
Chain-of-Thought / Reasoning
Модель думает вслух перед ответом — видны шаги рассуждения. Лучше для сложных задач: анализ, стратегия, код с логикой, многошаговые вычисления.
Анализ
Сложный код
Стратегия
Claude Opus · o3 · DeepSeek R1
Extended Thinking
Deep Research / Max Tokens
Модель тратит значительное время на глубокое исследование перед ответом. Для научных задач, сложных кейсов, конкурентного анализа. Дорого, но качество — максимальное.
Исследования
Сложный анализ
Кейсы
Claude Opus (max) · o3 Pro · Gemini Deep Think
Практический совет
Одна задача — один и тот же промпт — но разный режим мышления может дать принципиально разный результат. Попробуйте отправить сложный вопрос сначала в стандартном режиме, затем включить Extended Thinking — разница очевидна.
Категория 2 · Диффузионные модели
Генерация изображений
Отдельная архитектура — не LLM. Работают с пикселями через диффузию. Рынок разделился: разные модели выигрывают по фотореализму, художественному стилю и рендерингу текста.
Как работает генерация изображений
📝 Prompt
→
Text Encoder
CLIP / T5
CLIP / T5
→
Diffusion model
noise → image
noise → image
→
VAE Decoder
→
🖼 Result
MJ
Галерейная эстетика, нативный 2K, режим HD. Изображения выглядят концептуально спроектированными. Уникальный узнаваемый стиль.
FL
Лидер фотореализма. Открытая модель с высокой точностью следования промптам. Доступна через API и локально.
IM
Лучший по рендерингу текста внутри изображений и точному изображению лиц. Через Google AI Studio и Vertex AI.
ID
Лидер типографики — читаемый текст в изображениях с минимальными ошибками. Идеален для логотипов и баннеров.
FF
Обучена только на лицензированных данных — юридически чистое коммерческое использование. Интегрирована в Creative Cloud.
SD
Самая кастомизируемая: тысячи LoRA, полный контроль через код. Бесплатный самостоятельный запуск.
Категория 3 · Diffusion Transformer
Генерация видео
Все серьёзные модели 2026 — диффузионные трансформеры. Ключевой вопрос: принимает ли модель аудио, сколько входных файлов, есть ли синхронизация звука.
🔊 Нужен звук в видео?
→ Veo 3.1
🎬 Нарративная история?
→ Seedance 2.0
💃 Динамика и движение?
→ Kling 3.0
🏭 Проф. пайплайн / API?
→ Runway Gen-4.5
SE
Первое место. До 9 изображений + 3 видео + 3 аудио за одну генерацию. Синхронный звук+видео. ~$0.30 за клип.
VE
Нативный 4K, 48kHz синхронная речь — монополия по аудио внутри видео. Диалог и звук прямо в кадре.
KL
Нативный 4K/60fps, мультиязычный lip-sync. 4 версии в топ-10 лидерборда. Лучший для динамичного контента.
HH
ELO 1357 — #1 Artificial Analysis без-аудио. 15B параметров, 7-языковой lip-sync (DE, EN, JA, KO, ZH, RU, FR), 1080p. Доступна через fal.ai API.
RW
Лучшая зрелость API для профессионального производства. Консистентность персонажей через несколько сцен.
⚠
Sora 2 — DEPRECATED
OpenAI · Closed Apr 26, 2026
Закрыт 26.04.2026. API отключается 24.09.2026. Новые проекты строить нельзя.
Категория 4 · Audio Diffusion
Генерация музыки
Полный трек с вокалом из текстового промпта — реальность 2026. Сложно отличить от студийной записи. Крупные лейблы уже заключили соглашения с Suno и Udio.
SU
«iPhone AI-музыки» — просто работает. Вокал: шёпот, вибрато, эмоции. Войс-клонинг и Suno Studio DAW с марта 2026.
UD
«Android AI-музыки» — больше контроля. Inpainting: регенерировать только куплет или бридж. Стемы по отдельности. ⚠️ В 2026 шеринг треков возможен только внутри платформы.
AV
Лидер для оркестровых и кинематографических саундтреков. Полное авторское право на Pro-плане. MIDI-экспорт.
MC
Полный доступ к весам, без лимитов, можно файн-тюнить. Нужны GPU и Python.
Категория 5 · STT + LLM + TTS
Голос и синтез речи
Три слоя: STT «уши», LLM «мозг», TTS «голос». В 2026 объединяются в end-to-end агентов с задержкой 40–90ms.
Стек голосового агента
🎤 Speech
→
STT
Deepgram / Whisper
Deepgram / Whisper
→
LLM
GPT-5 / Claude
GPT-5 / Claude
→
TTS
ElevenLabs / Cartesia
ElevenLabs / Cartesia
→
🔊 Response
11
Лидер реалистичного синтеза. 220+ голосов, 40+ языков. Клонирование голоса за секунды.
CA
Самый быстрый TTS: 40–90ms до первого звука. Идеален для real-time разговоров с агентами.
DG
Nova-3 STT + Aura-2 TTS в одном endpoint. Переключение языка во время звонка.
HG
Talking-head видео с lip-sync. Дублирование на 100+ языков. Для обучающего контента и локализации.
Категория 6 · LLM + IDE Tooling
AI-инструменты для разработки
В 2026 пишут целые фичи, рефакторят сотни файлов, закрывают GitHub Issues автономно. 84% разработчиков используют AI ежедневно. Рынок: $12.8B.
80%+
SWE-bench top tools
55%
faster tasks with Copilot
15M
Copilot users
$12.8B
market 2026
CC
Терминальный агент — работает в командной строке, читает весь кодбейз, создаёт PR. Основа Cursor и Windsurf.
CU
VS Code форк с AI в каждом слое. 72% acceptance rate автокомплита. 1M+ пользователей.
GH
Работает во всех IDE: VS Code, JetBrains, Neovim, Xcode. Нулевая миграция. Copilot Agent: Issue → PR автономно.
WS
AI-IDE с визуализацией кодбейза (Codemaps) и каскадным агентом. Хорошая альтернатива Cursor по цене.
Оптимальная связка 2026
Cursor — ежедневная работа в IDE + Claude Code — тяжёлый рефакторинг и автономные задачи. Стандарт де-факто у профессиональных разработчиков.
Категория 7 · No-code App Builders
⚡ Vibe Coding
Опишите приложение текстом — получите готовый код, дизайн и деплой. Не только для разработчиков. Один из самых быстрорастущих сегментов 2026 года.
LV
«Опиши и получи готовое веб-приложение». React + Tailwind, деплой одной кнопкой, интеграция Supabase.
BT
Полная среда разработки прямо в браузере. Быстрый прототип без установки. Множество фреймворков.
v0
Генерирует React-компоненты и UI из текстового описания. Идеален для прототипирования интерфейсов.
RP
Облачная IDE с AI-агентом. Деплой одной командой. Отлично для обучения и быстрых MVP.
Категория 8 · LLM + Tools + Memory
AI-агенты и автоматизация
Агент = LLM + инструменты + память + цикл планирования. Работает автономно: ищет в интернете, пишет код, управляет файлами, звонит клиентам.
Три уровня агентного стека
Frameworks
LangChain · LangGraph
LangChain · LangGraph
→
Low-code
Make · n8n · Zapier
Make · n8n · Zapier
→
Ready agents
OpenAI Operator · Vapi
OpenAI Operator · Vapi
→
Voice agents
ElevenAgents · Deepgram
ElevenAgents · Deepgram
LC
Стандартный Python-фреймворк для агентных систем. LangGraph — для сложных многошаговых графов. Основа enterprise AI.
MK
Визуальный конструктор рабочих процессов. Соединяет AI с 1000+ приложениями без кода.
VA
Real-time голосовые агенты с телефонией. Автоматизация входящих и исходящих звонков.
ME
Генерация 3D-моделей из текста или изображения. Для игр и продуктовой визуализации.
PX
Search-native AI. Отвечает с источниками в реальном времени. Конкурирует с Google для исследований.
Практика · Бизнес и личное использование
Цели использования AI
Практические сценарии применения AI в бизнесе и повседневной жизни.
Для бизнеса и фрилансеров
💰
Продажи и CRM
HubSpot AI · Clay · Apollo
AI обрабатывает лиды, пишет follow-up, персонализирует коммуникацию на масштабе.
⚙️
Автоматизация процессов
Make · Copilot · Notion AI
Почта, задачи, Excel, Notion — AI встраивается в существующие рабочие процессы без изменения привычек.
📊
Аналитика и KPI
Julius AI · ChatGPT ADA
Сводки данных, отчёты, прогнозы. Julius AI и Advanced Data Analysis анализируют CSV за секунды.
💬
Клиентская поддержка
Intercom Fin · Ada
Чат-боты, автоответы, база знаний. Fin от Intercom закрывает 60% тикетов без участия человека.
✍️
Контент под ключ
Buffer · Taplio · Lovable
Контент-планы, посты, переработка. Lovable/v0 для лендингов. AI пишет — человек редактирует и публикует.
🔗
Лидогенерация
LinkedIn · Clay · Apollo
LinkedIn аутрич, lead magnets, SEO-контент. Публичные данные с согласием пользователя — в рамках законодательства.
🗂
Структурирование бизнеса
Claude · GPT-5
Описание и систематизация рабочих процессов. AI генерирует SOP, регламенты, помогает навести порядок в хаосе.
👥
HR и найм
Claude · Copilot
Скрининг резюме, генерация описаний вакансий, онбординг. Экономит до 70% времени HR-специалиста.
Для личного использования и карьеры
🎬
Reels / Shorts
Kling · Veo · Runway
AI-видео для соцсетей. Текст → клип за минуты.
🌐
Сайт за вечер
Lovable · Bolt · v0
Портфолио или лендинг без кода за 2–3 часа.
📄
CV / Lebenslauf
Claude · GPT-5
Адаптация резюме и сопроводительного письма под конкретную вакансию за минуты.
🏛
Бюрократический помощник
Claude · GPT-5
Behördenbrief, Widerspruch, Formulare — AI пишет официальные письма на немецком языке.
🌍
Перевод и мультиязычность
DeepL · Claude · Gemini
Синхронный перевод в реальном времени. DE / RU / EN и ещё 50+ языков.
🎵
Музыка без авторских прав
Suno · Udio · AIVA
Джингл, фоновая музыка, озвучка — без нарушения copyright.
📚
AI-тьютор и апскиллинг
Claude · GPT-5 · Gemini
Персональный тьютор по любой теме. Объясняет, практикует, даёт обратную связь.
Важно · Германия / ЕС
DSGVO и AI — обязательный чеклист
Прежде чем использовать AI в бизнесе в Германии — прочитайте это. Штрафы реальные.
⚠️
Не загружать данные клиентов
Имена, email, телефоны, паспорта нельзя загружать в публичные AI без понимания, где они хранятся. ChatGPT — сервер в США.
📧
Email-рассылки только с согласия
AI-рассылки и авто-скрипты — только при наличии Opt-in согласия. Без согласия = нарушение DSGVO и штраф.
🇪🇺
EU-хостинг и DPA-договор
Предпочтительно: Mistral (Франция), Aleph Alpha (Германия). Или заключите DPA (Data Processing Agreement) с провайдером.
🔍
Минимизация данных
AI не нужен доступ ко всей базе клиентов. Давайте только необходимое для конкретной задачи.
💬
Прозрачность с клиентом
Если клиент общается с AI-чат-ботом — он должен об этом знать. Скрытое использование AI нарушает DSGVO.
✅
Безопасные инструменты
Mistral, Aleph Alpha — GDPR by design. Microsoft Copilot Enterprise — допустимо с DPA. ChatGPT Team/Enterprise — есть DPA, но серверы в США.
Практическое правило
Если бы вы не отправили этот документ незнакомцу по email — не загружайте его в публичный AI. Быстрый тест на DSGVO-совместимость.