Kimi
kimi — китайский AI-ассистент от Moonshot AI с гигантским контекстом
Kimi — AI-ассистент от китайской Moonshot AI, известный гигантским контекстным окном (до 2M токенов в Kimi K2) и сильной поддержкой китайского языка. С 2024-го один из самых популярных AI в Китае, к 2026-му Kimi K2 — open-source MoE-модель, конкурирующая с GPT-4 и Claude в reasoning-бенчмарках. Используется для анализа длинных документов: книги целиком, юридические дела, кодовые базы.
Коротко
Коротко. Kimi — это AI-ассистент от китайской Moonshot AI, основанной в 2023-м. Главная особенность — гигантское контекстное окно: до 2 миллионов токенов в Kimi K2. Это позволяет загружать целые книги, кодовые базы, юридические дела в один запрос. К 2026-му Kimi K2 — open-source MoE-модель (1T параметров total, 32B activated), доступная через kimi.com (бесплатно для большинства пользователей в Китае) и API.
Что это такое
Март 2023-го — основана Moonshot AI в Пекине, фаундер — Yang Zhilin (бывший исследователь из Карнеги-Меллон и Google AI). Через год — релиз Kimi Chat с заявленным окном в 200K токенов, что было больше, чем у любого другого публичного ассистента на тот момент.
К 2026 у Moonshot — несколько моделей:
- Kimi K1.5 (2024) — первый flagship, 200K контекст.
- Kimi K2 (2025) — open-source MoE, 1T total / 32B activated параметров. Главный сильный сын Moonshot.
- Kimi Latest — последняя версия в облаке kimi.com, контекст до 2M токенов.
- Kimi Researcher — агент для глубокого исследования, аналог OpenAI Deep Research.
Главные сценарии:
- Анализ длинных документов — загрузить книгу 300 страниц, спросить о любой детали.
- Кодовая база целиком — закинуть все файлы проекта, попросить найти баг или объяснить архитектуру.
- Юридические дела — десятки PDF-материалов, поиск противоречий, summary.
- Академические работы — анализ диссертации, проверка ссылок.
В Китае Kimi занимает первое место среди публичных AI-чатов по аудитории (десятки миллионов пользователей). За пределами Китая мало известен из-за языкового барьера и геополитики, но open-source K2 захватил внимание западных AI-разработчиков.
Как это работает
Kimi K2 — Mixture of Experts (MoE):
- Total params: ~1 триллион.
- Activated per token: ~32 миллиарда.
- Принцип MoE: на каждый токен активируется только часть сети («эксперты»), остальное «спит». Так модель получается умной как 1T-плотная, но быстрой как 32B.
Длинное окно достигается через комбинацию техник:
- Linear Attention / Mamba-варианты — линейная сложность внимания вместо квадратичной.
- Sparse attention — модель фокусируется только на релевантных частях длинного контекста.
- Сжатие контекста — старые куски сжимаются в плотные «memory» представления.
- Иерархическое внимание — разные слои работают с разной гранулярностью.
Это всё неуникально (похожие подходы у Gemini, Claude), но Moonshot одна из первых довела стек до production-качества.
Kimi сильно оптимизирована для китайского языка — на нём показывает результаты сильнее GPT-4. На английском — конкурентноспособна с GPT-4o, чуть слабее GPT-5/Claude Opus 4. Русский язык поддерживает, но с акцентом — иногда мешает китайские иероглифы или странные обороты.
Пример на практике
Разработчик унаследовал старый Python-проект на 80 файлов, ~50K строк кода. Нужно понять архитектуру, найти все места, где обрабатываются платежи.
Через ChatGPT (200K окно): загрузить файлы по очереди (или зипом), но Token-лимит обрежет середину. Через RAG — нужна настройка, embedding, поиск.
Через Kimi K2 (2M окно):
import openai # Kimi совместима с OpenAI API
client = openai.OpenAI(
api_key=KIMI_KEY,
base_url="https://api.moonshot.cn/v1"
)
# Собираем весь проект
import os
files_content = []
for root, _, files in os.walk("./project"):
for f in files:
if f.endswith(".py"):
with open(os.path.join(root, f)) as file:
files_content.append(f"--- {f} ---\n{file.read()}")
all_code = "\n\n".join(files_content) # ~500K токенов
response = client.chat.completions.create(
model="kimi-latest",
messages=[
{"role": "system", "content": "Senior Python разработчик. Читай весь проект целиком."},
{"role": "user", "content": f"{all_code}\n\nНайди все места, где обрабатываются платежи. Покажи file:line."}
]
)
Ответ за 1.5 минуты: список из 12 файлов с конкретными line-numbers, объяснение flow платежей, найденная баг (race condition при concurrent webhook). Стоимость: ~$2.
Для сравнения, RAG-pipeline для того же — день настройки + менее точный результат.
В ComfyUI прямой ноды Kimi нет, но через OpenAI-совместимый API можно собрать LLM-нод с base_url Moonshot.
С чем часто путают
- Kimi и DeepSeek — оба китайские, оба open MoE, но разные команды и архитектуры. Kimi известен длинным контекстом, DeepSeek — reasoning и low-cost training.
- Kimi и Qwen — Qwen от Alibaba (более крупная экосистема), Kimi от Moonshot (более узкая фокус на длинном контексте).
- Kimi K1 и K2 — K1 (2024) — proprietary, 200K окно. K2 (2025) — open-source MoE, 2M окно.
- Kimi и Doubao — Doubao это китайский AI от ByteDance (TikTok), отдельная модель.
- Kimi и Manus — Manus это general agent для бизнес-задач, у него под капотом разные модели; Kimi — это базовая LLM.
Частые ошибки и заблуждения
- «Kimi только на китайском». Поддерживает английский, русский, японский, и другие языки. На китайском работает лучше всего.
- «Гигантское окно = всё запомнит идеально». Не идеально. Эффект «lost in the middle» сохраняется и в 2M-моделях. Старайся ставить важное в начало или конец.
- «Kimi — это только облако». Нет, K2 — open weights, можно скачать с HuggingFace. Запуск требует кластера (1T параметров), но возможен.
- «В России Kimi не работает». Доступен через kimi.com и API. Нужна СМС-верификация (китайский номер) или работать через OpenRouter.
- «Kimi — копия ChatGPT». Архитектура своя, тренировочный пайплайн свой. Похож в формате chat-ассистента, но под капотом — другая система.
Связанные термины
- LLM — общая категория, к которой относится Kimi.
- Mixture of Experts (MoE) — архитектура K2.
- Context Window — главное преимущество Kimi (2M токенов).
- DeepSeek — другой китайский конкурент.
- Qwen — третий китайский игрок (Alibaba).
- RAG — альтернатива длинному контексту, дополняющая стратегия.
Частые вопросы
Чем Kimi принципиально лучше ChatGPT? Длинным контекстом (2M vs 200K у ChatGPT) и качеством на китайском. На большинстве английских задач сопоставимы.
Сколько стоит? В Китае kimi.com — бесплатно для большинства задач (есть лимиты). API: ~$1.5 input + $4.5 output за 1M токенов (Kimi Latest). K2 через OpenRouter — похожие цены.
Можно ли запустить локально? Kimi K2 — open weights, 1T параметров. Реальный запуск требует кластера (8+ A100/H100). Для отдельного человека — непрактично, но через провайдеры (Together, Fireworks, OpenRouter) — да.
В чём подвох гигантского контекста? Скорость и цена. Запрос на 1M токенов длится несколько минут и стоит существенно дороже, чем 10K. Реалистичный workflow — заполнять окно постепенно по необходимости.
Kimi или DeepSeek для разработки? DeepSeek чуть сильнее в чистом коде. Kimi — если код нужно анализировать в контексте всей кодовой базы (длинное окно).
Главное
Kimi — китайский AI-ассистент от Moonshot AI с двумя главными преимуществами: гигантское контекстное окно (до 2M токенов) и качественная поддержка китайского языка. К 2026 — open-source MoE Kimi K2 (1T total / 32B activated) конкурирует с GPT-4 и Claude в открытых бенчмарках. Идеален для задач, где нужно прочитать книгу/кодовую базу/набор PDF целиком. В Китае — №1 публичный AI-чат. На западе — точечно через OpenRouter и API. Регулирование китайских политических тем — жёсткое, для нейтральных задач — никаких проблем.