Kimi

kimi — китайский AI-ассистент от Moonshot AI с гигантским контекстом

Раздел
Языковые модели
Обновлено
18.05.26

Kimi — AI-ассистент от китайской Moonshot AI, известный гигантским контекстным окном (до 2M токенов в Kimi K2) и сильной поддержкой китайского языка. С 2024-го один из самых популярных AI в Китае, к 2026-му Kimi K2 — open-source MoE-модель, конкурирующая с GPT-4 и Claude в reasoning-бенчмарках. Используется для анализа длинных документов: книги целиком, юридические дела, кодовые базы.

Коротко

Коротко. Kimi — это AI-ассистент от китайской Moonshot AI, основанной в 2023-м. Главная особенность — гигантское контекстное окно: до 2 миллионов токенов в Kimi K2. Это позволяет загружать целые книги, кодовые базы, юридические дела в один запрос. К 2026-му Kimi K2 — open-source MoE-модель (1T параметров total, 32B activated), доступная через kimi.com (бесплатно для большинства пользователей в Китае) и API.

Что это такое

Март 2023-го — основана Moonshot AI в Пекине, фаундер — Yang Zhilin (бывший исследователь из Карнеги-Меллон и Google AI). Через год — релиз Kimi Chat с заявленным окном в 200K токенов, что было больше, чем у любого другого публичного ассистента на тот момент.

К 2026 у Moonshot — несколько моделей:

  • Kimi K1.5 (2024) — первый flagship, 200K контекст.
  • Kimi K2 (2025) — open-source MoE, 1T total / 32B activated параметров. Главный сильный сын Moonshot.
  • Kimi Latest — последняя версия в облаке kimi.com, контекст до 2M токенов.
  • Kimi Researcherагент для глубокого исследования, аналог OpenAI Deep Research.

Главные сценарии:

  • Анализ длинных документов — загрузить книгу 300 страниц, спросить о любой детали.
  • Кодовая база целиком — закинуть все файлы проекта, попросить найти баг или объяснить архитектуру.
  • Юридические дела — десятки PDF-материалов, поиск противоречий, summary.
  • Академические работы — анализ диссертации, проверка ссылок.

В Китае Kimi занимает первое место среди публичных AI-чатов по аудитории (десятки миллионов пользователей). За пределами Китая мало известен из-за языкового барьера и геополитики, но open-source K2 захватил внимание западных AI-разработчиков.

Как это работает

Kimi K2 — Mixture of Experts (MoE):

  • Total params: ~1 триллион.
  • Activated per token: ~32 миллиарда.
  • Принцип MoE: на каждый токен активируется только часть сети («эксперты»), остальное «спит». Так модель получается умной как 1T-плотная, но быстрой как 32B.

Длинное окно достигается через комбинацию техник:

  1. Linear Attention / Mamba-варианты — линейная сложность внимания вместо квадратичной.
  2. Sparse attention — модель фокусируется только на релевантных частях длинного контекста.
  3. Сжатие контекста — старые куски сжимаются в плотные «memory» представления.
  4. Иерархическое внимание — разные слои работают с разной гранулярностью.

Это всё неуникально (похожие подходы у Gemini, Claude), но Moonshot одна из первых довела стек до production-качества.

Kimi сильно оптимизирована для китайского языка — на нём показывает результаты сильнее GPT-4. На английском — конкурентноспособна с GPT-4o, чуть слабее GPT-5/Claude Opus 4. Русский язык поддерживает, но с акцентом — иногда мешает китайские иероглифы или странные обороты.

Пример на практике

Разработчик унаследовал старый Python-проект на 80 файлов, ~50K строк кода. Нужно понять архитектуру, найти все места, где обрабатываются платежи.

Через ChatGPT (200K окно): загрузить файлы по очереди (или зипом), но Token-лимит обрежет середину. Через RAG — нужна настройка, embedding, поиск.

Через Kimi K2 (2M окно):

import openai  # Kimi совместима с OpenAI API

client = openai.OpenAI(
    api_key=KIMI_KEY,
    base_url="https://api.moonshot.cn/v1"
)

# Собираем весь проект
import os
files_content = []
for root, _, files in os.walk("./project"):
    for f in files:
        if f.endswith(".py"):
            with open(os.path.join(root, f)) as file:
                files_content.append(f"--- {f} ---\n{file.read()}")

all_code = "\n\n".join(files_content)  # ~500K токенов

response = client.chat.completions.create(
    model="kimi-latest",
    messages=[
        {"role": "system", "content": "Senior Python разработчик. Читай весь проект целиком."},
        {"role": "user", "content": f"{all_code}\n\nНайди все места, где обрабатываются платежи. Покажи file:line."}
    ]
)

Ответ за 1.5 минуты: список из 12 файлов с конкретными line-numbers, объяснение flow платежей, найденная баг (race condition при concurrent webhook). Стоимость: ~$2.

Для сравнения, RAG-pipeline для того же — день настройки + менее точный результат.

В ComfyUI прямой ноды Kimi нет, но через OpenAI-совместимый API можно собрать LLM-нод с base_url Moonshot.

С чем часто путают

  • Kimi и DeepSeek — оба китайские, оба open MoE, но разные команды и архитектуры. Kimi известен длинным контекстом, DeepSeek — reasoning и low-cost training.
  • Kimi и Qwen — Qwen от Alibaba (более крупная экосистема), Kimi от Moonshot (более узкая фокус на длинном контексте).
  • Kimi K1 и K2 — K1 (2024) — proprietary, 200K окно. K2 (2025) — open-source MoE, 2M окно.
  • Kimi и Doubao — Doubao это китайский AI от ByteDance (TikTok), отдельная модель.
  • Kimi и Manus — Manus это general agent для бизнес-задач, у него под капотом разные модели; Kimi — это базовая LLM.

Частые ошибки и заблуждения

  • «Kimi только на китайском». Поддерживает английский, русский, японский, и другие языки. На китайском работает лучше всего.
  • «Гигантское окно = всё запомнит идеально». Не идеально. Эффект «lost in the middle» сохраняется и в 2M-моделях. Старайся ставить важное в начало или конец.
  • «Kimi — это только облако». Нет, K2 — open weights, можно скачать с HuggingFace. Запуск требует кластера (1T параметров), но возможен.
  • «В России Kimi не работает». Доступен через kimi.com и API. Нужна СМС-верификация (китайский номер) или работать через OpenRouter.
  • «Kimi — копия ChatGPT». Архитектура своя, тренировочный пайплайн свой. Похож в формате chat-ассистента, но под капотом — другая система.

Связанные термины

  • LLM — общая категория, к которой относится Kimi.
  • Mixture of Experts (MoE) — архитектура K2.
  • Context Window — главное преимущество Kimi (2M токенов).
  • DeepSeek — другой китайский конкурент.
  • Qwen — третий китайский игрок (Alibaba).
  • RAG — альтернатива длинному контексту, дополняющая стратегия.

Частые вопросы

Чем Kimi принципиально лучше ChatGPT? Длинным контекстом (2M vs 200K у ChatGPT) и качеством на китайском. На большинстве английских задач сопоставимы.

Сколько стоит? В Китае kimi.com — бесплатно для большинства задач (есть лимиты). API: ~$1.5 input + $4.5 output за 1M токенов (Kimi Latest). K2 через OpenRouter — похожие цены.

Можно ли запустить локально? Kimi K2 — open weights, 1T параметров. Реальный запуск требует кластера (8+ A100/H100). Для отдельного человека — непрактично, но через провайдеры (Together, Fireworks, OpenRouter) — да.

В чём подвох гигантского контекста? Скорость и цена. Запрос на 1M токенов длится несколько минут и стоит существенно дороже, чем 10K. Реалистичный workflow — заполнять окно постепенно по необходимости.

Kimi или DeepSeek для разработки? DeepSeek чуть сильнее в чистом коде. Kimi — если код нужно анализировать в контексте всей кодовой базы (длинное окно).

Главное

Kimi — китайский AI-ассистент от Moonshot AI с двумя главными преимуществами: гигантское контекстное окно (до 2M токенов) и качественная поддержка китайского языка. К 2026 — open-source MoE Kimi K2 (1T total / 32B activated) конкурирует с GPT-4 и Claude в открытых бенчмарках. Идеален для задач, где нужно прочитать книгу/кодовую базу/набор PDF целиком. В Китае — №1 публичный AI-чат. На западе — точечно через OpenRouter и API. Регулирование китайских политических тем — жёсткое, для нейтральных задач — никаких проблем.