Большой разбор

Что такое нейросеть простыми словами: разбор для тех, кто только начинает

Нейросеть — это компьютерная программа, которая учится на примерах вместо жёстких правил. Внутри неё миллиарды связанных «нейронов», каждый умеет складывать числа. Сами они тупые. А вместе — переводят речь в текст, рисуют картинки по описанию, ставят диагнозы и пишут код. Разбираем, как это работает, без формул и без AI-канцелярита.

Автор: Александр Ежов
Чтение: 22 мин
Уровень: Новичок
Обновлено: 18.05.26

Сцена первая: микроволновка, которая стала зрячей

Лет десять назад любая микроволновка с пометкой «Smart» была обманом. Внутри сидел таймер на семь программ — «рыба», «попкорн», «разогрев», «суп». Пользователь, не глядя, тыкал «попкорн», получал угольки, ругался, ставил вручную «1:30», ел.

В 2024-м одна корейская фирма выпустила микроволновку, которая через камеру смотрит на еду. Кладёшь тарелку — она опознаёт, что внутри. Лазанья. Греет под лазанью. Кладёшь две тарелки сразу — видит две, греет 2:40, а не 1:30. Никаких кнопок «рыба», никаких таблиц на стенке кухни. Камера + что-то, что эту картинку понимает.

Это «что-то» — нейросеть.

То же самое сейчас стоит в банке (опознавать подделки документов), в больнице (читать снимок МРТ), в студии (резать фон в видео), в Cursor (писать вам код, пока вы пьёте кофе). Это не семь технологий — это одна и та же штука, обученная под разные данные. Когда понимаешь это, AI перестаёт казаться магией. Становится инструментом, у которого есть устройство, ограничения и логика. Не страшное и не священное.

Этот разбор — спокойный разговор о том, как устроена эта штука. Без формул, без академизма, без «давайте погрузимся в удивительный мир». Кратко: что внутри, как учится, где работает, чем отличается от ИИ и от ChatGPT, и куда копать дальше, если зацепило.

Нейросеть в виде светящегося стеклянного мозга — нейроны и связи — Нейросеть проще всего представить как сеть связанных узлов, по которым бегает свет. Каждый узел — простой. Сеть в целом — нет.

Важно

Главное. Нейросеть — это программа, которая не следует жёстким правилам, а учится на примерах. Внутри неё миллиарды простых вычислительных узлов — «нейронов» — соединённых в слои. Каждый узел складывает входные числа с весами и пропускает через простую функцию. Когда вы «обучаете» нейросеть, вы крутите эти веса так, чтобы её ответы становились точнее. Всё, что AI умеет сегодня — от перевода текста до генерации видео — это варианты одного и того же приёма с разным набором весов и разной архитектурой.

Что такое нейросеть

Самое простое объяснение, какое только можно дать, звучит так. Представьте, что у вас есть много-много кнопок. Очень много — миллиард или больше. Каждую можно крутить от нуля до единицы. Их так много, что нельзя крутить руками. Зато можно показывать программе картинки и говорить, правильный ли ответ. Если неправильный — она сама подкручивает кнопки чуть-чуть. После миллиона показов она угадывает правильно почти всегда. Это и есть нейросеть.

Это образ. Технический перевод тот же:

«Кнопки» — это параметры (или «веса»). У GPT-4 их триллион с лишним, у LLaMA 3 70B — семьдесят миллиардов, у моделей для распознавания лиц — десятки миллионов. Число параметров примерно говорит о «мощности» сети.
«Показывать примеры» — это обучение. Учат сеть на огромном количестве данных: миллионы текстов, миллиарды картинок, петабайты записей речи.
«Подкручивать кнопки» — это алгоритм обратного распространения ошибки (backpropagation). О нём чуть позже.
«Угадывает правильно» — это inference, то есть работа сети после обучения. Когда вы пишете ChatGPT «расскажи про Питер» — это inference. Никто веса в этот момент не крутит, они уже зафиксированы.

Заметка

Слово «нейрон» в названии — историческая дань биологии. В 1943 году нейрофизиолог Уоррен Маккаллок и логик Уолтер Питтс предложили математическую модель мозговой клетки. С тех пор биологам нейробиологии прошлого века надо ещё доказать, что человеческий нейрон похож на тот, что в нейросети. Но название прижилось. Современный «искусственный нейрон» имеет с биологическим примерно столько же общего, сколько игрушечный самолёт с настоящим Boeing.

Чтобы видеть масштаб — пара дат:

1958. Фрэнк Розенблатт собирает первый работающий «перцептрон» — на 400 фотоэлементах, размером со шкаф. Он опознавал треугольники и квадраты. The New York Times писала: «электронный мозг, который скоро научится сам ходить». Не научился. Технологии не хватило.
2012. Алекс Крижевский на турнире ImageNet (соревнование «угадай, что на фотографии» из тысячи категорий) обгоняет всех конкурентов на пятнадцать процентных пунктов. Использует то, что сейчас называется CNN — свёрточные нейросети. Эра «глубокого обучения» официально стартует. Профессоры по всему миру меняют темы исследований.
2017. Восемь инженеров Google публикуют статью на сорок страниц с заголовком «Attention Is All You Need». Объясняют новую архитектуру — Transformer. Эта статья — фундамент всего, что вы видите сейчас в виде GPT, Claude, Gemini.
30 ноября 2022. OpenAI выпускает ChatGPT. За пять дней — миллион пользователей. История начинается заново.
2026. Год, в котором эта статья написана. AI пишет другие статьи, генерит видео по описанию, ставит диагнозы быстрее радиолога-стажёра и платит зарплату сорока миллионам разработчиков по всему миру.

Всё это — один и тот же приём, отточенный за семьдесят лет. Сложить много простых вычислителей. Подкрутить веса по примерам. Дать ответ.

Как нейросеть работает

Возьмём конкретный пример. На картинке — кот или собака?

Старый способ (до 2012-го): инженер сидит и руками прописывает признаки. «Если есть треугольные уши и круглая морда — собака; если уши торчат и хвост пушистый — кот». Это работает плохо. Собаки бывают с круглыми ушами. Коты сфинксы не пушистые. Программа на тысяче картинок ошибается тысячу раз.

Новый способ: даёшь сети миллион фотографий с подписями «кот»/«собака». Сеть смотрит на пиксели и сама находит закономерности. Не «треугольные уши» — а гораздо более тонкие вещи: соотношение длины тела к голове, текстуру шерсти, форму глаз. Эти признаки человек даже не смог бы объяснить. А сеть видит.

Это и есть главный фокус. Нейросеть самостоятельно находит признаки, по которым отличает один объект от другого. Программист не пишет правила. Программист пишет архитектуру (как нейроны соединены) и подаёт данные.

Один нейрон — вход, веса, выход

Если открыть нейросеть и посмотреть на один её «нейрон», увидим примерно вот что:

Входы:    x1   x2   x3   x4
Веса:     w1   w2   w3   w4
           \   |    |   /
            \  |    |  /
             сумма  +  смещение
                 ↓
           активация (например, ReLU)
                 ↓
              Выход

На вход приходит несколько чисел (x1, x2, x3…). Каждое умножается на свой вес (w1, w2, w3…). Всё складывается. К сумме добавляется константа («смещение»). Результат прогоняется через простую функцию (например, ReLU: «если число положительное — отдай как есть, если отрицательное — отдай ноль»). Получился выход.

Один нейрон — это четыре операции: умножение, сложение, добавление константы, активация. Школьная математика. На скорости современного процессора — пикосекунды.

Один нейрон сам по себе не умеет ничего. Он умеет запомнить простой паттерн в данных: «если эти числа большие, отдай большое число; иначе — ноль». Один такой нейрон может, например, выделять вертикальные линии на картинке.

Слои — где появляется магия

Самое интересное начинается, когда нейронов много и они соединены в слои.

Картинка идёт во входной слой: каждый пиксель — одно число. У картинки 1024×1024 пикселя получается миллион входов.

Дальше идёт первый скрытый слой: тысяча нейронов, каждый получает все миллион входов с весами. Что делает этот слой? Учится видеть простые штуки: линии, края, пятна одного цвета.

Второй скрытый слой видит уже не пиксели, а выводы первого слоя. То есть он работает не с «зелёным пятном в координате 100×200», а с «вертикальной линией где-то в левой части картинки». Он начинает узнавать формы: углы, изгибы, простые фигуры.

Третий слой — узоры. Четвёртый — части объектов: глаз, ухо, лапа. Пятый — целые объекты: кот, собака, диван.

И так далее, до десятков (а в современных моделях — сотен) слоёв. На последнем слое сеть выдаёт ответ: «вероятность что это кот — 87%, что собака — 12%, что попугай — 1%».

Эту иерархию никто не программирует. Никто не говорит первому слою «учись видеть линии». Сеть сама выстраивает структуру в процессе обучения — потому что это самый эффективный способ решить задачу. Если бы кто-то сидел и руками писал «как видеть кота», ему пришлось бы провести двадцать лет. Сеть приходит к похожему результату за два дня обучения.

Параметры — почему их триллион

Каждое соединение между нейронами — это один параметр. И каждый нейрон ещё имеет своё собственное «смещение» — тоже параметр. Сложите по слоям.

В очень маленькой сети (тысяча нейронов в слое, десять слоёв) выходит десятки миллионов параметров.

В большой текстовой модели — миллиарды и триллионы. У GPT-4, по слухам, около 1.7 триллиона. У Claude 4 Opus — несколько сотен миллиардов. У открытой LLaMA 3 405B — четыреста пять миллиардов.

Эти триллион параметров — это и есть знание модели. После обучения они уже не меняются (если только вы не делаете fine-tuning). Когда вы пишете GPT «расскажи про Питер» — модель не открывает базу данных. Она пропускает ваш текст через все триллион параметров и выдаёт следующее слово, основываясь на том, что эти веса «помнят» из обучающих данных.

Как нейросеть учится

Если первая часть была про анатомию — то теперь про физиологию. Что происходит, когда сеть учится.

Процесс обучения нейросети — связи прорастают и формируют узор — Обучение нейросети — это медленное проявление структуры из шума. Связи усиливаются там, где они помогают, и слабеют там, где мешают.

Этап первый: данные

Сначала нужен датасет — большой набор примеров. Для модели, которая будет писать тексты, это могут быть петабайты текста из интернета: Википедия, книги, форумы, статьи. Для модели, которая распознаёт лица — миллионы фотографий с подписями «это Иван», «это Мария». Для нейросети, которая водит беспилотный автомобиль — миллиарды кадров с дорог.

Качество датасета важнее, чем кажется. «Мусор на входе — мусор на выходе» в нейросетях работает буквально. Если в обучающих данных все коты были рыжими, сеть будет думать, что чёрный кот — это не кот.

Этап второй: ошибка

В начале обучения веса в сети случайные. Это значит, что на запрос «кот или собака?» сеть отвечает наугад. Точность — 50%, как у подбрасывания монетки.

Дальше — самое важное.

Сеть смотрит на первый пример. Скажем, картинка кота, помечена как «кот». Сеть прогоняет картинку через все слои, выдаёт ответ: «собака с уверенностью 73%». Ошибка большая — должно было быть «кот 100%».

Это число — насколько ответ далёк от правды — называется функцией потерь (loss function). Если ответ почти правильный — loss маленький. Если совсем мимо — большой.

Этап третий: обратное распространение

Дальше включается главный приём всего глубокого обучения — backpropagation. На русский это переводят как «обратное распространение ошибки», и это редкий случай, когда перевод точнее английского.

Идея простая. Ошибка получилась на последнем слое. Этот слой получил числа от предпоследнего. Предпоследний — от предыдущего. И так до самого начала. Значит, ошибка — это совокупная вина всех весов в сети. Если докрутить веса в правильную сторону — ответ станет ближе к правде.

Математически: считается, какой именно вес насколько виноват (через производные — это привет матанализу). Затем каждый вес немного сдвигается в сторону, которая уменьшает ошибку. На малюсенькую величину — например, на одну тысячную. Это называется learning rate, скорость обучения.

Сеть смотрит на второй пример. Снова считает ответ, ошибку, обратное распространение. Снова чуть-чуть подкручивает все веса.

Через миллион примеров точность поднимается с 50% до 70%. Через десять миллионов — до 95%. Через сотни миллионов с разнообразными данными — модель становится лучше людей на узких задачах вроде распознавания опухолей по МРТ.

На практике

Эволюция нейросетей для ротоскопинга в After Effects — наглядный пример скачка качества за восемь лет. В 2018-м первые AI-плагины вырезали человека из видео хуже, чем стажёр с лассо. В 2020-м — на уровне джуниор-специалиста. В 2023-м — лучше большинства специалистов вручную. В 2026-м — лучше человека в 95% сцен; вручную остаётся подправлять только границы пальцев на сложных кадрах. Внутри: всё та же нейросеть, просто данных больше и архитектура аккуратнее. Никакой магии. Только годы инкрементального обучения.

Эпохи и переобучение

Один проход по всему датасету называется эпохой (epoch). Современные модели тренируются десятки и сотни эпох. У больших языковых моделей — обычно одна-две эпохи, но датасет настолько огромен, что этого хватает.

Есть один коварный эффект — переобучение (overfitting). Если сеть слишком долго смотрит на одни и те же данные, она перестаёт понимать и начинает запоминать. Это плохо: на тренировочных примерах ответы идеальные, на новых — катастрофа. Это как студент, который зазубрил билеты, но провалится, если вопрос на экзамене сформулирован иначе.

Чтобы этого не случилось, обучение всегда делают на двух наборах данных:

Training set — на нём сеть учится.
Validation set — на нём проверяют. Если точность на training растёт, а на validation падает — пора останавливать обучение. Это и есть классический симптом переобучения.

Виды нейросетей

Архитектур много, но их можно сгруппировать по тому, с чем они работают.

CNN — свёрточные нейросети (картинки)

Это та архитектура, с которой в 2012-м всё началось. CNN — convolutional neural network, свёрточная нейросеть. Главная идея: на картинке важно где находится объект, поэтому нейроны соединены не как попало, а так, чтобы каждый смотрел на маленький участок (например, 3×3 пикселя), а вместе они скользят по всей картинке.

CNN живут до сих пор: они в каждой камере телефона (фильтр «портретный режим» — это CNN), в системах распознавания лиц на турникетах в офисах, в медицинских анализаторах снимков. Они не вытеснены — они просто не у всех на слуху, потому что Stable Diffusion и ChatGPT громче.

RNN и LSTM — последовательности (тексты, речь, музыка)

До 2017-го для всего, что разворачивается во времени — тексты, речь, музыка — использовали RNN и их «продвинутую» версию LSTM. Идея: нейросеть проходит по последовательности по одному элементу за раз и помнит предыдущее.

Проблема была в том, что RNN плохо запоминали далёкие зависимости. Если в начале текста кто-то сказал «Аня», а в конце упомянули «она» — RNN могла забыть, к кому это относится. Это убивало многие задачи.

В 2026-м RNN почти не используют. Их вытеснили…

Transformer — текст и почти всё остальное

В 2017-м команда Google в восемь человек опубликовала статью с дерзким названием «Attention Is All You Need». Они предложили архитектуру Transformer, которая решала проблему RNN элегантно: вместо последовательного прохода — одновременный взгляд на всё.

Главное в Transformer — механизм внимания (attention). Каждое слово в тексте «смотрит» на каждое другое слово и решает, насколько оно для него важно. Если в тексте есть «Аня сидит у окна. Она читает книгу» — слово «Она» обращает внимание на слово «Аня» и понимает связь.

Это оказалось революцией. На Transformer построено всё:

GPT (от OpenAI: ChatGPT, GPT-4, GPT-5)
Claude (Anthropic)
Gemini (Google)
LLaMA (Meta, открытые модели)
DeepSeek, Mistral, Qwen, Kimi — все остальные крупные модели

Также Transformer лёг в основу моделей, которые работают не только с текстом: для речи (Whisper), для картинок (Vision Transformer), для биологии (AlphaFold).

Diffusion — генерация изображений и видео

Совсем другая логика, придуманная независимо в 2015-м, но «выстрелившая» в 2022-м. Diffusion-модель работает так: она учится не сразу превращать описание в картинку, а очищать шум.

Сначала берут чёткую картинку и постепенно добавляют шум — пока не останется только цифровая каша. Тысяча шагов. Затем модель учат обращать этот процесс: давать ей шумную картинку и заставлять предсказывать, как она выглядела на шаг назад. Шаг за шагом, тысячу раз — и из чистого шума получается картинка.

Звучит странно. Работает офигенно. Все современные генераторы — Stable Diffusion, FLUX, Midjourney, DALL-E — это варианты diffusion-моделей. Видеогенераторы Sora (когда был жив), Veo, Runway — это diffusion, только в трёх измерениях (третье — время).

Где работают нейросети

В 2026-м список «где сидит AI» проще написать через отрицание: где его нет. Поэтому возьмём конкретные сферы и посмотрим, что внутри.

Применение нейросетей в медицине — врач указывает на МРТ-снимок, AI помогает в диагностике — Тихая работа. Нейросеть не заменяет врача, художника или композера — она убирает рутину и оставляет человеку решения.

Медицина

В 2024-м исследование в Nature Medicine показало, что AI-система для диагностики рака молочной железы по маммографии превзошла шесть рентгенологов на одном датасете и сравнялась со всеми вместе на другом. В 2026-м такие системы уже стоят в большинстве крупных клиник Европы и Северной Америки. Российские клиники подтягиваются медленнее, но Сеченовский университет в Москве и Алмазовский центр в Питере используют российские разработки на собственных датасетах.

Внутри — обычная CNN, обученная на сотнях тысяч снимков с разметкой. Радиолог тратит на снимок 3–5 минут. AI — 0.3 секунды. Это не «AI заменит врача» — это «врач смотрит уже на отфильтрованные случаи, тратит время на сложные».

Творчество

В видеопродакшене нейросети сейчас стоят на каждом шаге:

Ротоскопинг — вырезать актёра из фона. Раньше — час работы в After Effects. Сейчас — нажать кнопку «AI Roto», подождать 30 секунд, поправить десять кадров. Внутри — segmentation network, обученная на миллионах кадров.
Стабилизация дрона — нейросеть смотрит на движение и предсказывает «идеальную» траекторию камеры, плавно её сглаживая.
Очистка звука — отделить голос от ветра, фонового гула, чужой речи. Раньше — RX iZotope, час шаманства. Сейчас — Adobe Podcast Enhance, две секунды и готово.
Замена фона — Topaz Video AI, RunwayML, локальные модели в ComfyUI.

В графике — Stable Diffusion, FLUX, Midjourney. Художники не вымерли, но их работа сместилась с «нарисовать с нуля» на «придумать концепцию и довести нейросеть до результата». Это другая профессия. Хорошая.

Программирование

Из всех сфер — самые быстрые изменения. В 2022-м появился GitHub Copilot — он умел дописывать одну строчку. В 2024-м Cursor добавил «компосер»: ты говоришь «реализуй кнопку для фильтра», и оно пишет 50 строк сразу. В 2025-м появились агенты — Claude Code, Devin, Cursor Composer Pro — которые берут задачу одной фразой и приносят пул-реквест.

Внутри — те же языковые модели на Transformer, дообученные на миллиардах строк кода. Сами модели не «понимают» программирование. Они знают, как обычно пишут люди. Этого хватает, чтобы решать большинство рутинных задач.

Наука

В 2020-м DeepMind показал AlphaFold — нейросеть, которая предсказывает трёхмерную структуру белка по его аминокислотной последовательности. До этого задача была одной из главных в биологии — на её решение тратили десятилетия для одного белка. AlphaFold даёт ответ за минуту. К 2026-му в открытой базе уже более 200 миллионов структур.

Это не «AI заменил биологов» — это «биологи получили инструмент, ускоряющий их работу в десять тысяч раз». Похожая революция произошла в материаловедении (поиск новых сплавов), в климатологии (моделирование прогнозов), в фармакологии (поиск молекул-кандидатов на лекарства).

Бизнес и быт

Поиск в Google — давно нейросеть. Рекомендации в YouTube — нейросеть. Перевод в Google Translate — нейросеть. Распознавание лиц при разблокировке iPhone — нейросеть. Стерео-стабилизация на видео в iPhone — нейросеть. Голосовой помощник в машине — нейросеть. Антиспам в почте — нейросеть. Та самая микроволновка из пролога — нейросеть.

Когда люди в 2026-м говорят «AI повсюду», это не маркетинговый штамп. Это буквальное описание реальности.

С чем не путать

В разговорах вокруг AI много терминов, которые звучат похоже, но обозначают разные вещи. Разберём.

Нейросеть ≠ искусственный интеллект. «Искусственный интеллект» — это целое поле компьютерных наук. Туда входят и нейросети, и экспертные системы (которые работают по жёстким правилам), и алгоритмы поиска, и теория планирования. Нейросеть — один из подходов внутри AI, на сегодня самый успешный. В 1970-х AI означал в основном экспертные системы и LISP-программы; нейросети тогда были маргинальной темой.

Нейросеть ≠ ChatGPT. ChatGPT — это продукт OpenAI: чат-интерфейс над языковой моделью (LLM) GPT-4 или GPT-5. Внутри ChatGPT много нейросетей: основная языковая, отдельная для голоса (Whisper), отдельная для генерации картинок (DALL-E), отдельная для фильтрации запретного контента. Нейросеть — это структура; ChatGPT — это сервис, который использует структуры.

Нейросеть ≠ алгоритм машинного обучения. Машинное обучение — это подход (учить программу на примерах вместо жёстких правил). Нейросети — один из методов МО. Есть другие: случайный лес, градиентный бустинг, SVM. Они до сих пор используются, особенно в задачах с табличными данными (предсказание оттока клиентов, скоринг). Для картинок, текста, аудио победили нейросети.

Нейросеть ≠ глубокое обучение. Глубокое обучение — это нейросети с многими слоями (десятки и сотни). До 2012-го работали с «мелкими» сетями (два-три слоя), и они мало что умели. После того как научились эффективно тренировать «глубокие» — началась эпоха, в которой мы живём сейчас.

Частые ошибки и заблуждения

«Нейросеть думает». Не думает. Нейросеть вычисляет вероятность следующего слова (или следующего пикселя, или следующего шага). Что мы воспринимаем как «мысль» — это иллюзия, возникающая из последовательности вероятных решений. Это не делает её бесполезной — наоборот. Но это не «мышление» в человеческом смысле. Не «понимание». Не «мнение». Не «желание». Не приписывайте машине личность, которой у неё нет.

«Нейросеть всё знает». Не знает. У каждой модели есть cutoff date — момент, после которого её перестали обучать. Для современных Claude и GPT это конец 2024 или начало 2025. Что произошло позже — модель не знает. Может попытаться угадать. Это часто и есть галлюцинация — уверенный ответ на основе неполных данных.

«Нейросеть скоро всех заменит». Не заменит. Изменит — да. Профессии меняются под её влиянием уже сейчас: переводчики, иллюстраторы, junior-разработчики, копирайтеры, аналитики-стажёры. Но «заменить» подразумевает, что машина возьмёт всю работу. Этого не происходит. Происходит перераспределение: машина забирает рутину, человек оставляет за собой смысл, ответственность и сложные решения.

«Нейросеть можно научить дома на одном GPU». И да, и нет. Файнтюнинг маленькой модели под свою задачу — да, можно, особенно через LoRA. Это распространённая практика в ComfyUI-пайплайнах: берут SDXL и дообучают на 30 картинках в нужном стиле. Несколько часов на одной RTX 4090 — и готово. Но обучить большую модель с нуля — нет, это датацентр на сотни GPU и миллионы долларов электричества.

«AI = бездушная машина». AI — инструмент. Как молоток. Молотком можно построить дом или ударить человека. Сам по себе он ни добрый, ни злой. Этика — в руках использующих. И в законах, которые мы ещё пишем.

Карта дальше — куда копать

Если эта статья зацепила, и хочется глубже — у нас в словаре 146 терминов, разбитых по уровням. Не нужно читать всё подряд. Лучше двигаться по веткам.

Если только начинаете:

Начните с этих пяти статей по порядку. Они закроют 80% разговоров про AI.

AI / Искусственный интеллект — общий контекст
Машинное обучение — подход, на котором всё стоит
Глубокое обучение — где появилась современная сила
LLM — что такое большие языковые модели
Transformer — архитектура, на которой стоит GPT, Claude, Gemini

Если интересуют чат-боты и текст:

ChatGPT, Claude, Gemini — три главных ассистента 2026
Токен — единица, которой считается всё
Контекстное окно — сколько модель помнит
Промпт и Промпт-инжиниринг — как с ней разговаривать
Галлюцинации — когда модель уверенно врёт
RAG — как привязать модель к свежим данным

Если интересуют картинки и видео:

Stable Diffusion, FLUX, Midjourney — три кита генерации
ComfyUI — главный инструмент для серьёзной работы
LoRA — как дообучить под свой стиль
ControlNet — управление композицией
Diffusion-модель — теория того, как это работает

Если интересует разработка:

API — как использовать модели в коде
Function calling и Tool calling — как модель вызывает внешние действия
MCP — стандарт связи AI с инструментами
AI Agent и Agentic AI — модели, которые работают сами

И есть полный каталог 146 терминов с поиском и фильтром — открывайте оттуда что заинтересует.

Частые вопросы

Чем нейросеть отличается от обычной программы? Обычная программа работает по жёстким правилам, которые написал человек. «Если сумма больше 1000 — дай скидку 10%». Нейросеть не имеет таких правил. Она имеет миллиарды параметров и сама находит закономерности в данных. Программисту не нужно объяснять, что такое скидка — нужно показать тысячу примеров «вот сумма, вот скидка», и нейросеть выведет правило сама.

Может ли нейросеть быть «творческой»? Зависит от того, что считать творчеством. Если «создавать комбинации, которых не было в обучающих данных» — да, может. Если «иметь намерение, эмоцию, личный опыт, желание выразиться» — нет, у неё этого нет. Современный AI отлично делает «работы в стиле X». Делать работу, которая создаёт новый стиль — пока редко получается. Но мы только в начале десятилетия.

Сколько данных нужно, чтобы обучить нейросеть? Зависит от задачи. Чтобы дообучить готовую модель под свою задачу — иногда хватает 50 примеров (через LoRA). Чтобы обучить распознавание кота с нуля — нужно около миллиона картинок. Чтобы обучить большую языковую модель типа GPT-4 — триллионы токенов текста (то есть всё, что человечество написало в открытом доступе плюс много того, что закрыто).

Зачем нейросетям GPU? Главная операция в нейросети — умножение матриц. GPU (видеокарты) умеют делать тысячи таких умножений одновременно — потому что они изначально создавались для рендера трёхмерной графики, где нужно ровно то же самое. Обычный процессор (CPU) делает их по очереди и потому медленнее в 50–100 раз. NVIDIA на этом построила бизнес стоимостью в три триллиона долларов.

Что такое «галлюцинации»? Когда нейросеть уверенно говорит то, чего нет. Самая частая проблема современных языковых моделей. Спросите ChatGPT «приведи цитату из книги X страница 47» — он может написать выдуманную цитату с убедительным тоном. Это не баг и не ложь — это следствие того, как работает модель: она не «помнит» точно, она генерирует то, что похоже на правду по статистике. Проверять важные факты вручную — обязательно.

Может ли нейросеть лгать? В человеческом смысле — нет, потому что у неё нет намерения. Но она может систематически ошибаться так, что снаружи это выглядит как ложь. Особенно если в обучающих данных были искажения. Например, если все примеры в датасете были про Москву и Питер, нейросеть может думать, что других городов в России нет. Это называется байас (bias).

Заменит ли AI программистов? Не всех и не сразу. Заменит junior-программистов на простых задачах: написать форму, парсер, простую обработку данных, рутинный SQL. Senior-разработчики становятся операторами AI — описывают, что нужно, проверяют результат, отвечают за архитектуру. Это уже происходит. Профессия не исчезнет — изменится. Те, кто умеют только писать boilerplate-код, рискуют. Те, кто понимают системно — наоборот, станут продуктивнее в десять раз.

Как нейросеть может «перестать работать»? Чаще всего — не «перестаёт работать», а перестаёт быть хорошей. Например, мир меняется (новые слова, новые ситуации), а модель обучалась до этих изменений. Это называется distribution shift, и через несколько лет любая модель становится менее точной без переобучения. Также модели можно «сломать» специальными запросами — это называется prompt injection, попытка обмануть систему через текст.

Сколько стоит ChatGPT/Claude в месяц? Базовая версия в браузере — бесплатно с ограничениями. Платная подписка — $20/мес у обоих. API (для разработчиков) — оплата за токены: примерно $3 за миллион входных + $15 за миллион выходных у среднего класса моделей. На практике для личного использования $20/мес хватает с большим запасом.

С чего начать изучение, если хочется глубже? Зависит от цели. Если работать с AI как пользователь — достаточно прочитать наш словарь основ и попробовать конкретные инструменты под свою задачу (Stable Diffusion для картинок, ChatGPT для текста, Cursor для кода). Если понять, как это работает изнутри — курс «Deep Learning Specialization» от Эндрю Ына на Coursera (с переводом на русский) и книга «Глубокое обучение» от Гудфеллоу. Если построить свою модель — учить Python, потом PyTorch, потом тренироваться на маленьких задачах. Путь от нуля до уверенного дата-сайентиста — год-полтора плотной работы.

Главное

Нейросеть — это не магия и не зло. Это математическая структура, которая хорошо приближает функции, когда их обучают на достаточном количестве данных. Внутри — миллиарды простых вычислителей, связанных в слои. Учат её через ошибки: показывают примеры, измеряют, как сильно ответ далёк от правды, и подкручивают веса.

За семьдесят лет идея прошла путь от шкафа с фотоэлементами в Корнелльском университете до системы, которая пишет код, ведёт переговоры, ставит диагнозы и генерит видео по описанию. Главные прорывы — не одна гениальная идея, а накопление: больше данных, мощнее процессоры, аккуратнее архитектуры.

В 2026-м нейросеть — это инструмент. Он умеет невероятно много, но он не думает, не чувствует, не имеет желаний. Он отвечает на ваши запросы тем способом, какому его научили. От того, как вы спрашиваете, и что вы перепроверяете, зависит, насколько хорошим он окажется в вашей работе.

Если вы прошли всю эту статью до конца — у вас уже больше понимания AI, чем у 95% людей, которые ежедневно с ним работают, но не задумываются, как он устроен. Это не магия. Это инструмент. Дальше — учиться им пользоваться.

И не забудьте про словарь — он рядом, когда понадобится конкретный термин.

Карта дальше — термины из словаря

Если хотите идти глубже — вот все термины, упомянутые в этом гиде. Можно открыть в новой вкладке и читать параллельно.

Что дальше:

Словарь AI-словарь 156 терминов → Понятные определения с инфографикой и FAQ. Новости Новости AI → Главное о нейросетях за неделю. Удиви меня Случайный термин → Серендипити: попасть на что-то неожиданное.