Neural Network

neural network — слои искусственных нейронов, обучаемые на данных

Раздел
Основы AI
Сокращ.
NN, ANN
Обновлено
18.05.26

Нейросеть (neural network, искусственная нейронная сеть) — математическая модель, в которой простые элементы-«нейроны» собраны в слои и обмениваются числами. На вход подаются данные (пиксели, токены, звук), через слои они превращаются в ответ. Веса связей между нейронами подбираются во время обучения на миллионах примеров. Это основа почти всего современного AI: от распознавания лиц до GPT и Stable Diffusion.

Коротко

Коротко. Нейросеть — это слои простых вычислителей-«нейронов», между которыми идут числа. Каждый нейрон считает сумму входов, умножает на свои веса и пропускает через нелинейную функцию. Обучение — подбор миллионов таких весов так, чтобы на знакомых данных модель давала правильный ответ. После обучения та же сеть работает на новых примерах: фотография — «кот», фраза — следующее слово, шум — картинка.

Что это такое

Распознавание рукописной цифры. Картинка 28 × 28 пикселей, 784 числа в градации серого. Нужно по этим числам сказать, какая это цифра: 0, 1, 2 или 9.

Жёсткое правило здесь не работает. Семёрка может быть с перекладиной и без. Двойка — с петлёй внизу или без. Тысячи людей пишут по-своему. Программисту такие правила выписать вручную невозможно — слишком много вариантов.

Нейросеть подходит к задаче иначе. Она ничего не «знает» о цифрах. Внутри — слои нейронов, каждый из которых умеет одно: складывать входы с весами и пропускать сумму через простую функцию. Все вместе они образуют большую обучаемую формулу с миллионами параметров. Модели показывают 60 000 рукописных цифр с правильными подписями, и она постепенно настраивает веса так, чтобы предсказание совпадало с подписью.

Идея старая. Первые искусственные нейроны (перцептрон Розенблатта) появились в 1958 году. Долгое время сети были маленькими и слабыми. Прорыв случился в 2012-м: AlexNet выиграла соревнование по распознаванию изображений ImageNet с большим отрывом — глубокая нейросеть, обученная на видеокартах. С тех пор «нейросеть» и «современный AI» — почти синонимы.

Как это работает

Один нейрон считает простую вещь:

выход = activation(w₁·x₁ + w₂·x₂ + ... + wₙ·xₙ + b)

x — входы (от других нейронов или из исходных данных), w — веса связей, b — смещение (bias), activation — нелинейная функция, чаще всего ReLU (max(0, x)).

Сами нейроны собираются в слои:

  1. Входной слой принимает сырые данные: 784 числа для картинки 28×28, или вектор токенов для текста.
  2. Скрытые слои — основная работа сети. Каждый следующий слой получает выходы предыдущего, применяет свою матрицу весов и нелинейность.
  3. Выходной слой даёт результат в нужной форме: вероятности 10 цифр, координаты лица, следующее слово.

Чем глубже сеть (больше скрытых слоёв), тем сложнее закономерности она может уловить. На ранних слоях нейроны реагируют на простые признаки — края, линии, контраст. На средних — на формы и фрагменты (ухо, колесо, окно). На поздних — на цельные объекты (кот, машина, дом).

Обучение — это процесс подбора весов:

  1. Сети подают пример с известным ответом.
  2. Считается предсказание сети — обычно неправильное на старте.
  3. Считается ошибка (loss): насколько предсказание далеко от истины.
  4. По формуле обратного распространения (backpropagation) считается, как каждый вес повлиял на ошибку.
  5. Веса чуть сдвигаются в сторону, уменьшающую ошибку (обычно на 0.0001 за шаг).
  6. Цикл повторяется на следующем примере. И ещё миллионы раз.

Пример на практике

Художник работает над персонажем для игры. Нужно распознать в сотнях скетчей те, где фигура стоит в боевой стойке — для дальнейшей анимации.

Без нейросети — четыре часа ручного перебора. С нейросетью OpenPose, которая по фотографии или рисунку находит 17 ключевых точек скелета (плечи, локти, колени, ступни), задача занимает несколько минут.

OpenPose — это свёрточная нейросеть с десятками слоёв. На входе — RGB-картинка 368×368. На выходе — координаты 17 точек и их уверенность. Внутри ранние слои реагируют на края и контраст, средние — на части тела (рука, нога), поздние — на их пространственное расположение. Веса подобраны во время обучения на сотнях тысяч фотографий с размеченными скелетами.

То же самое работает в ComfyUI: ControlNet берёт сгенерированную карту скелета и заставляет Stable Diffusion рисовать персонажа в этой позе. Нейросеть OpenPose извлекает позу из рисунка, другая нейросеть — диффузионная — генерирует новое изображение по этой позе. Две сети, обученные по отдельности, работают вместе.

С чем часто путают

  • Нейросеть и мозг — название создаёт иллюзию аналогии. Искусственный нейрон — это просто математическая функция; биологический нейрон — клетка с тысячами тонких процессов, химией, ритмом. Сходство только метафорическое.
  • Нейросеть и AI — нейросети это конкретный подход внутри AI, ставший доминирующим. Бывают и другие: дерево решений, SVM, экспертные системы. Сейчас «AI» обычно означает именно нейросети, но это не одно и то же.
  • Нейросеть и алгоритм — обычный алгоритм пишет программист, шаги фиксированы. Нейросеть — это архитектура с миллионами свободных параметров, которые подбираются на данных. Сама архитектура алгоритм, но «программа» внутри неё пишется обучением.
  • Нейросеть и модель — модель это конкретная нейросеть после обучения: файл с числами весов. Архитектура — скелет, модель — заполненный весами экземпляр. GPT-4 и GPT-3 имеют разные архитектуры и веса, но обе называются «моделями».

Частые ошибки и заблуждения

  • Чем больше слоёв, тем умнее сеть. До определённого предела — да, но без больших данных глубокая сеть запоминает примеры наизусть и проваливается на новых (overfitting). Размер должен соответствовать задаче и объёму обучающих данных.
  • Сеть «понимает» картинку. Нет. Она реагирует на статистические паттерны. Изменение нескольких пикселей, незаметное человеку, может полностью сбить её предсказание — это называется adversarial example.
  • Нейросеть учится сама. Она учится под наблюдением — на парах «вход — правильный ответ». Без размеченных данных классическая нейросеть бессильна. Современные большие модели частично обходят это через self-supervised обучение (предсказание пропущенного слова из текста), но без массы примеров всё равно не обходятся.
  • Нейросеть = чёрный ящик навсегда. Часть архитектур (внимание в трансформерах, активации в CNN) уже частично интерпретируется через визуализации. Но в целом — да, миллионы весов остаются непрозрачными для человеческого анализа.

Связанные термины

  • Deep Learningобучение нейросетей с большим числом скрытых слоёв.
  • Machine Learning — общая дисциплина обучения программ на данных; нейросети — её часть.
  • LLM — большая языковая модель, в основе которой огромная нейросеть-трансформер.
  • GPT — конкретное семейство нейросетей, обученных предсказывать следующий токен.
  • Backpropagation — алгоритм, который позволяет считать поправки к весам через все слои сети.
  • Activation function — нелинейная функция (ReLU, sigmoid, GELU) внутри нейрона, без которой сеть теряет глубину.
  • Parameters — те самые подбираемые числа: веса и смещения нейронов.

Частые вопросы

Сколько параметров в современной нейросети? Маленькая сеть для распознавания цифр — около 100 тысяч. ResNet для классификации изображений — 25–60 миллионов. GPT-3 — 175 миллиардов. GPT-4 и Claude — точные цифры компании не раскрывают, оценки идут от сотен миллиардов до триллионов параметров.

Чем нейросеть отличается от обычной программы? В обычной программе шаги пишет программист. В нейросети шаги (умножения и сложения) фиксированы архитектурой, но коэффициенты подбираются на данных. Программа делает то, что её научили, а не то, что описано в коде.

Что такое слой в нейросети? Набор нейронов, которые получают одинаковый вход (выход предыдущего слоя) и считают свои выходы параллельно. Между слоями — матрица весов, которая описывает, как сигнал передаётся дальше.

Нужна ли видеокарта для запуска нейросети? Для обучения — почти всегда да: матричные умножения параллелятся идеально, GPU быстрее CPU в десятки раз. Для использования готовой модели (инференса) — зависит от размера. MobileNet работает на телефоне, GPT-4 — только в дата-центре.

Почему нейросеть называется так, если она не похожа на мозг? Историческая инерция. Перцептрон Розенблатта в 1958-м был задуман как модель биологического нейрона. С тех пор и архитектуры, и понимание ушли далеко в сторону, а название осталось.

Главное

Нейросеть — это большая обучаемая формула с миллионами параметров. Внутри — слои, через которые данные превращаются в ответ; снаружи — обучение, во время которого веса подбираются на примерах. Понять конкретное предсказание сложно, но сам принцип прост: чем больше данных и параметров, тем точнее модель улавливает закономерности. Почти весь современный AI — от распознавания лиц до генерации видео — это разные архитектуры нейросетей, обученные на разных данных.