GPT-будущее: мы больше не нужны?
Кеша Скирневский написал серию замечательных заметок-размышлений о месте человека в ближайшем будущем рядом со стремительно развивающимися нейросетями. Со всей любовью и уважением к автору, я не могу себе отказать в удовольствии вступить в дискуссию по поводу некоторых тезисов, им изложенных.
Как и многих, меня одновременно и тревожат, и воодушевляют перспективы расширения роли нейросетей в наших жизнях. И я также понятия не имею, какими они будут через 5-10 лет (звучит вообще как тема для многочасового подкаста). Замечания, которые я хочу тут привести, служат не попыткой дискредитации развернутого и детально сформулированного видения будущего Кешей, а указанием на точки, требующие более детального осмысления и обсуждения (приглашением к обсуждению) для понимания их значимости или наоборот не существенности для общего прогноза ближайших лет человечества.
Теперь, по сути. Одно из ключевых положений в рассуждениях гласит, что мозг работает точно также, как и нейросети. Если говорить по форме, то да, но что насчет содержания? Во-первых, один биологический нейрон совсем не то же самое, что один нейрон нейросети, синапсы мозга — многопараметрические, активные и химически управляемые элементы, а веса в искусственных нейронных сетях (ИНС) — простые числовые коэффициенты.
Также стоит отметить, что мозг состоит приблизительно из 86 миллиардов нейронов, каждый из которых соединён множеством тысяч синапсов — это чрезвычайно сложная сеть. При этом ИНС моделируют отдельные аспекты этой структуры, но у них нет детальной биологической динамики реальных нейронов и синапсов. Приведу тут перевод цитаты:
...Искусственные нейронные сети вдохновлены мозгом, но не являются его копиями. Они различаются не только по физической субстратной основе, но и по масштабу: узлов в ИНС неизмеримо меньше, чем нейронов в мозге. Кроме того, ключевой алгоритм, который выявляет иерархическую структуру связей в большинстве современных ИНС, вряд ли существует в биологическом мозге
При этом, да, есть гипотезы о биологически правдоподобных аналогах, как и существуют исследования о локальных механизмах обучения, частично напоминающих оптимизацию, но это все ещё не то же самое.
Подытоживая: заявление об идентичности работы мозга и нейросетей можно считать даже менее релевантным чем сравнение кухни в вашей квартире с сетью ресторанов в стране.
Второй важный момент, звучащий в статьях, выражается в примере с роботом, гуляющим по реальному или виртуальному миру, тем самым впитывающим все знания и впечатления. Здесь есть нюанс.
Вкратце проблема в том, что современные нейросети — это статичные структуры. Люди и животные обучаются и используют мышление непрерывно — мозг постоянно впитывает и интегрирует новую информацию без явной фазы разделения «перед обучением» и «после обучения». Это называют нейропластичностью и динамической адаптацией: без остановки системы, без периода «тренировки» и потом «использования».
Нейросети пытаются научить делать также, но пока успехов мало. Они обучаются пакетами данных, после чего система перераспределяет веса и может быть использована. При этом если их просто обновлять на новых данных, они катастрофически забывают ранее выученное.
Да, существуют надстройки-методы адаптации вроде LoRA (как быстрое дообучение, но также статичны), экспериментальные архитектуры постоянного обучения, но в масштабах больших универсальных моделей полноценной устойчивой нейропластичности пока нет.
Само же обучение требует огромных вычислительных мощностей. Да, компьютеры становятся мощнее, а обучение нейронок оптимизируется (пример DeepSeek, или совсем свежие новости про Алису) но, тем не менее, здесь и сейчас мы уже столкнулись с нехваткой памяти, а в ближайшее время, возможно, и забрезжит энергетический потолок — ограничения физического мира.
Подытоживая: человек мыслит в динамике, непрерывно обучаясь и перестраивая нейронные связи; нейросеть определенной версии — статичная структура, не адаптирующаяся в процессе использования.
Здесь же можно упомянуть и процесс «мышления», обусловленный таким устройством этих сущностей: любая мысль человека моментально вызывает обратную связь (и потенциально ведет к обучению, изменению самой системы). Нейросеть же не «мыслит» аналогично человеку — она статична: если сильно упростить, то всем известным понятиям назначены связи и веса, и когда она «отвечает» на ваш вопрос, каждое следующее слово возникает как наиболее вероятное в совокупности входных данных (запроса) и весов обученной модели (поэтому слова и возникают друг за другом — это не просто прикольный эффект анимации). Если все входные параметры одинаковы (вплоть до temperature=0 и фиксированном seed), то и ответ всегда будет совершенно идентичный (это проще всего проверить на генерации изображений).
Я привел 2,5 примера, где, как мне кажется, предпосылки в целом верных рассуждений неточны в своем фундаменте, что, соответственно, может искажать и сами выводы. Если эта дискуссия будет иметь развитие, можно будет рассмотреть и другие нюансы. :)
P. S.: Отдельно хочу отметить, что Кеша (давно уже) идет по пути научного редукционизма, рассуждая в духе, что «раз сознание не было до сих пор определено, значит его нет», сводя личность и, собственно, сознание исключительно к проявлению биохимических процессов. Это довольно смелое предположение, чтобы строить на нем картину мира, так как оно является предметом большого научно-философского спора всего XX и, видимо, XXI века (а корнями уходит аж в XVII век) — и, кстати, вполне себе тема для отдельной дискуссии.