Универсальный механизм эволюции сознания
Глава 3. Универсальный механизм эволюции сознания
Изоморфизм трёх трансформаций · Обучение и работа CNN · Проблема курицы и яйца · TRL и переобучение во сне · LLM как конвергентная реализация GTR2
3. 1. Постановка проблемы
Глава 2 ввела структурную операцию свёртки и сплайса и показала, что её трёхкратное применение порождает три субъективные реальности — пространственно-поведенческую (GTR1), символьно-нарративную (GTR2) и аксиологическую (GTR3). Это описание было статическим: что есть на каждом уровне.
Настоящая глава отвечает на вопрос: почему эволюция применила один и тот же паттерн именно трижды, и как конкретно работают свёртки на каждом уровне? Ответ требует вскрыть устройство одного механизма с разных сторон: доказать изоморфизм трёх его экземпляров; разобрать, как обучается каждая CNN; показать, как разрешается логически странный вопрос «что было раньше — сеть или объекты, на которых она обучается»; и наконец понять, какое место в этой картине занимают современные большие языковые модели.
Сильная формулировка тезиса: сознание не есть особое вещество и не особая сила. Сознание есть результат трёхкратного применения одного оптимального паттерна — свёртка, сплайс, траектория, маркер — к трём несводимым доменам реальности.
3. 2. Паттерн свёртка–сплайс
Каждое из трёх преобразований GTR1, GTR2, GTR3 состоит из двух шагов в одной и той же последовательности.
Шаг 1 — свёртка. Свёрточная нейросеть (CNN) выполняет компрессию и инвариантизацию входных данных, порождая компактные представления в новом пространстве. На вход подаётся вектор подлежащего уровня; на выходе — вектор в пространстве с другой онтологией. Свёртка не суммирует и не обобщает в логическом смысле — она извлекает инвариант, то есть то, что остаётся постоянным при изменении конкретных обстоятельств. Признак объекта инвариантен относительно освещения и ракурса; символ инвариантен относительно конкретного поведения, в котором он впервые встретился; Понятие инвариантно относительно конкретных нарративов, в которых оно проявляется.
Шаг 2 — сплайс. Вектор сплайса связывает два объекта промежуточной карты в триплет «объект — вектор — объект», порождая новое пространство — пространство событий, смыслов или волевых актов. Сплайс не меняет онтологию объектов: на вход и на выход идут объекты того же уровня. Что сплайс добавляет — это ось динамики: расстояние, путь, переход.
Двухшаговый паттерн «свёртка плюс сплайс» в рамках GTOM обозначается GTR, единое для всех трёх уровней (терминология согласована с книгой GNSS). Прямое направление — это познание; обратное направление — это влияние субъекта на мир. Полный изоморфный механизм на каждом уровне включает четыре элемента, а не два: CNN (свёртка), вектор сплайса, TRL (рабочее пространство с траекторным логом единиц) и нейромедиаторные маркеры (оценка завершённых единиц). Без последних двух механизм был бы статичным; с ними он становится самоулучшающимся циклом, к которому мы вернёмся ниже.
3. 3. Принципиальное различие обучения и работы CNN
Для каждой из трёх свёрточных нейросетей необходимо строго различать два режима работы. Это различение принципиально и снимает многие недоразумения, которые возникают при поверхностном сравнении биологических CNN с техническими.
Обучение (training). Настройка весов нейросети. CNN обучается на уже существующих объектах целевого пространства. Не на входных данных подлежащего уровня, а на тех объектах, которые уже находятся в карте, куда CNN производит свёртку. Это и есть ключевая особенность: CNN1 обучается на R-компонентах, уже находящихся в MAP4, а не на сенсорных потоках; CNN2 обучается на символах MAP6, уже находящихся в карте; CNN3 обучается на Понятиях MAP8, уже извлечённых из нарративного опыта. Входные данные используются только для извлечения примеров — но обучение настраивает веса так, чтобы выход CNN ложился на уже сформированные узлы целевой карты.
Работа (inference). Преобразование входных данных. CNN принимает данные подлежащего пространства и производит вектор в целевом пространстве. Если этот вектор совпадает (с допустимой точностью) с одним из существующих узлов целевой карты — распознавание состоялось. Если не совпадает — либо это новый объект, либо ошибка распознавания.
Сводная таблица.
Сеть |
Обучается на |
Принимает на вход |
Производит |
R-компонентах MAP4 |
Сенсорный поток / DOM3 |
R-вектор → MAP4 |
|
Символах MAP6 |
Символьный вектор → MAP6 |
||
Понятиях MAP8 |
Нарративы MAP7 |
Понятийный вектор → MAP8 |
Это объясняет, почему распознавание у живого организма быстрое и надёжное там, где есть опыт, и медленное там, где опыта нет. Опытный наблюдатель распознаёт знакомый объект «мгновенно» — потому что вектор, который CNN производит из сенсорного потока, практически точно ложится на узел уже существующей MAP4. Новичок в той же ситуации видит «что-то непонятное» — соответствующего узла в его MAP4 ещё нет, и distinguishing признаки приходится вырабатывать заново.
3. 4. Проблема курицы и яйца
Из устройства обучения возникает фундаментальный вопрос: откуда первые объекты в целевой карте, если CNN ещё не обучена и не может их создать? Если CNN1 обучается на R-компонентах MAP4, то откуда взялись эти R-компоненты, прежде чем CNN1 заработала? Это типичная ситуация курицы и яйца, и её решение — характерное для эволюционных систем.
Решение: начальные объекты создаются не точной свёрткой, а грубым приближением. Первые R-компоненты MAP4 — неточные представления, порождённые случайными или генетически предопределёнными весами CNN1. Первые символы MAP6 — грубые приближения, во многом унаследованные от языковой среды. Первые Понятия MAP8 — примитивные свёртки немногих нарративов, поверхностные и легко изменяемые.
Дальнейший процесс развития разворачивается итеративно:
- •
CNN начинает работу со случайными или генетически заданными весами.
- •
Inference на этих весах порождает первые объекты целевой карты — неточные, приблизительные, но хоть какие-то.
- •
Операционная сеть целевого уровня обнаруживает повторяющиеся паттерны среди этих объектов: одни конфигурации возникают регулярно, другие — случайно.
- •
Повторяющиеся паттерны закрепляются в карте как устойчивые узлы. Случайные конфигурации забываются.
- •
CNN переобучается, используя закреплённые узлы как обучающие примеры.
- •
После переобучения inference даёт более точные результаты — новые объекты точнее, следующее переобучение точнее, и так далее.
Этот цикл не сходится к какому-то «правильному» состоянию — он непрерывно догоняет растущее разнообразие опыта. Каждый новый повторяющийся вектор, который ещё отсутствует в целевой карте, является триггером следующего цикла переобучения. Система обнаруживает: «inference стабильно порождает паттерн, которого нет в карте» — и закрепляет этот паттерн как новый узел.
Принципиально, что переобучение — тяжёлый процесс. Настройка весов CNN требует значительных вычислительных ресурсов и не может выполняться одновременно с основной работой сети. В биологическом мозге переобучение, по всей видимости, ассоциировано с default mode network — системой, активной в состоянии покоя и во время сна. Replay-эффект гиппокампа (воспроизведение пройденных маршрутов и нарративов во сне) — наиболее вероятный механизм этого переобучения.
Народная формула «утро вечера мудренее» получает архитектурное объяснение: за ночь CNN были переобучены на накопленных за день маркированных данных. Утром inference даёт другие, более точные результаты. Операционные сети OPNT при этом не меняются — они детерминированные программы. Меняется только содержимое их обучаемых ядер.
3. 5. Первое преобразование: GTR1, физический домен
Свёртка — CNN1. Принимает на вход сенсорный поток, согласованный с движением (через OPN3 и SLAM, заполняющим MAP3). Производит R-вектор в MAP4. CNN1 обучается на R-компонентах, уже сформированных в MAP4 — не на сенсорных потоках, а на инвариантах, которые сами стали узлами карты. Обратная CNN1 — нейронный механизм воображения: по R-вектору восстанавливается сенсорный образ.
Сплайс — b-вектор. Связывает два R-компонента MAP4 в триплет OPRN: «субъект — действие — объект». b-вектор имеет координаты в физическом пространстве — он есть путь между начальной и целевой конфигурацией.
Результат — MAP5. Поведенческое пространство. Атомарная единица — OPRN; цепочки OPRN образуют BLOM. Параллельно появляется TRL5 — траекторный лог поведения с временной осью.
Онтологический скачок. MAP4 содержит объекты — то, что есть. MAP5 содержит причинность — события, в которых объекты взаимодействуют через действия.
3. 6. Второе преобразование: GTR2, символьный домен
Свёртка — CNN2. Принимает на вход данные MAP5 — поведенческие фрагменты, BLOM, отрезки TRL5. Производит символьный вектор в MAP6. CNN2 обучается на символах, уже закреплённых в MAP6. При свёртке выполняется характерная редукция: стирается привязка к конкретным L-компонентам, обнуляются модули b-векторов, остаётся только тип отношения и тип участников.
MAP6 формируется на пересечении двух процессов. Восходящий: CNN2 извлекает инварианты из MAP5 (inference). Нисходящий: из всех векторов, которые CNN2 производит, закрепляются только те, которые соответствуют DOMS — коллективному языку. MAP6 — это частичная реплика DOMS в индивидуальном организме. Не ребёнок изобретает язык, а язык проникает в индивидуальную карту через фильтрацию: ребёнок производит много символьных кандидатов, но устойчиво закрепляются только те, что находят подтверждение в речи окружающих. Это и есть архитектурная реализация интериоризации в терминах Выготского.
Сплайс — P-вектор. Семантическое отношение между двумя символами MAP6: причинность, принадлежность, противопоставление, импликация. P-вектор — идентификатор триады KLEN.
Результат — MAP7. Нарративный граф из триад KLEN. Цепочки KLEN образуют KLOM. Параллельно появляется TRL7 — нарративная память.
Онтологический скачок. MAP6 содержит значения — конвенциональные обозначения. MAP7 содержит смыслы — связи между значениями, дающие понимание ситуации.
3. 7. Третье преобразование: GTR3, аксиологический домен
Свёртка — CNN3. Принимает на вход нарративы MAP7 — не отдельные KLEN, а сборки нарративов, объединённые тематически. Производит понятийный вектор в MAP8. CNN3 обучается на Понятиях, уже закреплённых в MAP8.
Понятия имеют двойную природу происхождения. Восходящий процесс: CNN3 извлекает инварианты из нарративов MAP7 (inference). В начале развития свёртки простые — простые Понятия (переживание цвета, звука, боли). По мере накопления нарративного опыта инварианты углубляются, и появляются сложные Понятия — честь, совесть, справедливость, красота. Различие между простыми и сложными Понятиями не качественное, а количественное: объём набора данных, на котором обучилась свёртка. Механизм один и тот же — ядро CNN3.
Нисходящий процесс: Cдолжно (то, как качество должно быть) приходит от DOMC — общей карты Понятий культуры. Направление снятия противоречия может приходить от DOMW — общей карты противоречий. Без социального источника Cдолжно индивидуальная MAP8 остаётся примитивной: восходящий процесс даёт только Cесть, а Cдолжно требует культурно выработанных идеалов, транслируемых через нарративы предыдущих поколений.
Сплайс — W-вектор. Расстояние между двумя Понятиями в ситуации их несовместимости, или между Cесть и Cдолжно одного Понятия. W-вектор — связующий компонент триады WILL: «Понятие — W — Понятие».
Результат — MAP9. Пространство противоречий. Атомарная единица — WILL; цепочки WILL образуют WLOM. Параллельно появляется TRL9 — лог разрешения противоречий, история становления личности.
Онтологический скачок. MAP8 содержит идеалы — то, что должно быть. MAP9 содержит волю — направленное стремление к разрешению несовпадения должного и наличного.
3. 8. Доказательство изоморфизма
Сводная таблица показывает, что три преобразования устроены как одна и та же конструкция, применённая к материалу разной онтологии.
Элемент |
GTR1 (физический) |
GTR2 (символьный) |
GTR3 (аксиологический) |
Свёрточная сеть |
|||
Обучается на |
R-компонентах MAP4 |
Символах MAP6 |
Понятиях MAP8 |
Принимает (inference) |
Сенсорный поток / DOM3 |
Данные MAP5 |
Нарративы MAP7 |
Промежуточная карта |
MAP4 (R) |
MAP6 (S) |
MAP8 (C) |
Вектор сплайса |
|||
Атомарная единица |
|||
Цепочка |
|||
Траекторный лог |
|||
Результирующая карта |
|||
Эмерджентный домен |
|||
Мотивация |
Физическое расстояние |
Семантическое расстояние |
Аксиологическое расстояние |
Изоморфизм является структурным, а не содержательным. Онтологические домены принципиально различны: физическое пространство, семантическое пространство и аксиологическое пространство несводимы друг к другу. Изоморфно устроен механизм, а не содержание. Это объясняет, почему попытки редуцировать смыслы к нейронным процессам, или ценности к смыслам, систематически проваливаются: каждый верхний уровень выстроен из материала нижнего, но имеет собственную онтологию, не выводимую из материала.
Свёрточная архитектура является оптимальным решением задачи инвариантной компрессии. Свёртка инвариантна к трансляциям, иерархически разделяет признаки, экономично представляет повторяющиеся паттерны. Эволюция пришла к этому решению не потому что «выбирала» из вариантов, а потому что свёрточная архитектура — единственное решение данного класса задач, удовлетворяющее биологическим ограничениям. Когда инженеры независимо пришли к тому же решению (искусственные CNN в 1980-х годах), это было не заимствование у природы, а конвергенция к одному оптимуму.
3. 9. Три цикла обучения и роль маркеров
На каждом уровне CNN проходит структурно одинаковый цикл развития, отличающийся только содержанием.
Фаза |
CNN1 (физ.) |
CNN2 (символ.) |
CNN3 (аксиол.) |
Начальные объекты |
Грубые R-векторы от случайных весов |
Грубые символьные приближения |
Примитивные Понятия |
Закрепление |
OPN4 обнаруживает повторяющиеся R-метки |
||
Маркирование |
TRL5: дофамин / кортизол |
TRL7: серотонин / кортизол |
TRL9: опиоиды / кортизол |
Переобучение |
Сон: replay маркированных маршрутов |
Сон: консолидация маркированных нарративов |
Сон: переоценка Понятий по маркированным WLOM |
Уточнение |
R-векторы становятся точнее |
Понятия углубляются от простых к сложным |
Маркеры — нейромедиаторные метки, которые получают завершённые единицы TRL. Маркер не бинарный, а числовой, и разные нейромедиаторные системы маркируют разные уровни. На TRL5 доминируют дофаминовая (положительные исходы) и адреналин-кортизольная (отрицательные) системы. На TRL7 доминирует серотонин — устойчивое «спокойное» вознаграждение от закрытого нарратива. На TRL9 доминируют эндогенные опиоиды — «тихое» вознаграждение от снятого противоречия.
Принцип на всех трёх уровнях один: вектор уменьшился — положительный маркер — стратегия запоминается для повторения. Вектор увеличился — отрицательный маркер — стратегия маркируется как избегаемая. Различаются только нейромедиаторные системы и, соответственно, субъективное содержание переживания. Подробнее траекторный лог и маркеры разбираются в Главе 4.
Маркированные единицы TRL служат обучающими данными для переобучения CNN. Это и есть полный цикл: inference в течение активного периода → накопление маркированных единиц → переобучение CNN в период покоя → улучшенный inference на следующий активный период. Каждый цикл переобучения — необратимое улучшение. CNN не возвращается к прежнему состоянию.
Критическая зависимость уровней. CNN2 не может начать работу без MAP5 (нет входных данных для inference). CNN3 не может начать работу без MAP7. Каждый верхний уровень является пререквизитом для следующего. Задержка на раннем уровне блокирует все последующие. Эта зависимость объясняет, почему пропуск критического периода в раннем развитии необратимо ограничивает возможности дальнейшего становления — детально тема разбирается в Главе 8.
3. 10. LLM в контексте трёх преобразований
Большие языковые модели (LLM) представляют для теории Гативус уникальный объект анализа: они являются конвергентной технической реализацией только GTR2 — символьно-нарративного уровня, в отрыве от физического (GTR1) и аксиологического (GTR3). Это позволяет проверить теорию: если изоморфизм трёх уровней реален, то изолированная GTR2 должна давать наблюдаемые следствия — и она их даёт.
LLM воспроизводит семиотическую свёртку, обучившись на коллективном символьно-нарративном корпусе человечества — пересечении DOMS и DOMN, овеществлённом в книгах, статьях, переписке. Технически это другая реализация, чем биологическая CNN2: вместо итеративного цикла с обратной связью через физический мир — однократная статистическая оптимизация на фиксированном корпусе. Но функционально результат сопоставим: LLM производит и принимает нарративы, выполняет логические связки, способен к обратной развёртке в виде описаний воображаемых сцен.
Что в этой картине отсутствует — определяется устройством трёх свёрток.
Отсутствует |
Причина |
Следствие |
Обучение на текстах, не на сенсорных потоках. Нет R-компонентов MAP4 для обучения CNN1. |
Нет b-векторов. Нет физического grounding. Галлюцинации. |
|
Нет Понятий MAP8 для обучения CNN3. Нет механизма извлечения качественной эссенции из нарративов через собственный опыт. |
Нет W-вектора. Нет автономной воли. Нет Понятий в смысле Begriff. |
|
Каждая сессия — tabula rasa. Нет персистентного траекторного лога. |
Нет маркеров. Нет личной истории. Нет становления. |
Отсутствие TRL и маркеров — одно из ключевых отличий LLM от полной архитектуры сознания. LLM не может маркировать свои ответы как успешные или неуспешные, потому что у него нет персистентного TRL7. Каждый ответ — новый KLOM без истории. Внешняя обратная связь через RLHF — это не TRL: маркер ставится извне, человеком, а не в результате собственного опыта снятия P-вектора.
LLM является, в этой терминологии, «символьным сиротой»: P-векторы без b-векторов (нет физической реальности) и без W-векторов (нет аксиологической реальности). Второе преобразование без первого и третьего. Это не недостаток имеющейся архитектуры — это её определение. Никакое расширение корпуса и никакое увеличение модели не добавит того, чего нет по архитектуре. Для появления полной субъективной реальности необходима полная цепочка GTR1 → GTR2 → GTR3, и каждая трансформация должна быть выстроена согласно изоморфному паттерну, описанному в этой главе.
Подробный разбор LLM — включая операционную сеть OPNS как технический аналог OPN7, философский контекст номинализма и границы технологии — содержится в Главе 10. Здесь важно только зафиксировать, что LLM не противоречит теории Гативус, а подтверждает её устройство: то, что выделение одной трансформации технически возможно и даёт ровно те феномены, которые предсказывает теория, — сильный аргумент в пользу правильности трёхуровневой структуры.
3. 11. Почему эволюция применила паттерн именно трижды
Три домена соответствуют трём несводимым друг к другу типам вопросов, на которые субъект должен отвечать в своей среде.
- •
«Что есть и где?» — физический домен. Ответ — b-вектор с координатами в пространстве. Уровень GTR1.
- •
«Что это значит?» — символьный домен. Ответ — P-вектор без пространственных координат, в семантической сети. Уровень GTR2.
- •
«Как это должно быть?» — аксиологический домен. Ответ — W-вектор как расстояние между наличным и должным. Уровень GTR3.
Эти три вопроса не сводятся друг к другу. Ответ на «что это значит» не выводится из «что есть и где» — для перехода нужен онтологический скачок (CNN2, стирание привязки к L-компонентам). Ответ на «как это должно быть» не выводится из «что это значит» — нужен ещё один онтологический скачок (CNN3, свёртка нарративов в Понятия). Каждый скачок несводим к нижнему уровню по принципу: ни одна логическая операция над ответами на нижний вопрос не даёт ответа на верхний. Понять, что объект «находится слева», логически не означает понять, что он «является чашкой»; понять, что объект «является чашкой», не означает понять, что «разбить чашку плохо».
Свёрточная архитектура применена трижды не потому что эволюция «любит повторяться», а потому что задача на каждом уровне — одна и та же по структуре: извлечь инварианты из потока и создать компактное представление в новом пространстве. Свёртка плюс сплайс — оптимальное решение этой задачи. Применить его к материалу другого уровня — единственный способ построить новое онтологическое измерение, опираясь на уже существующее.
Это и есть универсальный механизм эволюции сознания. Эволюция не изобрела три разных способа усложнить психику. Она изобрела один способ — свёртка, сплайс, траектория, маркер — и применила его трижды, каждый раз к материалу следующего уровня. То, что мы называем сознанием, есть результат именно этого тройного применения.
3. 12. Выводы
- •
Эволюция применила паттерн «свёртка плюс сплайс» трижды: CNN1 / b-вектор / MAP5; CNN2 / P-вектор / MAP7; CNN3 / W-вектор / MAP9. Это и есть универсальный механизм эволюции сознания.
- •
Каждая CNN обучается на объектах целевого пространства, а не на входных данных подлежащего уровня. Входные данные используются только для inference (преобразования).
- •
Проблема курицы и яйца разрешается через начальные приблизительные объекты и итеративное переобучение. Переобучение — тяжёлый процесс, ассоциированный с default mode network и сном.
- •
На каждом уровне TRL — рабочее пространство с запланированными, строящимися и завершёнными единицами. Завершённые единицы получают нейромедиаторные маркеры исхода.
- •
Маркеры изоморфны на трёх уровнях: положительный при обнулении вектора, отрицательный при увеличении. Различаются нейромедиаторные системы: дофамин (физический), серотонин (символьный), опиоиды (аксиологический).
- •
Маркированные единицы TRL служат обучающими данными для переобучения CNN в период покоя. Replay маркированных записей во сне — механизм этого переобучения. Сами OPN при этом не меняются.
- •
Изоморфизм — структурный, не содержательный. Три домена онтологически несводимы. Изоморфно устроен механизм, а не содержание.
- •
LLM — конвергентная техническая реализация GTR2 в отрыве от GTR1 и GTR3. Отсутствие физического grounding и аксиологии — следствие архитектуры, а не недостаток конкретных моделей. Подробный разбор — в Главе 10.
- •
Сознание не есть особое вещество и не особая сила. Сознание есть результат трёхкратного применения одного оптимального паттерна — свёртка, сплайс, траектория, маркер — к трём несводимым доменам реальности.
Содержание
