Инженерные модели, и с чем их едят

5 minute read

Published:

Модель есть представление некоего объекта или явления в какой-либо форме (например, в математической, физической, символической, графической или дескриптивной), предназначенное для рассмотрения определённых аспектов изучаемого объекта или явления и позволяющее получить ответы на изучаемые вопросы.

Рассмотрим модель: Anniina Mäkelä, CC BY 2.0 <https://creativecommons.org/licenses/by/2.0>, via Wikimedia Commons

Это трехмерная модель самки вида Homo sapience ограниченная представлением вторичных половых признаков и используемая в текстильной промышленности для разработки и рекламы способов драпировки недостатков и подчеркивания достоинств тех самых вторичных половых признаков. Эта модель имеет четкие границы применимости, назовем их условно “подиум”. За границами “подиума” модель превращается в обычную самку вида Homo sapience и взаимодействие с ней может привести к широкому диапазону последствий от длительного счастливого брака до длительного срока тюремного заключения по обвинению в изнасиловании.

Такие модели, которые используются в промышленности/технике и имеют четкую (принципиально непреодолимую) границу применимости, мы будем называть инженерными моделями.

Кроме демонстрационных моделей, типа описанной выше, существуют управляющие инженерные модели. Вы конечно же подумали про АСУ ТП (автоматические системы управления технологическими процессами), но я хочу поговорить о гораздо более распространенных моделях, а именно о нейронных сетях глубокого обучения заключенных в межушном ганглии каждого представителя вида Homo sapience.

Как и положено сетям глубокого обучения такие модели формируются случайно в процессе эмпирического научения, например жарке яичницы, т.е. последовательных попыток добиться желательного результата управления процессом, большая часть которых оказывается неудачной. В зависимости от базовых настроек и личной истории носителя такой модели, результаты контроля технологического процесса могут варьировать от “всегда исключительно” (повар ресторана с Мишленовскими звездами), через “стабильность признак мастерства” (затраханная мать семейства), до “третий сорт – не брак” (сын той самой матери, впервые уехавший в общагу).

Так что же объединяет эти два класса инженерных моделей? Их принципиальная НЕИНТЕРПРЕТИРУЕМОСТЬ! Сиськи есть у более чем половины представителей вида Homo sapience, но почему именно эти сиськи приносят прибыль бренду и как их надо модифицировать, чтобы они приносили больше денег не скажет никто (гуру индустрии моды просьба не возражать :), возможно они просто должны быть. А на принципиальной неинтерпретируемости АСУ ТП на основе нейронных сетей цветут поколения инфоциган со времен неолита. В нашем времени все, от бизнесс-гуру, до психологов/сексологов/астрологов, и до кулинарных блогеров пользуются тем, что люди хотят снизить необходимое для надежного обучения число обработанных примеров. Чаще всего этого пытаются добиться структурированием/стратификацией предъявляемых для обучения объектов, но также распространены методы построения “контекста” (почувствуй себя богом/богиней, обрати внимание на Венеру в седьмом доме и т.д.). Иногда, как в случае научного подхода к технике и четкой прописи граммовок в рецептах, это удается, чаше всего – нет. Но как число клиентов, так и число учителей не снижается. И причина этому – НЕИНТЕРПРЕТИРУЕМОСТЬ нейронных моделей. Никакой учитель с первого взгляда не скажет из какого ребенка выйдет гениальный музыкант, а из какого лабух, а теория 10К часов это как раз пример попытки формирования “контекста”.

Рассмотрим один широко известный пример противостояния интерпретируемой АСУ ТП на основе математического моделирования физических процессов и группы АСУ ТП основанной на нейросетях глубокого обучения объединенных в ансамбль экспертов: катастрофу на Чернобыльской АЭС в1986 году.

В математическую модель физических процессов в реакторе РБМК входил и режим “йодной ямы” и набор действий, необходимых для предотвращения попадания в этот режим, а также способов быстрого и безопасного выхода из него. Но, к сожалению, в нее также были жестко зашиты допустимые по ТЗ (техническому заданию) режимы функционирования станции, которые нельзя было нарушать. И тут в дело вступает АСУ СВ (автоматическая система управления социальными взаимодействиями), которая по некоторым теориям была жестко зашита в железе межушного ганглия каждого представителя вида Homo sapience еще до того, как он стал sapience и потому имеющая абсолютный приоритет над всеми моделями, полученными в процессе глубокого обучения.

АСУ СВ ансамбля экспертов приходит к выводу, что для улучшения режима телесного функционирования каждого члена ансамбля необходимо провести эксперимент, прямо запрещенный штатной (интерпретируемой) системой АСУ ТП, и поэтому та была отключена и заменена на АСУ ТП ансамблевого типа включающую в себя нейронные сети глубокого обучения межушных ганглиев операторов АЭС. Что было дальше знают все.

Анализ возможных режимов развития аварии с помощью интерпретируемой модели, заложенной в АСУ ТП позволил выявить ряд конструктивных недостатков, которые могли способствовать (не привести к) развитию аварии до катастрофических масштабов. Были введены новые требования к безопасности, новые поколения реакторов….

Анализ работы неинтерпретируемых АСУ ТП нейросетевого вида в процессе судебного заседания не привел ни к чему. Модели нескольких членов ансамбля проанализировать не удалось, ввиду разрушения носителя, один из членов ансамбля под действием АСУ СВ провел попытку (неудачную) уничтожить свой носитель, другие члены ансамбля утверждали, что их модели были неадекватны конструкции реактора из-за нарушений процесса глубокого обучения (ошибки в регламенте и технической документации). Большинство выживших носителей обученных моделей был освобождены от преследования в течениие 4х лет.

Подводя итог: катастрофа случилась, интерпретируемая модель позволила выявить возможнные конструктивные особенности, внесшие свой вклад в развитие авариии, учесть их и выработать рекомендации по конструированию новых реакторов. Неинтерпретируемые модели глубокого обучения оказались под полным контролем АСУ СВ и никакой положительной информации в анализ не привнесли.

Как вывод

В каждой шутке есть доля шутки, я привел примеры только естественных нейронных сетей, однако погибшие по вине “автопилота” Теслы показывают что искусственные нейронные сети ничем не лучше.

Если у вас есть выбор, выбирайте интерпретируемую инженерную модель управления, даже если ее характеристики чуть хуже: у нее есть путь роста, развития, а у вас есть вариант защиты в случае непредвиденного.

Неинтерпретируемые модели в современных условиях находятся в конкурентном преимуществе, т.к. стоимость часа кремниевых мозгов на много порядков дешевле чем у углеродных, а учитывая время обучения эта разница будет только расти. Однако, при смене технологий или возникновении новых ограничений (например на выброс $CO_2$) адаптация интерпретируемой модели (или констатация невозможности таковой) дешевле и проще на те же самые порядки.

А кроме того, вы хотите жить в мире где господствуют злые своевольные боги, или в мире где господствуют ограниченные, но склонные к сотрудничеству бюрократы? Выбирайте! Это ваша жизнь! И ЧатГПТ ведет вас в веселый новый мир Олимпа… Оно вам надо?