"Мёртвая вода. Часть 2" - читать интересную книгу автора (Внутренний Предиктор СССР)Метод динамического программирования, как алгоритмическое выражение достаточно общей теории управленияВ изложении существа метода динамического программирования мы опираемся на книгу “Курс теории автоматического управления” (Палю де Ла Барьер: французское издание 1966 г., русское издание — “Машиностроение”, 1973 г.), хотя и не повторяем его изложения. Отдельные положения взяты из упоминавшегося ранее курса “Исследование операций” Ю.П.Зайченко. Метод динамического программирования работоспособен, если формальная интерпретация реальной задачи позволяет выполнить следующие условия: 1. Рассматриваемая задача может быть представлена как 2. Структура задачи не должна изменяться при изменении расчетного количества шагов 3. Размерность пространства параметров, которыми описывается состояние системы, не должна изменяться в зависимости от количества шагов 4. Выбор управления на любом из шагов не должен отрицать выбора управления на предыдущих шагах. Иными словами оптимальный выбор управления в любом из возможных состояний должен определяться параметрами рассматриваемого состояния, а не параметрами процесса в ходе которого система пришла в рассматриваемое состояние. Чисто формально, если одному состоянию соответствуют разные предистории его возникновения, влияющие на последующий выбор оптимального управления, то метод позволяет включить описания предысторий в вектор состояния, что ведет к увеличению размерности вектора состояния системы. После этой операции, то что до неё описывалось как одно состояние, становится множеством состояний, отличающихся одно от других компонентами вектора состояния, описывающими предисторию процесса. 5. Критерий оптимального выбора последовательности шаговых управлений Критерий С индексом Теперь обратимся к рис. 8‑1 — рис. 8‑3, повторяющие взаимно связанные рис. 40, 41, 42 из курса теории автоматического управления П. де Ла Барьера. На рис. 8‑1 показаны начальное состояние системы «0» и множества её возможных последующих состояний «1», «2», «3», а также возможные переходы из каждого возможного состояния в другие возможные состояния. И всё это вместе похоже на карту настольной детской игры, по которой перемещаются фишки: каждому переходу-шагу соответствует свой шаговый выигрыш, а в завершающем процесс третьем множестве — каждому из состояний системы придана его оценка, помещенная в прямоугольнике. Принципиальное отличие от игры в том, что гадание о выборе пути, употребляемое в детской игре, на основе бросания костей или вращения волчка и т.п., в реальном управлении недопустимо, поскольку это — передача целесообразного управления тем силам, которые способны управлять выпадением костей, вращением волчка и т.п. Если выбирать оптимальное управление на первом шаге, то необходимо предвидеть все его последствия на последующих шагах. Поэтому описание алгоритма метода динамического программирования часто начинают с описания выбора управления на последнем шаге, ведущем в одно из завершающих процесс состояний. При этом ссылаются на «педагогическую практику», которая свидетельствует, что аргументация при описании алгоритма от завершающего состояния к начальному состоянию легче воспринимается, поскольку опирается на как бы уже сложившиеся к началу рассматриваемого шага условия, в то время как возможные завершения процесса также определены. Рис. 8-1. К существу метода динамического программирования В соответствии с этим на рис. 8‑2 анализируются возможные переходы в завершающее множество состояний «3» из каждого возможного состояния в ему предшествующем множестве состояний «2», будто бы весь предшествующий путь уже пройден и осталось последним выбором оптимального шагового управления завершить весь процесс. При этом для каждого из состояний в множестве «2» определяются После этого множество «2», предшествовавшее завершающему процесс множеству «3», можно рассматривать в качестве завершающего, поскольку известны оценки каждого из его возможных состояний (максимальные полные выигрыши) и дальнейшая оптимизация последовательности шаговых управлений и выбор оптимальной траектории могут быть проведены только на ещё не рассмотренных множествах, предшествующих множеству «2» в оптимизируемом процессе (т.е. на множествах «0» и «1»). Таким образом, процедура, иллюстрируемая рис. 8‑2, работоспособна на каждом алгоритмическом шаге метода при переходах из В результате последовательного попарного перебора множеств, при прохождении всего их набора, определяется оптимальная последовательность преемственных шаговых управлений, максимально возможный полный выигрыш и соответствующая им траектория. На рис. 8‑3 утолщённой линией показана оптимальная траектория для рассматривавшегося примера. В рассмотренном примере критерий оптимальности — сумма шаговых выигрышей. Но критерий оптимальности может быть построен и как произведение Рис. 8-3. К существу метода динамического программирования Поскольку результат (сумма или произведение) не изменяется при изменении порядка операций со слагаемыми или сомножителями, то алгоритм работоспособен и при переборе множеств возможных состояний в порядке, обратном рассмотренному: т.е. от исходного к завершающему множеству возможных состояний. Если множества возможных состояний упорядочены в хронологической последовательности, то это означает, что расчетная схема может быть построена как из реального настоящего в прогнозируемое 1). Метод динамического программирования формально нечувствителен к характеру причинно-следственных обусловленностей (в частности, он не различает причин и следствий). По этой причине каждая конкретная интерпретация метода в прикладных задачах должна строиться с неформальным учетом реальных причинно следственных обусловленностей; 2). Если прогностика в согласии с иерархически высшим объемлющим управлением, а частное вложенное в объемлющее управление осуществляется квалифицировано, в силу чего процесс частного управления протекает в ладу с иерархически высшим объемлющим управлением, то Объективное существование Но для пользования методом динамического программирования и сопутствующими его освоению неформализованными в алгоритме В реальности это завершающее конкретное состояние должно быть заведомо устойчивым и приемлемым процессом, объемлющим и несущим оптимизируемый методом частный процесс. Но выбор и определение конкретных характеристик процесса, в который должна войти управляемая система по завершении алгоритма метода — лежит вне его самого в области “мистики” или в области методов, развитых в нематематических по своему существу науках. «Каково бы ни было состояние системы перед очередным шагом, надо выбирать управление на этом шаге так, чтобы выигрыш на данном шаге плюс оптимальный выигрыш на всех последующих шагах был максимальным.» — Е.С.Вентцель, “Исследование операций. Задачи, принципы, методология.”, М., “Наука”, 1988 г., с. 109. Неспособность определить вектор целей управления (достижением которого должен завершиться оптимизируемый в методе процесс) и/или выявить исходное состояние объекта управления не позволяет последовать этой рекомендации, что Это тем более справедливо для последовательных многовариантных шаговых переходов, если матрица возможных состояний вписывается в пословицу И в более общем случае, рекомендации Нового Завета и Корана утверждают возможность обретения благодати, милости Вседержителя вне зависимости от начального состояния (греховности человека) в тот момент, когда он очнулся и увидел свои дела такими, каковы они есть. Другое замечание относится уже к практике: ко вхождению в матрицу перехода. Если начальное состояние системы определено с погрешностью, большей чем допустимая для вхождения в матрицу перехода из реального начального состояния в избранное конечное, то управление на основе самого по себе безошибочного алгоритма метода динамического программирования приведет к совсем иным результатам, а не расчетному оптимальному состоянию системы. Грубо говоря, не следует принимать за выход из помещения на высоком этаже открытое в нём окно. То есть методдинамического программирования, необходимостью как определенности в выборе конечного состояния-процесса, так и выявления истинного начального состояния, Эта Примерами тому “Математическая экономика на персональном компьютере” под ред. М.Кубонива, в которой глава об управлении в экономике содержит исключительно макроэкономические интерпретации аппарата линейного программирования (прямо так и названа “Управление в экономике. Линейное программирование и его применение”), но ничего не говорит о векторе целей управления и средствах управления; в ранее цитированном учебнике Ю.П.Зайченко описание метода динамического программирования, так же построено на задачах иного характера. Однако при мотивации отказа от макроэкономических интерпретаций метода динамического программирования авторы обычно ссылаются на так называемое в вычислительной математике «проклятие размерности», которое выражается в том, что рост размерности пространства параметров задачи Чтобы пояснить это, обратимся к рис. 9, памятуя о сделанном ранее замечании об определённости начального состояния с достаточной для вхождения в матрицы перехода точностью. На нём показаны два объекта управления «А» и «Б» в начальном состоянии; три объективно возможных завершающих состояния (множество «5»); множества («1» — «4») промежуточных возможных состояний; и пути объективно возможных переходов из каждого состояния в иные. Рис. 9 можно уподобить некоторому фрагменту общевселенской меры развития (многовариантного предопределения) — одной из составляющих в триединстве «материя-информация-мера». Если принять такое уподобление рис. 9, то объективно возможен переход из любого начального состояния «0:1» или «0:2» в любое из завершающих состояний «5:1», «5:2», «5:3». Но эта объективная возможность может быть ограничена субъективными качествами управленцев, намеревающихся перевести объекты «А» и «Б» из начального состояния в одно из завершающих состояний. Если дано свыше Различение, то управленец «А» (или «Б») снимет с объективной меры “кальку”, на которой будет виден хотя бы один из множества возможных путей перевода объекта из начального состояния во множество завершающих. Если Различение не дано, утрачено или отвергнуто в погоне за вожделениями, или бездумной верой в какую-либо традицию, но не Богу по совести, то на “кальке” будут отсутствовать какие-то пути и состояния, но могут “появиться” объективно невозможные пути и состояния, объективно не существующие в истинной Богом данной мере. Кроме того по субъективному произволу управленца выбирается и желанное определенное завершающее состояние из их множества. Соответственно следование отсебятине или ошибка в выборе предпочтительного завершающего состояния может завершиться катастрофой с необратимыми последствиями. Но матрица возможных состояний, показанная на рис. 9, По этой причине каждое из начальных состояний «0:1», «0:2» может принадлежать либо одному и тому же, либо различным объемлющим процессам, в управленческом смысле иерархически высшим по отношению к рассматриваемому; то же касается и каждого из завершающих состояний «5:1», «5:2», «5:3» в паре «исходное — завершающее» состояния. Каждый из объемлющих процессов обладает их собственными характеристиками и направленностью течения событий в нём. Может оказаться, что цель «5:1» очень привлекательна, если смотреть на неё из множества начальных неудовлетворительных состояний. Но не исключено, что объемлющий процесс, к которому завершающее состояние «5:1» принадлежит, как промежуточное состояние, в силу взаимной вложенности процессов, на одном из последующих шагов завершается полной и необратимой катастрофой. Например, цель «5:1» — не опоздать на “Титаник”, выходящий в свой первый рейс, ... ставший трагическим и последним. Чтобы не выбирать такую цель из множества объективно возможных, необходимо быть в ладу с иерархически Но если рис. 9 — “калька” с объективной меры, то может статься, что какое-то завершающее состояние, являющееся вектором целей — отсебятина, выражающая желание “сесть на два поезда сразу”. Иными словами разные компоненты вектора целей принадлежат к двум или более взаимно исключающим друг друга иерархически высшим объемлющим процессам протекающим одновременно. Это один из случаев неопределенности и дефективности вектора целей, делающий метод динамического программирования неработоспособным, а реальный процесс “управления” неустойчивым, поскольку одна и та же “лодка” не может пристать и к правому, и к левому берегу одновременно, даже если привлекательные красоты на обоих берегах реки, при взгляде издали из-за поворота реки совмещаются, создавая видимость подходящего для пикника весьма уютного места. Чтобы не выбрать такого вектора целей, также необходимо, чтобы Свыше было дано Различение правого и левого “берегов” потока бытия. То есть алгоритму динамического программирования, даже если его можно запустить, сопутствует еще одно внешнее обстоятельство, которое тоже очевидно, “само собой” разумеется, но в большинстве случаев игнорируется: После избрания цели, принадлежащей во взаимной вложенности к Концепция управления в объективной мере, обладает собственными характеристиками, которые совместно с субъективными характеристиками субъекта-управленца, порождают вероятностную предопределенность осуществления им концепции управления. Значение вероятностной предопределенности успешного завершения процесса — объективная иерархически высшая мера, оценка замкнутой системы «объект + управленец + концепция», в отличие от вероятности — объективной меры системы «объект + объективно существующая концепция управления». Поэтому, чем ниже вероятность перевода объекта в желательное завершающее состояние, тем выше должна быть квалификация управленца, повышающая значение вероятностной предопределенности успешного завершения процесса управления. Соответственно сказанному, для администратора признание им некой концепции управления может выражаться в его уходе с должности по собственной инициативе, проистекающей из осознания им своей неспособности к осуществлению признанной им концепции управления; а неприятие концепции может выражаться, как заявление о её принятии и последующие искренние ревностные, Вследствие нетождественности Поэтому после принятия концепции к исполнению необходимо придерживаться концептуальной дисциплины и взращивать концептуальную дисциплину. То есть необходимо поддерживать достаточно высокое качество управления на каждом шаге всеми средствами, чтобы не оказаться к началу следующего шага в положении, из которого в соответствии с избранной концепцией управления перевод объекта в избранное завершающее состояние невозможен. Этот случай — уклонение с избранного пути «2:2» -gt; «3:3» показан: дуга «2:2» -gt; «3:1» — необратимый срыв управления, после которого невозможен переход в состояние «5:3»; дуга «2:2» -gt; «3:2» — обратимый срыв управления, в том смысле что требуется корректирование концепции, исходя из состояния «3:2», рассматриваемого в качестве начального. Если на рис. 9 объективной иерархически высшей мере качества состояний, в которых могут находиться объекты субъектов-управленцев «А» и «Б», соответствует шкала качества возможных состояний « Если на рис. 9 возможные состояния сгруппированы во множества «1», «2», «3», «4», «5» по признаку синхронности, то в координатных осях Если принят критерий оптимальности типа минимум[172] значения Срывы управления «1:2» -gt; «2:1» -gt; «3:1»; «2:2» -gt; «3:1»; «2:2» -gt; «3:2» -gt; «4:1»; «3:2» -gt; «4:2» — полная необратимая катастрофа управления по концепции, объективно возможной, но не осуществленной по причине низкого качества текущего управления в процессе перевода объекта в избранное конечное состояние «5:3». Все остальные срывы управления обратимы в том смысле, что требуют коррекции концепции и управления по мере их выявления. То есть метод динамического программирования в схеме управления «предиктор-корректор» работоспособен, а сама схема развертывается, как его практическая реализация. Возможны интерпретации метода, когда в вектор контрольных параметров (он является подмножеством вектора состояния) не входят какие-то характеристики объекта, которые тем не менее включены в критерий выбора оптимальной траектории. Например, если в состоянии «0:2» различные субъекты не различимы по их исходным энергоресурсам, а критерий выбора оптимальной траектории чувствителен к энергозатратам на переходах, то такому критерию может соответствовать в качестве оптимальной траектория «0:2» -gt; «1:2» -gt; «2:1» -gt; «3:2» -gt; «4:3» -gt; «5:3» или какая-то иная, но не траектория «0:2» -gt; «1:3» -gt; «2:2» -gt; «3:3» -gt; «4:4» -gt; «5:3», на которой достигается минимум интеграла от текущей ошибки управления. Это означает, что управленец, в распоряжении которого достаточный энергопотенциал, может избрать траекторию «0:2» -gt; «1:3» -gt; «2:2» -gt; «3:3» -gt; «4:4» -gt; «5:3»; но если управленец с недостаточным для такого перехода энергопотенциалом не видит траектории «0:2» -gt; «1:2» -gt; «2:1» -gt; «3:2» -gt; «4:3» -gt; «5:3», для прохождения которой его энергопотенциал достаточен, то состояние «0:2» для него субъективно тупиковое, безвыходное, хотя объективно таковым не является. Это говорит о первенстве Различения, даваемого Свыше непосредственно каждому, перед всем прочими способностями, навыками и знаниями. Кроме того этот пример показывает, что на одной и той же “кальке” с матрицы возможных состояний, соотносимой с полнотой реальности, можно построить набор критериев оптимальности, каждый из частных критериев в котором употребляется в зависимости от конкретных обстоятельств осуществления управления. И каждой компоненте этого набора соответствует и своя оптимальная траектория. Компоненты этого набора критериев, так же как и компоненты в векторе целей, могут быть упорядочены по предпочтительности вариантов оптимальных траекторий. Но в отличие от вектора целей, когда при идеальном управлении реализуются все без исключения входящие в него цели, несмотря на иерархическую упорядоченность критериев оптимальности, один объект может переходить из состояния в состояние только по единственной траектории из всего множества оптимальных, в смысле каждого из критериев в наборе, траекторий. Критерии оптимальности выбора, входящие в иерархически организованный набор критериев, не обязательно могут быть удовлетворены все одновременно. Для управления необходимо, чтобы процесс отвечал хотя бы одному из множества допустимых критериев. Может сложиться так, что один субъект реализует концепцию «0:2» -gt; «1:2» -gt; «2:1» -gt; «3:2» -gt; «4:3» -gt; «5:3», а другой «0:2» -gt; «1:3» -gt; «2:2» -gt; «3:3» -gt; «4:4» -gt; «5:3». Хотя конечные цели совпадают, но тем не менее если управленцы принадлежат к множеству управленцев одного и того же уровня в иерархии взаимной вложенности процессов, то это — конкуренция, “спортивная” гонка или концептуальная война; если они принадлежат к разным иерархическим уровням в одной и той же системе, то это — антагонизм между её иерархическими уровнями, ведущий как минимум к падению качества управления в смысле, принятом на её иерархически наивысшем уровне, а как максимум — к распаду системы. Арбитр — иерархически высшее по отношению к ним обоим объемлющее управление. Тем более, если завершающие цели различны, то это — концептуальная война, обостряющаяся по ходу процесса. Из сказанного следует, что алгоритм динамического программирования и рис. 9, иллюстрирующий некоторые аспекты его приложений, является довольно прозрачным намеком на весьма серьезные жизненные обстоятельства. Чтобы метод динамического программирования можно было использовать для оптимизации переходного процесса, описанного в форме последовательности преемственных производственных циклов, необходимо в структуру уравнений межотраслевых балансов ввести в явном виде вектор управляющего воздействия. В противном случае основное рекурентное соотношение метода Поэтому возвращаясь от рис. 9 к народному хозяйству, как целостной производственно-потребительской многоотраслевой системе, — одной из суперсистем в их взаимной вложенности в обществе, можно сделать вывод о недопустимости играть в бесцельную орлянку рыночной саморегуляции, показанную на рис. 7 как спутанный клубок суетливых траекторий. Необходимо построение экологически допустимой демографически обусловленной системы производства и распределения, подавляющей деградционно-паразитический спектр деятельности. Демографически обусловленное плановое ведение народного хозяйства в условиях объективных биосферно-экологических ограничений — единственное средство удовлетворить потребности всех, чье поведение выражает их человеческое достоинство. Тем, кто думает, что все люди разные, в силу чего вектор целей общественного производства на основе принципа демографической обусловленности сформировать невозможно, должно ответить только одно: все люди действительно разные и живут по-разному, но когда они в силу разных причин роняют человеческое достоинство, или не обрели его потому, что не смогли преодолеть “элитарно” обусловленного угнетения, они неотличимы в своем Поэтому, пребывая в ладу с Богом, можно выделить деградационно-паразитический спектр потребностей и статистически описать в системе стандартизации и “маркетинга” множественные различия в демографически обусловленных потребностях людей, памятуя о том, что все люди разные, но деградируют и паразитируют одинаково. И после этого можно действовать в сфере управления и саморегуляции производства и распределения на уровне макроэкономической системы. Для этого, в частности, необходима единая государственная система информационного обеспечения управления в народном хозяйстве. Она должна включать в себя три группы информационных модулей: 1. Описание в произвольной форме причинно-следственных обусловленностей и управления в пределах общественной многоотраслевой производственно-потребительской системы и входящих в неё вложенностей и их связей с иерархически высшими объемлющими суперсистемами. 2. Законодательство о сфере хозяйственной деятельности и управлении, исходящее из определённой нравственно обусловленной концепции общественной жизни людей и защищающее их от чуждых концепций, обусловленных враждебной паразитической нравственностью, построенное на основе первого и включающее в себя входы в третье. 3. Система государственных стандартов, определяющая перечень контрольных параметров, алгоритмы сбора и обработки информации при формировании управленческих решений на разных уровнях иерархии внутренней структуры народного хозяйства, и обеспечивающая концептуальное единство Жизнь технологически зависимой цивилизации, ведущей массовое серийное производство, а тем более массовое производство по индивидуальным заказам, невозможна без развитой системы стандартизации и сертификации технологий и продукции, понятной как организаторам производства на уровнях от бригады до Госплана, так и исполнительному персоналу и потребителям продукции и услуг. Система стандартов — один из языков человечества: как отсутствие тех или иных слов в языке или их неправильное употребление не позволяет выражать даже вполне здравые и осуществимые идеи в общественном объединении труда, так и неправильная система стандартов не позволяет массово выпускать даже каменные топоры не говоря уже о том, чтобы построить саморегуляцию производства и распределения в массовой статистике продуктообмена в общественном объединении труда. К этой группе модулей относится стандарт плана счетов бухгалтерского учета и государственной статистической отчетности. 4. Прикладной программный продукт, реализующий первые три группы модулей при обработке информации на технических средствах поддержки управления в реальном процессе выработки решений, проведения их в жизнь и контроля. Прикладной программный продукт подлежит государственной регистрации, тестированию и сертификации, подтверждающим его соответствие первым трем группам информации. Такая информационная система необходима, поскольку обоснованность политики государства — в смысле отсутствия социально и биосферно недопустимых последствий реализации принятых экономических решений[174] —должна быть не ниже, чем обоснованность расчетов прочности конструкций, достигнутая в технике, где давно уже завершилась эпоха первобытного “заклинания стихий” народными и Необходимо, чтобы Госплан и региональные планово-координационные органы и производственно-финансовые объединения, многоотраслевые концерны можно было доверить добросовестному грамотному управленцу, получившему Переходный процесс в макроэкономической системе от состояния недостаточности производства по демографически обусловленному спектру потребностей до состояния достаточности может быть описан, как хронологически преемственная последовательность межотраслевых балансов. Как уже отмечалось ранее, чтобы метод динамического программирования можно было использовать для оптимизации описанного таким образом переходного процесса, необходимо в структуру уравнений межотраслевых балансов ввести в явном виде вектор управляющего воздействия. В противном случае, в силу неопределённости основного рекурентного соотношения: метод утрачивает работоспособность. Введение в структуру уравнений межотраслевого баланса вектора управляющего воздействия возможно исходя из соотнесения структуры задачи ЛП‑4 со структурой задач ЛП‑П и ЛП-РВ для каждого из функционально обусловленных уровней расходов при (E -A) XK = FK =gt; FK min XK =gt; 0 Найти Min( Z ), Z = r1XK 1 + r2XK 2 + ... + rnXK n |
||||||||||
|