Бурков В. Н. - Теория активных систем - Состояние и перспективы

Теория активных систем (ТАС) - раздел теории управления социально-экономическими системами, изучающий свойства механизмов их функционирования, обусловленные проявлениями активности участников системы. Основным методом исследования является математическое (теоретико-игровое) и имитационное моделирование.

За тридцать лет своего развития в ТАС были разработаны, исследованы и внедрены множество эффективных механизмов управления, соответствующие модели и методы находят применение при решении широкого круга задач управления в экономике и обществе - от управления технологическими процессами до принятия решений на уровне регионов и стран.
Полученные результаты нашли отражение в сотнях публикаций (примерная оценка общего числа публикаций в рамках ТАС - около двух тысяч). По основным своим подходам и используемым методам исследований теория активных систем чрезвычайно тесно связана с такими разделами теории управления социально-экономическими системами как: теория иерархических игр (или информационная теория иерархических систем - научная школа Н.Н.Моисеева и Ю.Б.Гермейера, развиваемая в основном сотрудниками ВЦ РАН и МГУ - Ф.И.Ерешко, А. Ф. Кононенко, В.В.Федоров и др. [276, 279, 336, 360]), киевская школа теории управления сложными системами (В.Л.Волкович, В.С.Михалевич и др.), разделы экономикоматематического моделирования, исследующие задачи
согласованного планирования, и программно-целевого планирования (К.А.Багриновский, В.Л.Макаров, Г.С.Поспелов, В.А.Ириков и др.), управление проектами (В.И.Воропаев, Д.И.Голенко-Гинзбург и др.), теория контрактов (theory of contracts (ТК), развиваемая в основном зарубежными учеными - O.Hart, B.Holmstrom и др., и исследующая задачи стимулирования в условиях вероятностной неопределенности - см. обзоры [152,153,371]), теория реализуемости (implementation theory (ТР) как раздел mechanism design, также развиваемая в основном зарубежными учеными - E.Maskin, R.Myerson и др., и исследующая задачи реализуемости соответствий группового выбора механизмами планирования, а также их свойства -неманипулируемость и др. - см. обзоры [152, 153, 371]) и др. Огромное число опубликованных работ, а также тесная взаимосвязь и глубокое взаимопроникновение идей и результатов ТАС и других разделов теории управления, делают практически невозможным создание относительно полной библиографии. Более того, полная библиографизация, наверное, нецелесообразна - во-первых, в упомянутых выше работах содержатся достаточно полные сравнительные аналитические обзоры близких к ТАС научных направлений, а, во-вторых, настоящая публикация содержит перечисление основных работ по теории активных систем.

Среди этих основных работ можно выделить несколько классов.
Первый класс работ - монографии, содержащие полное и систематическое изложение текущих теоретических результатов, а также результатов прикладных исследований [54, 84, 94, 112, 123, 177, 195, 201, 214, 234, 363, 382, 384, 410].
Второй класс работ - учебные пособия, ориентированные на студентов ВУЗов, аспирантов и слушателей системы повышения квалификации [74, 173, 233, 236, 343]. Следует признать, что на настоящий момент ощущается острая нехватка работ подобного типа, которые содержали бы описание результатов ТАС, методически ориентированных на широкий круг читателей, являющихся представителями различных специальностей -психологов, экономистов, математиков и др.
Третий класс работ, отражающих, в основном, теоретические результаты - статьи в научных журналах (в основном - Автоматика и Телемеханика, а также - Приборы и системы управления, Известия ВУЗов, Проблемы безопасности при чрезвычайных ситуациях, Systems Science, Mathematical Social Sciences и др.) и сборниках статей Института проблем управления и других организаций (в их числе - Активные системы (1973, 1974), Согласованное управление (1975), Синтез механизмов управления сложными системами (1980), Механизмы
функционирования организационных систем: теория и приложения (1982), Неопределенность, риск, динамика в организационных системах (1984), Планирование, оценка деятельности и
стимулирование в активных системах (1985), Механизмы
управления социально-экономическими системами (1988), Управление большими системами (1997) [235, 380] и др.).
Четвертый класс работ - брошюры и препринты (Института проблем управления РАН, а также других научных институтов и ВУЗов), содержащие в основном описание прикладных моделей и результатов их практического использования или популяризованное изложение результатов теории [13 36, 42, 66, 97, 159, 169, 172, 175, 186, 188, 206, 216, 244, 248, 328, 337, 338, 339, 369, 372, 374].
И, наконец, пятый - наиболее многочисленный - класс работ -доклады на российских и международных научных и научнопрактических конференциях, съездах, симпозиумах и т.д.
Распределение во времени основных работ по ТАС (приводимая ниже библиография содержит 432 ссылки) представлено следующей гистограммой (по горизонтали отложены годы, по вертикали - число работ).

Настоящее описание является предисловием к приводимой ниже библиографии основных работ по теории активных систем и преследует следующую цель - кратко охарактеризовать круг задач, решаемых в ТАС (параллельно вводя основные термины), с тем, чтобы уважаемый Читатель имел возможность более свободно ориентироваться в их проблематике и легко находить ссылки на работы, максимально близкие к конкретной области его научных интересов. При этом следует признать, что в силу ограниченного объема мы были вынуждены практически отказаться от описания собственно результатов исследований, ограничиваясь краткими описаниями постановок задач и в большинстве случаев лишь качественным обсуждением существующих моделей - достаточно полное изложение самих результатов приведено в работах, на которые указывают соответствующие ссылки.
Последующее изложение имеет следующую структуру. Сначала описывается модель активной системы (АС) и приводится общая формулировка задачи управления. Затем вводится система классификаций задач управления активными системами, имеющая ключевое значение для ориентации в приводимом далее списке литературы. После этого для базовых (простейших) моделей рассматриваются два основных класса теоретических задач ТАС -задачи анализа и синтеза механизмов стимулирования и планирования, а также обсуждаются расширения базовых моделей.

Помимо теоретических исследований задач стимулирования и планирования, в ТАС было разработано множество так называемых базовых механизмов управления АС и соответствующих прикладных моделей, среди которых можно выделить механизмы: комплексного оценивания, активной экспертизы, формирования состава и структуры активной системы, распределения ресурса, финансирования, оперативного управления и др. В заключение обсуждаются перспективные направления исследований.
2. Модель активной системы и общая постановка задачи управления
Рассмотрим задачу управления некоторой (пассивной или активной) системой. Пусть состояние системы описывается переменной ye A, принадлежащей допустимому множеству A. Состояние системы в некоторый момент времени зависит от управляющих воздействий u e U: y = F(u).

Предположим, что на множестве UxA задан функционал F(u,y), определяющий эффективность функционирования системы. Величина
K(u) = Ф(u,F(u)) называется эффективностью управления u е U. Тогда задача управляющего органа заключается в выборе такого допустимого управления, которое максимизировало бы значение его
эффективности при условии, что известна реакция системы F(u) на 2 управляющие воздействия :
K(u) ® max.
ueU
Рассмотрим теперь различия в моделях управления пассивными и активными системами. Для пассивной (технической, формальной и т.д.) системы зависимость y = F(u) является, фактически, моделью системы - управляемого объекта, отражающей законы и ограничения ее функционирования. Например, для динамической системы эта зависимость может являться решением системы дифференциальных уравнений, для некоторого черного ящика - быть результатом экспериментов и т.д.

Общим для всех пассивных систем является их детерминизм с точки зрения управления - не в смысле отсутствия неопределенности, а в смысле отсутствия у управляемого объекта свободы выбора своего состояния и возможности прогнозирования поведения управляющего органа.
Иначе обстоит дело в активных системах, то есть системах, в которых управляемые субъекты (точнее говоря, хотя бы один субъект) обладают свойством активности - в том числе - свободой выбора своего состояния. Помимо возможности выбора своего состояния, элементы АС обладают собственными интересами и предпочтениями, то есть осуществляют выбор состояния целенаправленно (в противном случае их поведение можно было бы рассматривать как пассивное).

Соответственно конкретизируется и модель системы F(), которая должна учитывать проявления активности управляемых субъектов. Проявления эти описываются следующим образом - считается, что управляемые субъекты стремятся к выбору таких своих состояний, которые являются наилучшими с точки зрения их предпочтений при заданных управляющих воздействиях, а управляющие воздействия, в свою очередь, зависят от состояний управляемых субъектов (см. игру Г2 ниже).

Одним из важнейших проявлений активности также является способность управляемых субъектов предсказывать (в рамках имеющейся информации) поведение управляющего органа - его реакцию на состояние системы и т.д.
Если управляющий орган имеет модель реальной активной системы, которая адекватно описывает ее поведение, то задача управления АС (задача синтеза оптимального управляющего воздействия) сводится к сформулированной выше - выбрать оптимальное управление u = u (y) е U, то есть допустимое управление, максимизирующее эффективность.
Закончив краткое качественное обсуждение постановки задачи управления в пассивных и активных системах, перейдем к более детальному описанию собственно модели активной системы.
Любая конкретная активная система (и ее модель) задается перечислением следующих параметров.
1. Состав АС - совокупность субъектов и объектов, являющихся элементами системы (в дальнейшем для их обозначения будет использоваться термин участники АС).

2. Структура АС - совокупность информационных, управляющих и других связей между участниками АС, включая отношения подчиненности и разделение прав принятия решений. В большинстве моделей теории активных систем исследовались двухуровневые АС веерного типа, состоящие из одного управляющего органа - центра на верхнем уровне иерархии и одного или нескольких подчиненных ему управляемых субъектов -активных элементов (АЭ) на нижнем уровне.
3. Число периодов функционирования отражает наличие или отсутствие динамики (однократности или многократности выбора стратегий участниками АС в течение рассматриваемого периода времени).
4. Целевые функции участников системы, отражающие их интересы и предпочтения. В формальных моделях ТАС считается, что рациональному поведению участников соответствует выбор состояний (стратегий), которые максимизировали бы их целевые функции (см. теоретико-игровые модели ниже).
5. Допустимые множества состояний (стратегий) участников АС, отражающие индивидуальные и общие для всех ограничения на выбор состояний, накладываемые окружающей средой, используемой технологией и т. д.
6. Порядок функционирования - последовательность получения информации и выбора стратегий участниками АС.
7. Информированность участников - та информация, которой обладают участники АС на момент принятия решений о выбираемых стратегиях.
Состав, структура, целевые функции, допустимые множества, число периодов функционирования, порядок функционирования и информированность участников определяют механизм функционирования (управления) АС в широком смысле -совокупность законов, правил и процедур взаимодействия участников системы. В узком смысле механизм управления представляет собой совокупность правил принятия решений (ППР) участниками АС при заданных ее составе, структуре и т. д. (например, ППР центра - зависимость u (у), ставящая соответствие состояниям АЭ конкретное значение управляющего воздействия).
Умея решать задачу синтеза механизма управления в узком смысле, можно решать задачи синтеза оптимального состава участников АС, ее структуры и т.д., то есть задачи синтеза механизма управления в широком смысле.
Рассмотрим базовую модель активной системы, состоящей из центра и n активных элементов, функционирующих в условиях полной информированности обо всех существенных внешних и внутренних по отношению к системе параметрах (детерминированная АС). Структура АС приведена на рисунке 1.

Термин базовая по отношению к описываемой модели несет следующую нагрузку: рассматриваемая модель является с одной стороны простейшей (как с точки зрения структуры, описания и т.д., так и с точки зрения ее исследования), так как в ее рамках не учитываются многие факторы (динамика, неопределенность и т.д., которые учитываются в расширениях базовой модели), а с другой стороны на ее примере можно проследить многие закономерности управления АС с тем, чтобы использовать их при переходе к более сложным моделям. Кроме того, следует отметить, что нами был избран индуктивный стиль изложения материала настоящего предисловия, соответствующий историческому подходу к описанию результатов ТАС; переход от базовой модели к ее расширениям обсуждается ниже. Альтернативой является дедуктивный подход - рассмотрение максимально подробной модели АС, учитывающей все возможные постановки задач
управления, и дальнейшая конкретизация ее для тех или иных частных случаев. Недостаток последнего подхода очевиден - при его использовании исходное описание было бы перегружено деталями, которые можно рассматривать по отдельности (что и делается ниже), и затрудняло бы понимание качественных, но чрезвычайно важных, аспектов управления в активных системах.
Теоретико-игровая формулировка задачи управления
n
заключается в следующем. Пусть y = (yh y2, yn) е A = П A, -
i=1
вектор действий активных элементов, компоненты которых они могут выбирать независимо (гипотеза независимого поведения (ГНП)). Если ГНП не выполнена, то есть существуют общие (глобальные) ограничения на выбираемые АЭ состояния, то сначала решают задачу управления в рамках ГНП, а затем исследуют реализуемость состояний с точки зрения глобальных ограничений. Так, например, для согласованных механизмов управления (обеспечивающих совпадение состояний АЭ с плановыми значениями - планом называется желательное с точки зрения центра состояние АЭ) достаточно чтобы глобальным ограничениям удовлетворяли только планы.

Альтернативой (часто используемой в теории игр с непротивоположными интересами [276, 336]) является наложение на АЭ бесконечных штрафов в случае нарушения глобальных ограничений.
Предположим, что целевая функция i-го АЭ fi(y,u), отражает его предпочтения на множестве AxU. Определим P(u) - множество решений игры АЭ (множество реализуемых действий) как множество равновесных при заданном управлении и е U стратегий АЭ.

В одноэлементной АС P(u) является множеством точек максимума целевой функции АЭ, в многоэлементных системах -множество равновесий (в максиминнных стратегиях, или доминантных стратегиях, или равновесий Нэша, Байеса, Штакельберга и т.д. - в зависимости от конкретной задачи). Множество решений игры отражает предположения центра (исследователя операций) о поведении управляемых субъектов (активных элементов) при заданном управлении.

Далее, центр, интересы которого идентифицируются с интересами АС в целом и на позициях которого находится исследователь операций (см. 12 обсуждение этого предположения в [84, 195, 276]), должен конкретизировать свои предположения о стратегиях, выбираемых элементами из множества решений игры. Наиболее часто применяются два предельных подхода - метод максимального гарантированного результата (МГР), при использовании которого центр рассчитывает на наихудший для него выбор АЭ, и гипотеза благожелательности (ГБ), в рамках которой АЭ выбирают из множества решений игры наиболее предпочтительные с точки зрения центра действия.

Далее по умолчанию будем считать выполненной гипотезу благожелательности. При этом задача управления АС заключается в поиске допустимого управления, максимизирующего целевую функцию центра:
u е Arg max max F(u,y), ueU y eP(u)
то есть управления, имеющего максимальную эффективность
K(u)= max F(u,y) (или максимальную гарантированную
y eP(u)
эффективность Kg(u) = min F(u,y)).
y eP(u)
Отметим, что приведенная теоретико-игровая формулировка задачи управления АС, в которой центр является метаигроком, обладающим правилом первого хода и имеющим возможность назначать свою стратегию, которая зависит от стратегий АЭ: u=u (y), является игрой типа Г2 в терминологии теории иерархических игр [276]. Зависимость u () называется механизмом управления в узком смысле (см. определение выше).

Два важных частных случая общей постановки составляют задачи стимулирования и задачи планирования.
Содержательно, в задаче стимулирования6 стратегией центра является выбор системы (механизма) стимулирования (набора функций стимулирования) s(y) = (7i(y)}, ставящих в соответствие действиям АЭ величины вознаграждений, получаемых от центра, то есть u = s(y). Задачей синтеза оптимальной функции стимулирования называется задача поиска допустимой системы стимулирования, имеющей максимальную эффективность.

При их изучении основной акцент делается на исследовании влияния параметров АС и ограничений механизма стимулирования на множество решений игры, которое в задачах стимулирования называется множеством реализуемых действий.
В задаче планирования стратегией центра является выбор множества возможных сообщений АЭ и механизма (процедуры) планирования, ставящей в соответствие сообщениям элементов центру о неизвестных ему существенных параметрах назначаемый АЭ вектор планов. При их изучении основной акцент, помимо анализа эффективности, делается на исследовании выгодности для АЭ сообщения центру достоверной информации - так называемая проблема манипулируемости.

В более узком значении термин задача планирования используется в задачах стимулирования, когда на втором шаге ее решения (см. ниже) при известных множествах реализуемых действий решается задача оптимального согласованного планирования (ОСП), то есть задача выбора конкретного действия АЭ, которое центру наиболее выгодно реализовать.
Закончив краткое описание базовой модели, перейдем к классификации задач управления АС.

3. Классификация задач управления активными системами

Перечисленные в предыдущем разделе параметры, определяющие конкретную модель активной системы, можно рассматривать в качестве оснований системы классификации [152, 231, 233, 239, 382]. Основные значения признаков классификации по различным основаниям приводятся ниже.

В рамках каждого из значений признаков возможна более детальная иерархическая классификация.
1. Состав АС: число АЭ - одноэлементные и многоэлементные АС (см. более подробно [152, 153, 195, 371]).
2. Структура АС: число уровней иерархии - двухуровневые, трехуровневые и др. АС; подчиненность АЭ - АС с унитарным контролем (веерного типа, в которых структура подчиненности имеет вид дерева, то есть каждый АЭ подчинен одному и только одному управляющему органу) и АС с распределенным контролем (АС РК, в которых АЭ может быть подчинен одновременно нескольким управляющим органам, в том числе - многоканальные АС); взаимозависимость показателей деятельности, функций выигрыша и индивидуальных управлений АЭ - независимые АЭ, слабо связанные АЭ, сильно связанные АЭ (см. более подробно [13, 152, 363, 382, 406]).
3. Число периодов функционирования: статические (участники АС производят выбор стратегий однократно) и динамические АС. Динамические АС, в зависимости от взаимосвязи периодов функционирования и учета участниками АС влияния последствий принимаемых решений на будущие периоды функционирования, могут в свою очередь подразделяться на АС с дальновидными и недальновидными АЭ, адаптивные и неадаптивные АС и т.д. (см. более подробно [31, 195, 201, 371, 410, 425, 426]).
4. Целевые функции определяют конкретный тип задачи управления - задача стимулирования, задача планирования или какие-либо их частные случаи - базовые модели и т.д. (см. ниже).
5. Допустимые множества - независимые или взаимозависимые множества возможных выборов (состояний) участников АС (см. ГНП выше); размерность пространства индивидуальных состояний АЭ и планов - АЭ со скалярными и векторными предпочтениями (см. более подробно [28, 46, 54, 195, 224, 363, 406]).
6. Порядок функционирования: в первом приближении достаточно выделить стандартный и нестандартный порядок функционирования. Стандартный порядок функционирования соответствует, например, базовой модели, описанной выше.
7. Информированность участников - основание классификации, по которому на сегодняшний день предложено наибольшее число значений признаков и, соответственно, наибольшее число подклассификаций. Наиболее грубым является разделение АС на АС с симметричной (одинаковой) и асимметричной
информированностью участников (в первую очередь важно определить различие в информированностях АЭ и центра), а также на детерминированные АС и АС с неопределенностью. В свою очередь АС с неопределенностью могут классифицироваться по следующим основаниям.
7.1. Тип неопределенности: внутренняя неопределенность (относительно параметров самой АС), для внутренней неопределенности - относительно целевых функций, допустимых множеств или и того и другого; внешняя неопределенность (относительно параметров окружающей среды, то есть внешних по отношению к АС) и смешанная неопределенность (для части участников АС - внутренняя, для других - внешняя; или обеих типов).
7.2. Вид неопределенности: интервальная (когда участнику АС известно множество возможных значений неопределенного параметра), вероятностная (известно вероятностное распределение
- вероятностные АС) и нечеткая (известна функция принадлежности - нечеткие АС) неопределенность, а также смешанная неопределенность (все возможные комбинации перечисленных видов неопределенности для различных участников).
7.3. Принципы поведения участников АС (методы устранения неопределенности и принципы рационального поведения - напомним, что выше мы ввели предположение о бескоалиционное™ поведения АЭ): использование МГР, ожидаемых полезностей, максимально недоминируемых альтернатив, сообщения информации, выбор структуры системы и т.д.
По различным основаниям возможно значительное число различных признаков классификации и их комбинаций. Следует также отметить, что не все комбинации значений признаков являются допустимыми. Так, например, использование ожидаемых полезностей возможно только в вероятностных АС, сообщение информации имеет смысл только при асимметричной информированности и должно предусматриваться порядком функционирования АС и т. д.
В соответствии с приведенной системой классификаций рассмотренная в предыдущем разделе базовая модель АС является: многоэлементной с несвязанными АЭ, двухуровневой с унитарным контролем, статической, со стандартным порядком функционирования, скалярными предпочтениями АЭ, детерминированной с симметричной информированностью участников активной системой. Аналогичным образом в рамках введенной системы классификаций можно описать любую модель АС, что позволит нам в дальнейшем достаточно кратко и унифицированно определять классы активных систем, исследованию которых посвящены приводимые в библиографии работы.
4. Механизмы стимулирования в активных системах
Рассмотрим сначала одноэлементную задачу. В соответствии с классификацией, введенной выше, базовой детерминированной задачей стимулирования является следующая задача. Пусть активная система состоит из центра и одного активного элемента.

Интересы участников выражены их целевыми функциями: Фі(у) = H(y) и f(y) = s(y) - c(y), где y e A - действие АЭ, H(y) - функция дохода центра, s(y) e M - функция стимулирования, c(y) - функция затрат АЭ. Стратегией центра является назначение функции стимулирования из класса M с целью максимизации своей целевой функции Fj(y) при условии, что АЭ выберет при известной функции стимулирования действие из множества A, максимизирующее его собственную целевую функцию f(y). Множество действий АЭ, доставляющих максимум его целевой функции при данной системе стимулирования называется множеством реализуемых действий (множеством

Содержание раздела