d9e5a92d

Приложение 1. Основы теории нечетких множеств


П1.1. Носитель Носитель U . это универсальное множество, к которому относятся все результаты наблюдений в рамках оцениваемой квазистатистики. Например, если мы наблюдаем возраст занятых в определенных отраслях экономики, то носитель .
это отрезок вещественной оси [16, 70], где единицей измерения выступают годы жизни человека.
П1.2. Нечеткое множество Нечеткое множество А . это множество значений носителя, такое, что каждому значению носителя сопоставлена степень принадлежности этого значения множеству А. Например: буквы латинского алфавита X, Y, Z безусловно принадлежат множеству Alphabet = {A, B, C, X, Y, Z}, и с этой точки зрения множество Alphabet . четкое. Но если анализировать множество «Оптимальный возраст работника», то возраст 50 лет принадлежит этому нечеткому множеству только с некоторой долей условности , которую называют функцией принадлежности.
П1.3. Функция принадлежности Функция принадлежности А(u) . это функция, областью определения которой является носитель U, u  U, а областью значений . единичный интервал [0,1]. Чем выше А(u), тем выше оценивается степень принадлежности элемента носителя u нечеткому множеству А.
Рис. П1.1. Функция принадлежности нечеткого подмножества «Оптимальный возраст работника» П1.4. Лингвистическая переменная Заде [25] определяет лингвистическую переменную так:  =   M G U T , , ), ( ,   , (П1.1) где  - название переменной, Т . терм-множество значений, т.е. совокупность ее лингвистических значений, U . носитель, G . синтаксическое правило, порождающее термы множества Т, М . семантическое правило, которое каждому лингвистическому значению  ставит в соответствие его смысл М(), причем М() обозначает нечеткое подмножество носителя U. К примеру, зададим лингвистическую переменную  = «Возраст

работника». Определим синтаксическое правило G как определение «оптимальный», налагаемое на переменную . Тогда полное терм-множество значений T = { T1 = Оптимальный возраст работника, T2 = Неоптимальный возраст работника }. Носителем U выступает отрезок [20, 70], измеряемый в годах человеческой жизни. И на этом носителе определены две функции принадлежности: для значения T1 - T1(u), она изображена на рис. П1.1, для T1 - T2(u), причем первая из них отвечает нечеткому подмножеству M1, а вторая . M2. Таким образом, конструктивное описание лингвистической переменной завершено.



П1.5. Операции над нечеткими подмножествами Для классических множеств вводятся операции:  пересечение множеств . операция над множествами А и В, результатом которой является множество С = А  В, которое содержит только те элементы, которые принадлежат и множеству A и множеству B;  объединение множеств - операция над множествами А и В, результатом которой является множество С = А  В, которое содержит те элементы, которые принадлежат множеству A или множеству B или обоим множествам;  отрицание множеств - операция над множеством А, результатом которой является множество С =  А, которое содержит все элементы, которые принадлежат универсальному множеству, но не принадлежат множеству A. Заде предложил набор аналогичных операций над нечеткими множествами через операции с функциями принадлежности этих множеств. Так, если множество А задано функцией А(u), а множество В задано функцией В(u), то результатом операций является множество С с функцией принадлежности С(u), причем:
 если С = А  В, то С(u) = min(А(u), В(u)); (П1.2)
 если С = А  В, то С(u) = max(А(u), В(u)); (П1.3)
 если С =  А, то С(u) = 1-А(u). (П1.4)
П1.6. Нечеткие числа и операции над ними Нечеткое число . это нечеткое подмножество универсального множества действительных чисел, имеющее нормальную и выпуклую функцию принадлежности, то есть такую, что а) существует такое значение носителя, в котором функция принадлежности равна единице, а также а) при отступлении от своего максимума влево или вправо функция принадлежности убывает. Рассмотрим два типа нечетких чисел: трапециевидные и треугольные. П1.6.1. Трапециевидные (трапезоидные) нечеткие числа Исследуем некоторую квазистатистику и зададим лингвистическую переменную  = «Значение параметра U», где U . множество значений носителя квазистатистики. Выделим два терм-множества значений: T1 = «U у лежит в диапазоне примерно от a до b» с нечетким подмножеством М1 и безымянное значение T2 с нечетким подмножеством М2, причем выполняется М2 =  М1.

Тогда функция принадлежности T1(u) имеет трапезоидный вид, как показано на рис. П1.2. Рис. П1.2. Функция принадлежности трапециевидного числа Поскольку границы интервала заданы нечетко, то разумно ввести абсциссы вершин трапеции следующим образом: а = (а1+а2)/2, в = (в1+в2)/2, (П1.5) при этом отстояние вершин а1, а2 и в1, в2 соответственно друг от друга обуславливается тем, что какую семантику мы вкладываем в понатие «примерно»: чем больше разброс квазистатистики, тем боковые ребра трапеции являются более пологими. В предельном случае понятие «примерно» выраждается в понятие «где угодно». Если мы оцениваем параметр качественно, например, высказавшись «Это значение параметра является средним», необходимо ввести уточняющее высказывание типа «Среднее значение . это примерно от a до b», которое есть предмет экспертной оценки (нечеткой классификации), и тогда можно использовать для моделирования нечетких классификаций трапезоидные числа. На самом деле, это самый естественной способ неуверенной классификации. П1.6.2. Треугольные нечеткие числа Теперь для той же лингвистической переменной зададим терм-множество Т1={U приблизительно равно а}. Ясно, что аа, причем по мере убывания до нуля степень уверенности в оценке растет до единицы. Это, с точки зрения функции принадлежности, придает последней треугольный вид (рис. П1.3), причем степень приближения характеризуется экспертом.



Рис. П1.3. Функция принадлежности треугольного нечеткого числа Треугольные числа . это самый часто используемый на практике тип нечетких чисел, причем чаще всего - в качестве прогнозных значений параметра.



П1.6.3. Операции над нечеткими числами Целый раздел теории нечетких множеств . мягкие вычисления (нечеткая арифметика) - вводит набор операций над нечеткими числами. Эти операции вводятся через операции над функциями принадлежности на основе так называемого сегментного принципа. Определим уровень принадлежности как ординату функции принадлежности нечеткого числа. Тогда пересечение функции принадлежности с нечетким числом дает пару значений, которые принято называть границами интервала достоверности. Зададимся фиксированным уровнем принадлежности и определим соответствующие ему интервалы достоверности по двум нечетким числам A и B : [a1, a2] и [b1, b2], соответственно. Тогда основные операции с нечеткими числами сводятся к операциям с их интервалами достоверности. А операции с интервалами, в свою очередь, выражаются через операции с действительными числами - границами интервалов:
 операция "сложения":
[a1, a2] (+) [b1, b2] = [a1 + b1, a2 + b2], (П1.6)

Из существа операций с трапезоидными числами можно сделать ряд важных утверждений (без доказательства):  действительное число есть частный случай треугольного нечеткого числа;  сумма треугольных чисел есть треугольное число;  треугольное (трапезоидное) число, умноженное на действительное число, есть треугольное (трапезоидное) число;  сумма трапезоидных чисел есть трапезоидное число;  сумма треугольного и трапезоидного чисел есть трапезоидное число. Анализируя свойства нелинейных операций с нечеткими числами (например, деления), исследователи приходят к выводу, что форма функций принадлежности результирующих нечетких чисел часто близка к треугольной. Это прозволяет аппроксимировать результат, приводя его к треугольному виду. И, если приводимость налицо, тогда операции с треугольными числами сводятся к операциям с абсциссами вершин их функций принадлежности. То есть, если мы вводим описание треугольного числа набором абсцисс вершин (a, b, c), то можно записать:
(a1, b1, c1) + (a2, b2, c2) (a1 + a2, b1 + b2, c1 + c2) (П1.11)
Это . самое распространенное правило мягких вычислений.



П1.7. Нечеткие последовательности, нечеткие прямоугольные матрицы, нечеткие функции и операции над ними Нечеткая последовательность . это пронумерованное счетное множество нечетких чисел. Нечеткая прямоугольная матрица . это дважды индексированное конечное множество нечетких чисел, причем первый индекс пробегает M строк, а второй - N столбцов. При этом, как и в случае матриц действительных чисел, операции над нечеткими прямоугольными матрицами сводятся к операциям над нечеткими компонентами этих матриц. Например, где все операции над нечеткими числами производятся так, как они введены параграфом выше.
Поле нечетких чисел . это несчетное множество нечетких чисел. Нечеткая функция . это взаимно однозначное соответствие двух полей нечетких чисел. В наших приложениях область определения нечеткой функции явзяется осью действительных чисел, то есть вырожденным случаем поля нечетких чисел, когда их треугольные функции принадлежности вырождаются в точку с координатами (а, 1). Нечеткую функцию уместно назвать по типу тех чисел, которые характеризуют область ее значений. Если поле значений . это поле треугольных чисел, то и саму функцию уместно назвать треугольной.
Например [58], прогноз продаж компании (нарастающим итогом) задан тремя функциями вещественной переменной: f1(T) . оптимистичный прогноз, f2(T) . пессимистичный прогноз, f3(T) . среднеожидаемые значения продаж, где Т . время прогноза. Тогда лингвистическая переменная «Прогноз продаж в момент Т» есть треугольное число ( f1(T), f2(T), f3(T) ), а все прогнозное поле есть треугольная нечеткая функция (рис. П1.4), имеющая вид криволинейной полосы.



Рис. П1.4. Нечеткий прогноз продаж Рассмотрим ряд операций над треугольными нечеткими функциями (утверждения приводятся без доказательства):  сложение: сумма (разность) треугольных функций есть треугольная функция;  умножение на число переводит треугольную функцию в треугольную функцию;  дифференцирование (интегрирование) треугольной нечеткой функции проводится по правилам вещественного дифференцирования (интегрирования): функция, зависящая от нечеткого параметра, является нечеткой. П1.8. Вероятностное распределение с нечеткими параметрами Пусть имеется квазистатистика и ее гистограмма и пусть одна из возможных плотностей вероятностной функции распределения, приближающая квазистатистику, обозначается нами как p(u, ), где u . значение носителя, u  U,  = (x1,., xN) - вектор параметров распределения размерностью N. Произведем гипотетический эксперимент. Оценим вид функции распределения p(), производя вариацию всех параметров вектора .





При этом гладкой функцией без изломов и разрывов (например, квадратичной многомерной параболой) - и пронормируем значение критерия. Например, если максимум правдоподобия имеет значение L, то вектор параметров  приобретает значение, которое мы будем называть контрольной точкой или точкой ожидания с координатами (x1L,., xNL) . Мы можем производить нормирование правдоподобия, задавшись некоторым процентом максимума правдоподобия, ниже которого наши вероятностные гипотезы бракуются. Тогда всем правдоподобным вероятностным гипотезам отвечает множество векторов ., которое в N-мерном фазовом пространстве представляет собой выпуклую область с нелинейными границами. Впишем в эту область N-мерный параллелепипед максимального объема, грани которого сориентированы параллельно фазовым осям. Тогда этот параллелепипед представляет собой усечение . и может быть описан набором интервальных диапазонов по каждой компоненте Назовем .. зоной предельного правдоподобия. Разумеется, контрольная точка попадает в эту зону , то есть выполняется что вытекает из унимодальности и гладкости критерия правдоподобия.
Тогда мы можем рассматривать числа (xi1, xiL, xi2) как треугольные нечеткие параметры плотности распределения, которая и сама в этом случае имеет вид нечеткой функции. А зона предельного правдоподобия тогда есть не что иное, как нечеткий вектор. Мы видим, что полученное вероятностное распределение имеет не только частотный, но и субъективный смысл, так как зона предельного правдоподобия зависит от того, как мы бракуем вероятностные гипотезы. Представляется, что такое описание всецело отвечает природе квазистатистики, как мы ее здесь вводим. Чем хуже условия для выдвижения правдоподобных вероятностных гипотез, чем тяжелее обосновывать такое правдоподобие, - тем большее значение занимает фактор экспертной оценки. То вероятностное описание, что мы имеем в итоге, - это гибрид, который обещает быть плодотворным. В качестве примера можно рассмотреть нормальный закон распределения с нечетким среднеквадратическим отклонением (рис. П1.5). Эта нечеткая функция не имеет полосового вида. И тут замое время заметить, что функция с треугольными нечеткими параметрамив общем случае сама не является треугольной и к треугольному виду не приводится.





Рис. П1.5. Нормальный закон распределения с нечетким среднеквадратическим отклонением Зато выполняется нормировочное условие: где правая часть представляет собой нечеткое число с вырожденной в точку функцией принадлежности. Интеграл же, не определенный для не четких функций общего вида, представляет здесь предел сумм Приложим все сказанное к нечеткой оценке параметров доходности и риска фондового индекса. Пусть у нас есть квазистатистика доходностей (r1, .rN) мощности N и соответствующая ей гистограмма (1,...,M) мощности M. Для этой квазистатистики мы подбираем двупараметрическое нормальное распределение () с матожиданием  и дисперсией , руководствуясь критерием правдоподобия

где ri . отвечающее i-му столбцу гистограммы расчетное значение доходности, r .

уровень дискретизации гистограммы.





Задача (П1.19) . это задача нелинейной оптимизации, которое имеет решение

причем 0, 0 . аргументы максимума F(,), представляющие собой контрольную точку. Выберем уровень отсечения F1 < F0 и признаем все вероятностные гипотезы правдоподобными, если соответствующий критерий правдоподобия лежит в диапазоне от F1 до F0. Тогда всем правдоподобным вероятностным гипотезам отвечает множество векторов ., которое в двумерном фазовом пространстве представляет собой выпуклую область с нелинейными границами. Впишем в эту область прямоугольник максимальной площади, грани которого сориентированы параллельно фазовым осям. Тогда этот прямоугольник . зона предельного правдоподобия - представляет собой усечение . и может быть описан набором интервальных диапазонов по каждой компоненте Разумеется, контрольная точка попадает в эту зону, то есть выполняется что вытекает из унимодальности и гладкости функции правдоподобия. Тогда мы можем рассматривать числа треугольные нечеткие параметры плотности распределения (), которая и сама в этом случае имеет вид нечеткой функции.

П1.9. Нечеткие знания Назовем формальным знанием высказывание естественного языка, обладающее следующей структурой:









где a . определяемый объект (аргумент),  - логическая связка принадлежности вида ЕСТЬ/НЕ ЕСТЬ, X . обобщение (класс объектов). Также соблюдается правило очередности в рассмотрении фразы для понимания: сначала все связки И применяются к двум смежным предикатам, а затем все связки ИЛИ применяются к результатам предшествующих операций.

Например, классический вывод «Если Сократ человек, а человек смертен, то и Сократ смертен» можно преобразовать к структуре формального знания по следующим правилам:  вводится два класса объектов X1 = «Человек (Люди)» и X2 = «Смертный (-ая, - ое)»;  рассматриваются два аргумента: a1 = «Сократ», a2 = «Человек» = X1. Тогда наше знание имеет формулу ЕСЛИ a1 ЕСТЬ X1 И (a2 = X1) ЕСТЬ X2 ТО a1 ЕСТЬ X2 (П1.25) Очень часто в структуре знаний классы объектов являются нечеткими понятиями. Также высказывающиеся лица могут делать выводы, содержащие элементы неуверенности, оценочности. Это заставляет нас переходить от знаний в классическом понимании к знаниям нечетким. Введем следующий набор лингвистических переменных со своим терм- множеством значений:
 = Отношение принадлежности = {Принадлежит, Скорее всего принадлежит, Вероятно принадлежит,...., Вероятно не принадлежит, Скорее всего не принадлежит, Не принадлежит} (П1.26)
 = Отношение следования = {Следует, Скорее всего следует, Вероятно следует,...., Вероятно не следует, Скорее всего не следует, Не следует } (П1.27)
AND/OR = Отношение связи = {И/ИЛИ, Скорее всего И/ИЛИ, Вероятно И/ИЛИ,....} (П1.28)

Вводя эти переменные, мы предполагаем, что они содержат произвольное число оттеночных значений, ранжированных по силе (слабости) в определенном порядке. Носителем этих переменных может выступать единичный интервал. Тогда под нечетким знанием можно понимать следующий формализм:
ЕСЛИ (a11X1 1 a22X2 2... aNNXN)  aN+1N+1XN+1, (П1.29)
где ai, Xi .значения своих лингвистических переменных, i .значение переменной принадлежности из , 1 .значение переменной связи из AND/OR,  - терм- значение переменной следования из . Характерным примером нечеткого знания является высказывание типа: «Если ожидаемое в ближайшей перспективе отношение цены акции к доходам по ней порядка 10, и (хотя и не обязательно) капитализация этой компании на уровне 10 млрд. долларов, то, скорее всего, эти акции следует покупать». Курсивом обозначены все оценки, которые делают это знание нечетким. Поскольку нечеткое знание определяется через лингвистические переменные, то и операции нечеткого логического вывода можно количественно определить на базе операций с соответствующими функциями принадлежности. Однако детальное рассмотрение этого вопроса мы опускаем. С некоторых пор нечеткие знания начали активно применяться для выработки брокерских рекомендаций по приобретению (удержанию, продаже) ценных бумаг. Например, монография [139] рассматривает вопрос о целесообразности инвестирования в фондовые активы в зависимости от характера экономического окружения, причем параметры этого окружения являются нечеткими значениями. На сайте [140] автор вышеупомянутой монографии поддерживает бюллетень макроэкономических индикаторов и соответствующих условий инвестирования на тех или иных рынках.
На нечетких знаниях могут быть организованы специализированные экспертные системы, реализующие механизм нечетко-логического вывода. Простейший пример такого рода системы мы находим на сайте [138], где выработка опционной стратегии сопровождается нечеткой предварительной оценкой характера рынка. В этом смысле также представляет интерес и заслуживает упоминания работа [151].



   Содержание раздела