Чтобы по выборке можно было достаточно уверенно судить о случай-
ной величине, выборка должна быть репрезентативной (представительной). Репрезентативность выборки обеспечивается случайностью отбора и означает, что объекты выборки достаточно хорошо представляют генеральную совокупность.
Оценка параметра а - функция вида a = a(X1,X2,...,Xn), где n - число испытаний случайной величины X, a X1,X2,...,X„ - наблюдаемые значения этой величины. Оценка параметра должна быть эффективной, т.е. в среднем иметь минимальный разброс.
Оценка а - неизвестного параметра, получаемого при испытании, одним числом, называется "точечной". Для представления точности и надежности оценки параметра а в математической статистике используют понятия "доверительный интервал" и "доверительная вероятность".
Доверительный интервал - интервал значений параметра а, совместимых с опытными данными и не противоречащих им.
Функция надежности - функция распределения времени безотказной работы системы. Функцией распределения случайной величины X называется функция F(x), задающая вероятность того, что случайная величина X принимает значение, меньшее х, т.е.
F(x) = P(Xx).
Отказ - событие, состоящее в полной или частичной утрате работоспособности системы. Так как не всякая неисправность приводит к отказу, то на практике различают неисправности основные и второстепенные. Основные неисправности приводят к отказу.
Второстепенные неисправности не приводят к отказу, однако создают неудобства в эксплуатации и портят внешний вид АИС. Поэтому второстепенные неисправности целесообразно своевременно устранять.
Возникновение отказа во времени - случайное событие, что позволяет для оценки надежности ЭВМ использовать методы теории вероятности и математической статистики.
Интенсивность отказов - условная плотность вероятности отказа оборудования в момент времени t, если до этого момента объект находился в работоспособном состоянии. Плотностью распределения вероятности называется первая производная функции распределения.
Чтобы определить влияние на характеристики АИС отказов различного вида, целесообразно произвести их классификацию. По характеру изменения параметров до момента возникновения отказы делят на внезапные и постепенные.
Внезапные (катастрофические) отказы возникают в результате мгновенного изменения одного или нескольких параметров элементов, из которых построена АИС (обрыв или короткое замыкание). Устранение внезапного отказа производят заменой отказавшего элемента (блока, устройства) исправным или его ремонтом. Постепенные отказы возникают в результате постепенного изменения параметров элементов до тех пор, пока
значение одного из параметров не выйдет за некоторые пределы, определяющие нормальную работу элементов (старение элементов, воздействие окружающей среды, колебания температуры, влажности, давления, уровня радиации и т. п., механические воздействия - вибрации, удары, перегрузки). Устранение постепенного отказа связано либо с заменой, ремонтом, регулировкой параметров отказавшего элемента, либо с компенсацией за счет изменения параметров других элементов.
По характеру устранения отказы делят на устойчивые и самоустраняющиеся. Для устранения устойчивых отказов оператор, обслуживающий АИС, должен отрегулировать или заменить отказавший элемент. Самоустраняющиеся отказы исчезают без вмешательства оператора и проявляются в форме сбоя или перемежающего отказа. Сбой - однократно возникающий самоустраняющийся отказ.
Если несколько сбоев следуют друг за другом, то имеет место перемежающийся отказ. Отказ типа сбоя особенно характерен для ЭВМ и построенных на их основе АИС. Появление сбоев обусловливается внешними и внутренними факторами.
К внешним факторам относятся колебания напряжения питания, вибрации, температурные колебания. Специальными мерами (стабилизацией питания, амортизацией, термостатированием и др.) влияние этих факторов может быть значительно ослаблено.
К внутренним факторам относятся флуктуационные колебания параметров элементов, несинхронность работы отдельных устройств, внутренние шумы и наводки.
Если в АИС возникает сразу несколько отказов, то по их взаимной связи различают независимые отказы (возникновение их не связано с предшествующими отказами) и зависимые (появление их вызвано отказом в предыдущий момент времени).
По внешним проявлениям отказы делят на явные и неявные. Явные отказы обнаруживаются при внешнем осмотре, а неявные отказы - специальными методами контроля.
При обработке результатов эксперимента статистическими методами используются следующие понятия:
Закон больших чисел - теоремы, устанавливающие количественные соотношения для приближения средних характеристик большого числа опытов (испытаний) к математически точным характеристикам.
Теория оценок - раздел математической статистики, в котором рассматриваются методы определения числовых значений характеристик случайных величин на основании ограниченного числа испытаний. Теория оценок имеет дело с числовыми оценками случайных величин, а не с определением законов их распределения.
Оценка параметра должна быть несмещенной, т.е. не должна содержать систематических отклонений.
Проверка статистических гипотез - раздел математической статистики, в котором рассматриваются методы определения законов распределения случайных величин.
Развитие математической теории надежности является обязательным атрибутом современной технологии создания этих систем: выдача количественных рекомендаций (в терминах задач надежности - это априорные вероятностные расчеты на ранних стадиях создания; решение различных оптимизационных задач на этапах разработки и эксплуатации; проведение апостериорных статистических оценок по результатам специальных испытаний и реальной эксплуатации) - это основное условие обоснованных и грамотных с технико-экономической точки зрения инженерных решений.
Особенностью математических моделей надежности АИС является то, что эти модели имеют дело с вероятностными процессами и используют в качестве исходных данных достаточно недостоверную статистику, иногда эта статистика вообще отсутствует. Тем не менее, создание математических моделей, в конечном счете, направлено на количественное оценивание уровня надежности и эффективности функционирования систем информатики.
Модель позволяет формировать различные рекомендации по повышению надежности за счет правильного и обоснованного выбора структуры системы, правил ее использования, методов технического обслуживания. Если не всегда можно с полным основанием доверять абсолютным значениям вычисленных априорно или оцененных статистически тех или иных показателей надежности, то для сравнительного анализа надежности различных вариантов построения или использования технических систем математические методы расчета надежности являются поистине незаменимыми.
Чем сложнее система и принцип ее организации, тем эффективнее на любом этапе проектирования, разработки и эксплуатации использование математических методов анализа и синтеза.
Каждая математическая модель является, безусловно, лишь грубым абстрактным описанием реального объекта. Она отражает лишь те стороны реального явления, которые являются решающими в данном конкретном исследовании. Другие, менее существенные свойства явления могут быть полностью проигнорированы.
Это может привести к тому, что при более глубоком и всестороннем исследовании реального явления могут оказаться недостаточными взятые в исходной модели характеристики, параметры, свойства: модель может оказаться в определенном смысле несостоятельной.
Естественно, что та или иная математическая модель отображает степень нашего познания исследуемой технической системы. К сожалению, опыт показывает, что априорные представления даже о сравнительно общих принципах функционирования создаваемых сложных систем иногда весьма далеки от истины.
Так, в сложных сетях передачи данных протоколы сетевого уровня часто бывают столь трудными в смысле описания, что допускают лишь имитационные способы математического моделирования; отсутствие в настоящее время хороших критериев степени проверки программного обеспечения вычислительных систем не позволяет создавать адекватных математических моделей вычислительных процессов и т. д. Однако необходимость исследования созданной системы в целях устранения различных неполадок, отыскания путей ее улучшения, разработки методов рациональной эксплуатации и т. д. приводит к необходимости ее более глубокого изучения.
В этом смысле любая "наилучшая" математическая модель процессов функционирования сложной системы является лишь наиболее полным возможным приближением к исследуемому процессу на данном уровне его понимания. Уточнение математической модели возможно лишь при дальнейшем изучении реального объекта, при сравнении теоретических результатов с опытными данными.
Процесс создания адекватной математической модели в теории надежности заключается не только в теоретической разработке какой-либо гипотезы о реальном поведении объекта, но и в постоянной проверке соответствия принятой гипотезы имеющимся статистическим данным, получаемым опытным путем.
Итак, более глубокое исследование системы позволяет строить модель, точнее соответствующую реальной системе. Но более сложная математическая модель требует, как правило, более детальных исходных данных, с одной стороны, и более тонких методов математического исследования - с другой.
И хотя, казалось бы, подобное уточнение математической модели является желательным и даже необходимым для более точного изучения исследуемого объекта, возникает далеко не праздный вопрос: нужно ли стремиться к тому, чтобы математическая модель надежности системы была очень точной?
Чрезмерное уточнение математической модели не всегда имеет смысл. Дело в том, что сама по себе математическая модель решает далеко не все.
Как правило, для получения количественных результатов мы пользуемся исходными экспериментальными данными на основании достаточно ограниченного числа опытных данных, т. е. не являющихся достаточно достоверными. Кроме того, если математическая модель надежности сложна, приходится прибегать к различным вычислительным методам, приводящим к неизбежным погрешностям. Эти два фактора - недостоверность
(или неточность) исходных данных и погрешности вычислительных методов - могут свести на нет все те преимущества, которых мы пытаемся добиться, создавая очень точную математическую модель. Естественно, возникает вопрос о целесообразности создания точной математической модели исследуемой системы. Иными словами, сама по себе "чистая" модель надежности не является полностью определяющим средством исследования реальной системы и точность ее должна определяться конкретными условиями: требуемой точностью исследования, достоверностью различных исходных данных, возможной точностью численных расчетов и т. д.
Малая достоверность исходных статистических данных, неточность математической модели (невозможность учета всех факторов, идеализация отдельных процессов и т. д.) и, как следствие этого, погрешности в окончательных результатах могут зародить сомнение в полезности расчетов надежности. Поэтому крайне важно понять, когда и для чего нужны расчеты надежности.
Во-первых, расчеты надежности функционирования, безусловно, приносят большую пользу на ранних этапах проектирования, когда возникает вопрос о сравнении различных возможных вариантов построения системы, ее архитектуры, организации вычислительных и информационных процессов и выборе наилучших из них.
Во-вторых, расчеты надежности производятся на стадии технического проектирования, когда уже более детально известны состав системы, ее структура и принципы функционирования, что позволяет проверить правильность принятых решений, найти слабые места и выработать определенные рекомендации по повышению надежности эффективности функционирования.
В-третьих, расчетные методы часто оказываются незаменимыми, а порой и единственно возможными на этапе испытания сложных систем информатики. Очень часто большие и сложные системы приходится испытывать либо по частям (причем обычно в течение разного времени), либо даже не в полном штатном составе.
В обоих случаях единственным способом получить оценку показателей надежности является расчетно-экспериментальный метод.
В-четвертых, только расчетные и расчетно-экспериментальные методы надежности дают возможность обоснованно планировать и прогнозировать стратегию модернизации и развития больших систем информатики: систем передачи данных, вычислительных сетей и т. п.
В-пятых, именно расчетные методы (по организации контроля исправности, по проведению профилактического обслуживания и т. п.) могут обеспечить рациональный режим эксплуатации средств информатики.
Наконец, составление математических моделей структуры взаимодействия элементов системы, процессов функционирования, правил технического обслуживания приводит к необходимости все глубже вникать в суть создаваемой технической системы, все больше понимать ее специфические особенности и тем самым не только количественно оценивать характеристики надежности, но и вырабатывать "попутно" полезные качественные рекомендации по повышению надежности и обеспечению оптимальных режимов функционирования и обслуживания.
Следует подчеркнуть, что чем сложнее исследуемая система, тем эффективнее использование математических расчетных методов на всех этапах ее разработки и использования.
Общие требования для построения математических моделей:
1. Математическая модель должна отражать основные свойства исследуемого объекта с точки зрения интересующего параметра или группы параметров. Например, если рассматривается время доставки сообщений в системе с пакетной коммутацией, то подходящей математической моделью может быть сеть массового обслуживания с ненадежными обслуживающими устройствами (узлами коммутации, каналами связи).
Если же изучается вопрос живучести сети по отношению к различного рода внешним воздействиям, то при выборе в качестве основного показателя вероятности связности подходящей математической моделью может оказаться граф с сетевой структурой.
2. Математическая модель должна быть достаточно простой в содержательном смысле, т. е. результаты ее анализа должны быть легко интерпретируемы. Это означает, например, что слишком подробная модель, обеспечивающая одновременное получение большого числа взаимосвязанных параметров, может и не быть наилучшим вариантом.
Например, получение совместного распределения числа обслуживаемых заявок в сети связи в различных узлах коммутации может оказаться той информацией, которую исследователь не умеет принципиально использовать. Однако эта модель позволяет анализировать "узкие" места в сети связи, в которой используются гораздо меньшие и более обозримые объемы выходной информации.
3. Математическая модель должна быть "адаптированной" под имеющиеся исходные данные. Например, бессмысленно строить полумарковскую модель для описания процесса функционирования системы с восстановлением, если о распределениях известны лишь значения математических ожиданий.
Если при таких же исходных данных требуется оценить значения структурных параметров сети, то нужно иметь в виду, что могут быть получены лишь двусторонние оценки, а не точные значения соответствующих параметров.
4. Как правило, наличие неполных или слишком недостоверных дан-
ных (а именно это и является, к сожалению, отличительной особенностью данных о надежности) делает очень оправданным упрощение математических моделей.
5. Математическая модель должна быть легко модифицируемой при появлении новых исходных данных или новых сведений о внутренней природе системы. Например, статистическая модель системы передачи данных в режиме пакетной коммутации должна предусматривать возможность использования ее при различных протоколах верхнего уровня.
Математическая модель для статистического моделирования системы связи с коммутацией сообщений должна иметь общее программное ядро с математической моделью системы связи с коммутацией каналов.
6. Наконец, математическая модель системы информатики - объекта весьма сложного и содержащего огромное число входящих в ее состав подсистем и устройств - должна быть сформулирована так, чтобы размерность этой модели позволяла бы проводить достаточно конструктивным образом расчеты на доступной вычислительной технике в разумные сроки. В первую очередь это касается тех моделей, которые предназначены для использования в режиме советчика в реальном масштабе времени.