Методы статистической обработки испытаний

Чтобы по выборке можно было достаточно уверенно судить о случай-
ной величине, выборка должна быть репрезентативной (представительной). Репрезентативность выборки обеспечивается случайностью отбора и означает, что объекты выборки достаточно хорошо представляют генеральную совокупность.
Оценка параметра а - функция вида a = a(X₁,X₂,...,X_n), где n - число испытаний случайной величины X, a X₁,X₂,...,X„ - наблюдаемые значения этой величины. Оценка параметра должна быть эффективной, т.е. в среднем иметь минимальный разброс.
Оценка а - неизвестного параметра, получаемого при испытании, одним числом, называется "точечной". Для представления точности и надежности оценки параметра а в математической статистике используют понятия "доверительный интервал" и "доверительная вероятность".
Доверительный интервал - интервал значений параметра а, совместимых с опытными данными и не противоречащих им.
Функция надежности - функция распределения времени безотказной работы системы. Функцией распределения случайной величины X называется функция F(x), задающая вероятность того, что случайная величина X принимает значение, меньшее х, т.е.

F(x) = P(Xx).
Отказ - событие, состоящее в полной или частичной утрате работоспособности системы. Так как не всякая неисправность приводит к отказу, то на практике различают неисправности основные и второстепенные. Основные неисправности приводят к отказу.

Второстепенные неисправности не приводят к отказу, однако создают неудобства в эксплуатации и портят внешний вид АИС. Поэтому второстепенные неисправности целесообразно своевременно устранять.
Возникновение отказа во времени - случайное событие, что позволяет для оценки надежности ЭВМ использовать методы теории вероятности и математической статистики.
Интенсивность отказов - условная плотность вероятности отказа оборудования в момент времени t, если до этого момента объект находился в работоспособном состоянии. Плотностью распределения вероятности называется первая производная функции распределения.
Чтобы определить влияние на характеристики АИС отказов различного вида, целесообразно произвести их классификацию. По характеру изменения параметров до момента возникновения отказы делят на внезапные и постепенные.

Внезапные (катастрофические) отказы возникают в результате мгновенного изменения одного или нескольких параметров элементов, из которых построена АИС (обрыв или короткое замыкание). Устранение внезапного отказа производят заменой отказавшего элемента (блока, устройства) исправным или его ремонтом. Постепенные отказы возникают в результате постепенного изменения параметров элементов до тех пор, пока
значение одного из параметров не выйдет за некоторые пределы, определяющие нормальную работу элементов (старение элементов, воздействие окружающей среды, колебания температуры, влажности, давления, уровня радиации и т. п., механические воздействия - вибрации, удары, перегрузки). Устранение постепенного отказа связано либо с заменой, ремонтом, регулировкой параметров отказавшего элемента, либо с компенсацией за счет изменения параметров других элементов.
По характеру устранения отказы делят на устойчивые и самоустраняющиеся. Для устранения устойчивых отказов оператор, обслуживающий АИС, должен отрегулировать или заменить отказавший элемент. Самоустраняющиеся отказы исчезают без вмешательства оператора и проявляются в форме сбоя или перемежающего отказа. Сбой - однократно возникающий самоустраняющийся отказ.

Если несколько сбоев следуют друг за другом, то имеет место перемежающийся отказ. Отказ типа сбоя особенно характерен для ЭВМ и построенных на их основе АИС. Появление сбоев обусловливается внешними и внутренними факторами.

К внешним факторам относятся колебания напряжения питания, вибрации, температурные колебания. Специальными мерами (стабилизацией питания, амортизацией, термостатированием и др.) влияние этих факторов может быть значительно ослаблено.

К внутренним факторам относятся флуктуационные колебания параметров элементов, несинхронность работы отдельных устройств, внутренние шумы и наводки.
Если в АИС возникает сразу несколько отказов, то по их взаимной связи различают независимые отказы (возникновение их не связано с предшествующими отказами) и зависимые (появление их вызвано отказом в предыдущий момент времени).
По внешним проявлениям отказы делят на явные и неявные. Явные отказы обнаруживаются при внешнем осмотре, а неявные отказы - специальными методами контроля.
При обработке результатов эксперимента статистическими методами используются следующие понятия:
Закон больших чисел - теоремы, устанавливающие количественные соотношения для приближения средних характеристик большого числа опытов (испытаний) к математически точным характеристикам.
Теория оценок - раздел математической статистики, в котором рассматриваются методы определения числовых значений характеристик случайных величин на основании ограниченного числа испытаний. Теория оценок имеет дело с числовыми оценками случайных величин, а не с определением законов их распределения.
Оценка параметра должна быть несмещенной, т.е. не должна содержать систематических отклонений.
Проверка статистических гипотез - раздел математической статистики, в котором рассматриваются методы определения законов распределения случайных величин.

Методы статистической обработки испытаний

Развитие математической теории надежности является обязательным атрибутом современной технологии создания этих систем: выдача количественных рекомендаций (в терминах задач надежности - это априорные вероятностные расчеты на ранних стадиях создания; решение различных оптимизационных задач на этапах разработки и эксплуатации; проведение апостериорных статистических оценок по результатам специальных испытаний и реальной эксплуатации) - это основное условие обоснованных и грамотных с технико-экономической точки зрения инженерных решений.
Особенностью математических моделей надежности АИС является то, что эти модели имеют дело с вероятностными процессами и используют в качестве исходных данных достаточно недостоверную статистику, иногда эта статистика вообще отсутствует. Тем не менее, создание математических моделей, в конечном счете, направлено на количественное оценивание уровня надежности и эффективности функционирования систем информатики.

Модель позволяет формировать различные рекомендации по повышению надежности за счет правильного и обоснованного выбора структуры системы, правил ее использования, методов технического обслуживания. Если не всегда можно с полным основанием доверять абсолютным значениям вычисленных априорно или оцененных статистически тех или иных показателей надежности, то для сравнительного анализа надежности различных вариантов построения или использования технических систем математические методы расчета надежности являются поистине незаменимыми.
Чем сложнее система и принцип ее организации, тем эффективнее на любом этапе проектирования, разработки и эксплуатации использование математических методов анализа и синтеза.
Каждая математическая модель является, безусловно, лишь грубым абстрактным описанием реального объекта. Она отражает лишь те стороны реального явления, которые являются решающими в данном конкретном исследовании. Другие, менее существенные свойства явления могут быть полностью проигнорированы.

Это может привести к тому, что при более глубоком и всестороннем исследовании реального явления могут оказаться недостаточными взятые в исходной модели характеристики, параметры, свойства: модель может оказаться в определенном смысле несостоятельной.
Естественно, что та или иная математическая модель отображает степень нашего познания исследуемой технической системы. К сожалению, опыт показывает, что априорные представления даже о сравнительно общих принципах функционирования создаваемых сложных систем иногда весьма далеки от истины.

Так, в сложных сетях передачи данных протоколы сетевого уровня часто бывают столь трудными в смысле описания, что допускают лишь имитационные способы математического моделирования; отсутствие в настоящее время хороших критериев степени проверки программного обеспечения вычислительных систем не позволяет создавать адекватных математических моделей вычислительных процессов и т. д. Однако необходимость исследования созданной системы в целях устранения различных неполадок, отыскания путей ее улучшения, разработки методов рациональной эксплуатации и т. д. приводит к необходимости ее более глубокого изучения.
В этом смысле любая "наилучшая" математическая модель процессов функционирования сложной системы является лишь наиболее полным возможным приближением к исследуемому процессу на данном уровне его понимания. Уточнение математической модели возможно лишь при дальнейшем изучении реального объекта, при сравнении теоретических результатов с опытными данными.

Процесс создания адекватной математической модели в теории надежности заключается не только в теоретической разработке какой-либо гипотезы о реальном поведении объекта, но и в постоянной проверке соответствия принятой гипотезы имеющимся статистическим данным, получаемым опытным путем.
Итак, более глубокое исследование системы позволяет строить модель, точнее соответствующую реальной системе. Но более сложная математическая модель требует, как правило, более детальных исходных данных, с одной стороны, и более тонких методов математического исследования - с другой.

И хотя, казалось бы, подобное уточнение математической модели является желательным и даже необходимым для более точного изучения исследуемого объекта, возникает далеко не праздный вопрос: нужно ли стремиться к тому, чтобы математическая модель надежности системы была очень точной?
Чрезмерное уточнение математической модели не всегда имеет смысл. Дело в том, что сама по себе математическая модель решает далеко не все.

Как правило, для получения количественных результатов мы пользуемся исходными экспериментальными данными на основании достаточно ограниченного числа опытных данных, т. е. не являющихся достаточно достоверными. Кроме того, если математическая модель надежности сложна, приходится прибегать к различным вычислительным методам, приводящим к неизбежным погрешностям. Эти два фактора - недостоверность
(или неточность) исходных данных и погрешности вычислительных методов - могут свести на нет все те преимущества, которых мы пытаемся добиться, создавая очень точную математическую модель. Естественно, возникает вопрос о целесообразности создания точной математической модели исследуемой системы. Иными словами, сама по себе "чистая" модель надежности не является полностью определяющим средством исследования реальной системы и точность ее должна определяться конкретными условиями: требуемой точностью исследования, достоверностью различных исходных данных, возможной точностью численных расчетов и т. д.
Малая достоверность исходных статистических данных, неточность математической модели (невозможность учета всех факторов, идеализация отдельных процессов и т. д.) и, как следствие этого, погрешности в окончательных результатах могут зародить сомнение в полезности расчетов надежности. Поэтому крайне важно понять, когда и для чего нужны расчеты надежности.
Во-первых, расчеты надежности функционирования, безусловно, приносят большую пользу на ранних этапах проектирования, когда возникает вопрос о сравнении различных возможных вариантов построения системы, ее архитектуры, организации вычислительных и информационных процессов и выборе наилучших из них.
Во-вторых, расчеты надежности производятся на стадии технического проектирования, когда уже более детально известны состав системы, ее структура и принципы функционирования, что позволяет проверить правильность принятых решений, найти слабые места и выработать определенные рекомендации по повышению надежности эффективности функционирования.
В-третьих, расчетные методы часто оказываются незаменимыми, а порой и единственно возможными на этапе испытания сложных систем информатики. Очень часто большие и сложные системы приходится испытывать либо по частям (причем обычно в течение разного времени), либо даже не в полном штатном составе.

В обоих случаях единственным способом получить оценку показателей надежности является расчетно-экспериментальный метод.
В-четвертых, только расчетные и расчетно-экспериментальные методы надежности дают возможность обоснованно планировать и прогнозировать стратегию модернизации и развития больших систем информатики: систем передачи данных, вычислительных сетей и т. п.
В-пятых, именно расчетные методы (по организации контроля исправности, по проведению профилактического обслуживания и т. п.) могут обеспечить рациональный режим эксплуатации средств информатики.
Наконец, составление математических моделей структуры взаимодействия элементов системы, процессов функционирования, правил технического обслуживания приводит к необходимости все глубже вникать в суть создаваемой технической системы, все больше понимать ее специфические особенности и тем самым не только количественно оценивать характеристики надежности, но и вырабатывать "попутно" полезные качественные рекомендации по повышению надежности и обеспечению оптимальных режимов функционирования и обслуживания.
Следует подчеркнуть, что чем сложнее исследуемая система, тем эффективнее использование математических расчетных методов на всех этапах ее разработки и использования.
Общие требования для построения математических моделей:
1. Математическая модель должна отражать основные свойства исследуемого объекта с точки зрения интересующего параметра или группы параметров. Например, если рассматривается время доставки сообщений в системе с пакетной коммутацией, то подходящей математической моделью может быть сеть массового обслуживания с ненадежными обслуживающими устройствами (узлами коммутации, каналами связи).

Если же изучается вопрос живучести сети по отношению к различного рода внешним воздействиям, то при выборе в качестве основного показателя вероятности связности подходящей математической моделью может оказаться граф с сетевой структурой.
2. Математическая модель должна быть достаточно простой в содержательном смысле, т. е. результаты ее анализа должны быть легко интерпретируемы. Это означает, например, что слишком подробная модель, обеспечивающая одновременное получение большого числа взаимосвязанных параметров, может и не быть наилучшим вариантом.

Например, получение совместного распределения числа обслуживаемых заявок в сети связи в различных узлах коммутации может оказаться той информацией, которую исследователь не умеет принципиально использовать. Однако эта модель позволяет анализировать "узкие" места в сети связи, в которой используются гораздо меньшие и более обозримые объемы выходной информации.
3. Математическая модель должна быть "адаптированной" под имеющиеся исходные данные. Например, бессмысленно строить полумарковскую модель для описания процесса функционирования системы с восстановлением, если о распределениях известны лишь значения математических ожиданий.

Если при таких же исходных данных требуется оценить значения структурных параметров сети, то нужно иметь в виду, что могут быть получены лишь двусторонние оценки, а не точные значения соответствующих параметров.
4. Как правило, наличие неполных или слишком недостоверных дан-
ных (а именно это и является, к сожалению, отличительной особенностью данных о надежности) делает очень оправданным упрощение математических моделей.
5. Математическая модель должна быть легко модифицируемой при появлении новых исходных данных или новых сведений о внутренней природе системы. Например, статистическая модель системы передачи данных в режиме пакетной коммутации должна предусматривать возможность использования ее при различных протоколах верхнего уровня.

Математическая модель для статистического моделирования системы связи с коммутацией сообщений должна иметь общее программное ядро с математической моделью системы связи с коммутацией каналов.
6. Наконец, математическая модель системы информатики - объекта весьма сложного и содержащего огромное число входящих в ее состав подсистем и устройств - должна быть сформулирована так, чтобы размерность этой модели позволяла бы проводить достаточно конструктивным образом расчеты на доступной вычислительной технике в разумные сроки. В первую очередь это касается тех моделей, которые предназначены для использования в режиме советчика в реальном масштабе времени.

Вероятностные модели динамики надежности

Показатели надежности АИС: плотность распределения времени безотказной работы f(t), вероятность безотказной работы P(t), вероятность отказа Q(t), интенсивность отказов l(t), средняя наработка до первого отказа Г_ср.
Наиболее точная количественная мера надежности каждого изделия -его индивидуальная наработка до момента возникновения отказа. На практике же достаточно полная характеристика надежности - плотность распределения времени безотказной работы данного типа изделий f(t) и интенсивность отказов l(t). Для определения функций f(t) и l(t) используют экспериментальные данные по испытанию изделий на надежность. При этом опыт ставится следующим образом: испытанию подвергают большую партию изделий N₀, время наблюдения разбивают на n небольших отрезков Dt, на каждом из этих отрезков определяют число отказавших изделий DN. Отказавшие изделия либо не заменяют новыми (при определении f(t) и l(t) невосстанавливаемых элементов), либо заменяют новыми (для восстанавливаемых элементов). По полученным результатам значение вероятности безотказной работы изделия в момент времени t, характеризующее его надежность, может быть определено из следующих соображений.
Если в рассматриваемый момент времени t = t_x имеется N_x работающих изделий, a m_x = N₀ - N_x вышли из строя, то опытная статистическая
вероятность безотказной работы P* = N_x/N₀, а опытная статистическая вероятность отказов Q* = (N₀ - N_x) /N₀ = mJN₀, где P* и Q* характеризуют
частоту отказов в данном опыте и являются оценками соответствующих "математических" вероятностей, которые определяются как пределы:
Nq - N_x
Nq
Nx
Nq
lim m = Q,
Nq N_q
lim
Nq lim
Nq
P = 1 - Q.
"Математические" вероятности характеризуют не отдельную выборку, а всю генеральную совокупность изделий. Определим зависимость P* от времени, для чего рассмотрим приращение Dm на ограниченном отрезке времени Dt. Число элементов Dm_x, которое выйдет из строя за ограниченный промежуток времени Dt, будет пропорционально отрезку времени Dt и числу имеющихся в работе изделий N_x, т. е. коэффициент пропорциональности принимается постоянным на ограниченном отрезке времени.
Переходя к бесконечно малым приращениям dm и учитывая dm_x = -dN_x, получим dm_x = -dN_x = l_tM_xdt; dN_x / N_x = -l_tdt.
Интегрируя последнее выражение и имея в виду, что при t = 0 N_x = N₀найдем,
In N = -jf_Qx l dt
или, если освободиться от логарифмов:
P = N_x/N_q = e4Qx1,dt.
Значение l_t, равное
_Я =_- = d(m_x/m₀) 1 = dQ1 = _ dP 1
t = N_xdt ~ dt N_x/N_q ~ dt P ~ dt P’
называют интенсивностью (опасностью) отказов. Таким образом, интенсивность отказов в момент времени t представляет собой вероятность отказов в единицу времени при условии, что до момента времени t отказов не было.
Зависимость интенсивности отказов от времени может быть определена экспериментально (рис. 2.1).
Анализируя полученную кривую 1, снятую, допустим, при испытаниях в нормальных условиях, можно отметить три временных интервала: 1) от 0 до t₁, - время приработки (1-1,5%) всего времени испытаний, 2) от t ₁, до t₂- время нормальной работы, 3) от t₂ и далее -время старения. Время приработки характеризуется повышенным числом отказов и определяется проявлением технологических и производственных дефектов, время нормальной работы - высокой надежностью испытуемых изделий (интенсивность отказов на этом интервале практически постоянна).
При ослаблении (кривая 2) или ужесточении (кривая 3) условий испытаний зависимость l(t) изменится, но три характерных временных интервала сохранятся.
Полученные ранее зависимости вероятности безотказной работы P(t) от интенсивности отказов l(t) называют экспоненциальным законом изменения P(t), т.е.
P{t) = вчкт
или
P(t) = в-xt,
если l = const. Этот закон имеет место в случае учета внезапных отказов. Известны и другие законы изменения P(t):
1) нормальный закон, или распределение Гаусса (для постепенных
ад л дисперсия среднего времени безотказной работы; Т_ср - среднее время безотказной работы;
Современный Гуманитарный Университет
2) закон Вейбулла (при определении надежности электромеханических элементов):
tklT_cp .
P(t) = e
3) закон Эрланга (при определении надежности восстанавливаемых изделий):
P(t) = (1 + 2tlT_cp)e-2ttTc .
Один из важнейших числовых параметров надежности - среднее время безотказной работы, который определяется как математическое ожидание случайной величины, т.е.
Tcp = M_T=jtq(t)dt,
о
где q(t) - плотность вероятности отказа. Преобразуем этот интеграл к следующему виду, решив его по частям:
Tcp = ]tq(t)dt = -tP(t)\ ₀~+J P(t)dt
0 0
или
Tcp = pP(t)dt = 111.
0
В общем случае интенсивность отказов 1_t зависит как от времени t, так и от параметров, характеризующих режим работы (U, I, W) и условия эксплуатации аппаратуры (Q, z, а, ...), т. е.
1 = j(t,U,I,Q,...,a).
Исходя из анализа физических и физико-химических процессов, являющихся причинами возникновения отказов, определим зависимость l_t, от режимов работы.
Число отказов при прерывистом режиме работы элементов зависит как от времени их действительной работы t_p, так и от числа циклов работы N, т. е.
m_x = j(tp,N).
Бесконечно малое приращение числа отказов определим как полный дифференциал:
dm, = jdt_p IdN.
x dt_p p dN N
Так как m_x = N₀ - N_x и, следовательно, dm_x = -dN_x, то после деления обеих частей на N_x имеем
N
Nx
¦p /V
J Idtp + J JdN
Обозначая
= 1t
dj J_
dtpN_x
и учитывая, что при t = Q N = 0 и N_x = N получим
tp N
J Idtp JdN
ln(N_x/No) = -
0 0
Освободившись от логарифмов, имеем

Марковские модели надежности

Марковская модель системы - модель, при которой последующее состояние системы зависит только от текущего состояния и не зависит от предыдущих состояний.
Технология автоматизированного общего логико-вероятностного метода (ОЛВМ) построения марковских моделей систем первоначально была разработана для расчета условных законов живучести систем к воздействию на их элементы различных последовательностей поражающих факторов. Был автоматизирован самый громоздкий и трудоемкий процесс построения, на основе схемы функциональной целостности (СФЦ) и самой цепи Маркова, т.е. графа переходов состояний системы и всех допустимых переходов. В ОЛВМ множество марковских состояний работоспособности системы определяется путем автоматического преобразования логической функции работоспособности системы (ФРС) в совершенную дизъюнктивную нормальную форму (СДНФ). Затем, на основе специальных правил поразрядного сравнения пар конъюнкций полученной СДНФ, автоматичес-
ки определяются допустимые логические функции переходов (ЛФП) между марковскими состояниями системы и рассчитываются их параметры. Например, правила поразрядного сравнения переменных X (у) ^ X (k) конъюнкций СДНФ логической ФРС для определения переменных X, i = 1,2,...,H, ЛПФ между состояниями Sj ^ S_k цепи Маркова для невосстанавливаемых систем следующие:
Если Xi (j) ^ Xi (k), то Jj,_k = Jj,_kXi - не поражение элемента x;
Если Xi (j) ^ Xi (k), то Jj,k = Jj,kXi - поражение элемента Xi;
Если Xi (j) ^ Xi (k), то Jj,k = Jj,k * 1 - элемент Xi уже поражен;
Если Xi (j) ^ Xi (k), то Jj,k = Jj,k * 0 - элемент Xi не восстанавливается.
Построенная по указанным правилам марковская цепь системы, СФЦ которой приведена на рис. 2.2, характеризуется 13-ю комбинаторными марковскими состояниями безопасности и 70-ю допустимыми переходами между этими состояниями. Правила и соответствующие машинные программы разработаны для нескольких видов поражающих воздействий систем с восстановлением элементов. Технология ОЛВМ построения цепей Маркова позволяет полностью автоматизировать процессы построения практически всех известных видов и классов дискретных и непрерывных марковских и полумарковских моделей систем большой размерности, состояния которых описываются конъюнкциями простых логических переменных. модель системы, которая состоит из пяти компонентов: конечного списка входных символов; списка выходных символов; множества внутренних состояний; функции перехода; функции выхода. <

/center>