d9e5a92d

Экспертиза и прогнозирование отказов

2) сложность процедур диалога, возможность работы персонала без специальной подготовки;
3) реакция системы и ее частей на ошибки оператора, средства сервиса.
Проверка средств восстановления работоспособности АС после отказов ЭВМ должна включать:
1) проверку наличия в эксплуатационной документации рекомендаций по восстановлению работоспособности и полноту их описания;
2) практическую выполнимость рекомендованных процедур;
3) работоспособность средств автоматического восстановления функций (при их наличии).
Проверку комплектности и качества эксплуатационной документации следует проводить путем анализа документации на соответствие требованиям нормативно-технических документов ТЗ. Результаты испытаний объектов, предусмотренных программой, фиксируют в протоколах, содержащих следующие разделы:
1) назначение испытаний и номер раздела требований ТЗ на АС, по которому проводят испытание;
2) состав технических и программных средств, используемых при испытаниях;
3) указание методик, в соответствии с которыми проводились испытания, обработка и оценка результатов;
4) условия проведения испытаний и характеристики исходных данных;
5) средства хранения и условия доступа к конечной, тестирующей программе;
6) обобщенные результаты испытаний;
7) выводы о результатах испытаний и соответствии созданной системы или ее частей определенному разделу требований ТЗ на АС.
Протоколы испытаний объектов по всей программе обобщают в едином протоколе, на основании которого делают заключение о соответствии системы требованиям ТЗ на АС и возможности оформления акта приемки АС в постоянную эксплуатацию.
Работу завершают оформлением акта о приемке АС в постоянную эксплуатацию.

Экспертиза и прогнозирование отказов.

Эксплуатационный контроль надежности систем

Расширение функций контроля и управления в автоматизированных информационных системах способствует сбережению всех видов ресурсов и уменьшению расхода электроэнергии. Прогнозирование отказов АИС на ранних стадиях их возникновения обеспечивает долговечность, высокую степень надежности работы основного оборудования. За счет развития диспетчерской системы экспертизы аварий сокращается как число аварий, на устранение которых тратятся значительные денежные средства, так и время отключения электрооборудования.

АИС способствует повышению контроля за действием оператора и предотвращению несанкционированного вмешательства в работу оборудования. Немаловажное значение для повышения эффективности работы системы имеет также оперативное формирование и представление отчетной документации.
Повышение эффективности работы системы требует соблюдения ряда принципов при ее построении. Наиболее важными из них являются максимальное удовлетворение запросов заказчика и обеспечение централизованного контроля и управления в одной интегрированной иерархической системе.
Важным направлением развития систем компьютерной поддержки безопасности является построение компьютерных тренажерных комплексов для обучения операторов АИС действиям в предаварийных и аварийных ситуациях. Ключевой вопрос при разработке таких тренажерных систем состоит в обеспечении полноты описания возможных нештатных ситуаций с целью гарантировать готовность обученных на тренажере операторов к действиям в условиях реально возникающих разнообразных нарушений хода работы системы.

В такой постановке именно полнота учета возможных нарушений может рассматриваться в качестве критерия при определении детальности и требуемой точности моделирования на стадии проектирования тренажеров.
В проблематике исследования потенциальной опасности при работе АИС и надежности оператора существует целый ряд методов, позволяющих решить задачу обеспечения полноты возможных нарушений. В их числе, наряду с наиболее простыми способами определения множества потенциально опасных ситуаций на основе анализа регламентной документации по процессу или с привлечением прогнозирования по методике "Что произойдет, если?", необходимо указать методы анализа деревьев возможных событий, отказов или ошибок операторов с оцениванием вероятности их наступления, например THERP (Technique for Human Error Rate Prediction). На сегодня разработчикам доступно множество компьютерных продуктов,
реализующих указанные методики. Однако в рамках компьютерного тренинга наиболее подходящими представляются методы экспертизы опасностей, предусматривающие описание процесса с помощью специального языка в форме так называемых карт технологического процесса, систематическая проверка состояния каждой его части на предмет выявления возможности и характера отклонения от проектного режима работы и оценивания возможной опасности.


Следует отметить, что при любом способе построения формального множества нештатных ситуаций, оно подвергается затем экспертной оценке специалистов конкретного этапа работы, опытных операторов. Такая оценка позволяет отобрать действительно вероятные события и уточнить количественную меру их нежелательных последствий.
Очевидно при этом, что даже самые подробные и хорошо структурированные перечни нештатных ситуаций не исчерпывают проблему полноты тренинга, поскольку естественные изменения в самих АИС и средствах предаварийной защиты потребуют корректировки существующих тренировочных упражнений и составления новых. Важно в этой связи, чтобы тренажерные системы были снабжены эффективными инструментами расширения библиотеки возможных неисправностей и отказов, что формулируется в требовании пополняемости тренажеров новыми нештатными ситуациями.
Реализация описанного подхода в рамках объектно-ориентированного моделирования АИС сводится к следующему. В библиотеках потоков, аппаратов и математических объектов, обычно выделяемых в структуре классов при объектно-ориентированном моделировании, полученные на стадии предварительного анализа опасностей возможные нарушения в ходе работы учитываются в виде свойств элементов библиотек.

При этом указанные библиотеки, построенные с учетом возможного наследования свойств объектов, могут легко расширяться и модифицироваться при возникновении новых нештатных ситуаций или процедур их корректировки. Упомянутые элементы библиотек снабжаются также программными интерфейсами, позволяющими управлять свойствами объектов извне, что важно при имитации развития сложных нештатных ситуаций с помощью вмешательств инструктора обучения в форме однократных воздействий или развернутых во времени сценариев нарушений.
Объединение различных систем и подсистем в АИС, функционирующую как единое целое, а также стабилизация технологических и эксплуатационных характеристик производятся автоматизированной системой управления и контроля (АСУиК), предназначенной для:
- скрупулезного исполнения регламента работы;
- поддержания стабильных выходных параметров при нестабильных
входных параметрах и при нестабильных эксплуатационных условиях;
- выдачи в автоматическом режиме рекомендаций обслуживающему персоналу по оперативному управлению процессом выполнения задачи;
- автоматического предотвращения нештатных и выхода из аварийных ситуаций;
- контроля и регистрации параметров работы системы;
- визуализации для оператора текущего состояния выполнения задачи.
АСУиК осуществляет целенаправленные воздействия на физические и логические процессы, протекающие в составных частях автоматизированной информационной системы, а также реализует сбор, хранение и обработку информации, отражающей существо процессов управления. АСУиК играет основополагающую роль для достижения желательных показателей качества АИС.

Поэтому выбор структуры АСУиК во многом определяет эффективность АИС.
АСУиК, как правило, строится по блочно-иерархическому принципу. Каждый блок является самодостаточным по выполняемой функции и может находиться в одном из уровней иерархии по отношению к аппаратуре абонентов АИС и в одном из уровней иерархии по отношению к решаемой функциональной задаче.

Иерархия АСУиК повторяет иерархию физических, логических и эксплуатационных процессов комплекса (объект управления).
АСУиК может быть реализована в виде программируемой цифровой системы с тремя уровнями иерархии.
Первый уровень иерархии составляют приборы контроля и исполнения физических воздействий, замкнутые через контроллер (микропроцессор). Здесь реализуется функционирование АИС в автоматическом режиме по алгоритмам, определяемым технологическим регламентом и инструкцией по эксплуатации.
Второй уровень иерархии используется лишь для комплексов большой производительности и базируется на пульте управления и контроля, где производится автоматизированное управление при непосредственном контакте с оборудованием АИС (используется для ремонтных и пусконаладочных работ).
Третий уровень иерархии представляет собой автоматизированное рабочее место (АРМ) оператора, строится для комплексов большой производительности на базе персонального компьютера (в частных случаях может быть реализован на базе пульта управления с органами мнемоники и ручного управления) и снабжается по мере необходимости устройствами регистрации, отображения и документирования.
Такая структура АСУиК позволяет воспользоваться стандартными приборными и программными решениями, что удешевляет стоимость АСУиК и сокращает сроки проектирования. В то же время иерархичность АСУиК делает ее гибкой системой, позволяющей в процессе эксплуатации менять как ее структуру, так приборный и программный состав.
Работа диспетчера комплексов большой производительности максимально облегчена за счет применения программных средств анализа, использования графического представления текущих ситуаций, а также показа в удобном для диспетчера виде путей выхода из нештатных ситуаций. Система позволяет диспетчеру вмешиваться в ход автоматического выполнения регламента выполняемой задачи, создавать по командам диспетчера новые связи между отдельными аппаратными узлами, работать в ручном режиме.
Использование при построении комплексов средств автоматизации значительно упрощает процесс эксплуатации автоматизированных информационных систем, повышает их "живучесть" за счет автоматического предотвращения нештатных ситуаций, продлевает срок безремонтной работы оборудования вследствие скрупулезного исполнения технологического регламента. Все это ведет, в конечном счете, к существенному снижению эксплуатационных расходов.

Роль ЭВМ в обеспечении надежности систем

Современный рынок "персональных рабочих станций" не просто определить. По сути он представляет собой совокупность архитектурных платформ персональных компьютеров и рабочих станций, которые появились в настоящее время, поскольку поставщики компьютерного оборудования уделяют все большее внимание рынку продуктов для коммерции и бизнеса. Этот рынок традиционно считался вотчиной миникомпьютеров и мэйнфреймов, которые поддерживали работу настольных терминалов с ограниченным интеллектом. В прошлом персональные компьютеры не были достаточно мощными и не располагали достаточными функциональными возможностями, чтобы служить адекватной заменой подключенных к главной машине терминалов.

Хотя рабочие станции на платформе Unix были очень сильны в научном, техническом и инженерном секторах, но были почти также неудобны, как и ПК, для того чтобы выполнять серьезные офисные приложения. С тех пор ситуация изменилась коренным образом.

Персональные компьютеры в настоящее время имеют достаточную производительность, а рабочие станции на базе Unix имеют программное обеспечение, способное выполнять большинство функций, которые стали ассоциироваться с понятием "персональной рабочей станции". Вероятно оба этих
направления могут серьезно рассматриваться в качестве сетевого ресурса для систем масштаба предприятия. В результате этих изменений практически ушли со сцены старомодные миникомпьютеры с их патентованной архитектурой и использованием присоединяемых к главной машине терминалов.

По мере продолжения процесса разукрупнения (downsizing) и увеличения производительности платформы Intel наиболее мощные ПК (но все же чаще открытые системы на базе Unix) стали использоваться в качестве серверов, постепенно заменяя миникомпьютеры.
Среди других факторов, способствующих этому процессу, следует выделить:
- разнообразие в применении ПК. Помимо обычных для этого класса систем текстовых процессоров, даже средний пользователь ПК может теперь работать сразу с несколькими прикладными пакетами, включая электронные таблицы, базы данных и высококачественную графику;
- адаптацию графических пользовательских интерфейсов, которая существенно увеличила требования пользователей ПК к соотношению производительность/стоимость. И хотя оболочка MS Windows может работать на моделях ПК 386SX с 2 Мбайтами оперативной памяти, реальные пользователи хотели бы получить все преимущества подобных систем, включая возможность комбинирования и эффективного использования различных пакетов;
- широкое распространение систем мультимедиа, прямо зависящее от возможности использования высокопроизводительных ПК и рабочих станций с адекватными аудио- и графическими средствами и объемами оперативной и внешней памяти;
- слишком высокую стоимость мэйнфреймов и даже систем среднего класса, позволяющую сместить многие разработки в область распределенных систем и систем клиент-сервер, которые многим представляются вполне оправданной по экономическим соображениям альтернативой. Эти системы прямо базируются на высоконадежных и мощных рабочих станциях и серверах.
X-терминалы представляют собой комбинацию бездисковых рабочих станций и стандартных ASCII-терминалов. Бездисковые рабочие станции часто применялись в качестве дорогих дисплеев и в этом случае не полностью использовали локальную вычислительную мощь.

Одновременно многие пользователи ASCII-терминалов хотели улучшить их характеристики, чтобы получить возможность работы в многооконной системе, и графические возможности. Совсем недавно, как только стали доступными очень мощные графические рабочие станции, появилась тенденция применения "подчиненных" X-терминалов, которые используют рабочую станцию в ка-
честве локального сервера.
На компьютерном рынке X-терминалы занимают промежуточное положение между персональными компьютерами и рабочими станциями. Поставщики X-терминалов заявляют, что их изделия более эффективны в стоимостном выражении, чем рабочие станции высокого ценового класса, и предлагают повышенный уровень производительности по сравнению с персональными компьютерами.

Быстрое снижение цен, прогнозируемое иногда в секторе X-терминалов, в настоящее время идет очевидно благодаря обострившейся конкуренции в этом секторе рынка.
Прикладные многопользовательские коммерческие и бизнес-системы, включающие системы управления базами данных и обработки транзакций, крупные издательские системы, сетевые приложения и системы обслуживания коммуникаций, разработку программного обеспечения и обработку изображений, все более настойчиво требуют перехода к модели вычислений "клиент-сервер" и распределенной обработке. В распределенной модели "клиент-сервер" часть работы выполняет сервер, а часть пользовательский компьютер (в общем случае клиентская и пользовательская части могут работать и на одном компьютере). Существует несколько типов серверов, ориентированных на разные применения: файл-сервер, сервер базы данных, принт-сервер, вычислительный сервер, сервер приложений.

Таким образом, тип сервера определяется видом ресурса, которым он владеет (файловая система, база данных, принтеры, процессоры или прикладные пакеты программ).
Однако существует классификация серверов, определяющаяся масштабом сети, в которой они используются: сервер рабочей группы, сервер отдела или сервер масштаба предприятия (корпоративный сервер). Эта классификация весьма условна.

Например, размер группы может меняться в диапазоне от нескольких человек до нескольких сотен человек, а сервер отдела обслуживать от 20 до 150 пользователей. Очевидно, в зависимости от числа пользователей и характера решаемых ими задач требования к составу оборудования и программного обеспечения сервера, к его надежности и производительности сильно варьируются.
Файловые серверы небольших рабочих групп (не более 20-30 человек) проще всего реализуются на платформе персональных компьютеров и программном обеспечении Novell NetWare. Файл-сервер в данном случае выполняет роль центрального хранилища данных.

Серверы прикладных систем и высокопроизводительные машины для среды "клиент-сервер" значительно отличаются требованиями к аппаратным и программным средствам.
При наличии одного сегмента сети и 10-20 рабочих станций пиковая пропускная способность сервера ограничивается максимальной пропускной способностью сети. В этом случае замена процессоров или дисковых
подсистем более мощными не увеличивает производительность, так как узким местом является сама сеть. Поэтому важно использовать хорошую плату сетевого интерфейса.
Для файл-серверов общего доступа, с которыми одновременно могут работать несколько десятков, а то и сотен человек, простой однопроцессорной платформы и программного обеспечения Novell может оказаться недостаточно. В этом случае используются мощные многопроцессорные серверы с возможностями наращивания оперативной памяти до нескольких гигабайт, дискового пространства до сотен гигабайт, оснащенные быстрыми интерфейсами дискового обмена (типа Fast SCSI-2, FastWide SCSI-2 и Fiber Channel) и несколькими сетевыми интерфейсами. Эти серверы используют операционную систему Unix, сетевой протокол TCP/IP.

На базе многопроцессорных Unix-серверов обычно строятся также серверы баз данных крупных информационных систем, так как на них ложится основная нагрузка по обработке информационных запросов. Подобного рода серверы получили название суперсерверов.
Как правило, суперсерверы работают под управлением операционных систем Unix, а также и Windows NT, которые обеспечивают многопотоковую многопроцессорную и многозадачную обработку. Суперсерверы должны иметь достаточные возможности наращивания дискового пространства и вычислительной мощности, средства обеспечения надежности хранения данных и защиты от несанкционированного доступа.

Кроме того, в условиях быстро растущей организации важной является возможность наращивания и расширения уже существующей системы.
Мэйнфрейм - это синоним понятия "большая универсальная ЭВМ". Мэйнфреймы и до сегодняшнего дня остаются наиболее мощными (не считая суперкомпьютеров) вычислительными системами общего назначения, обеспечивающими непрерывный круглосуточный режим эксплуатации. Они могут включать один или несколько процессоров, каждый из которых, в свою очередь, может оснащаться векторными сопроцессорами (ускорителями операций с суперкомпьютерной производительностью). В нашем сознании мэйнфреймы все еще ассоциируются с большими по габаритам машинами, требующими специально оборудованных помещений с системами водяного охлаждения и кондиционирования.

Однако это не совсем так. Прогресс в области элементно-конструкторской базы позволил существенно сократить габариты основных устройств.

Наряду со сверхмощными мэйнфреймами, требующими организации двухконтурной водяной системы охлаждения, имеются менее мощные модели, для охлаждения которых достаточно принудительной воздушной вентиляции, и модели, построенные по блочно-модульному принципу и не требующие специальных помещений и кондиционеров.
Основными поставщиками мэйнфреймов являются известные компьютерные компании IBM, Amdahl, ICL, Siemens Nixdorf и некоторые другие, но ведущая роль принадлежит, безусловно, компании IBM. Именно архитектура системы IBM/360, выпущенной в 1964 г., и ее последующие поколения стали образцом для подражания.

В нашей стране в течение многих лет выпускались машины ряда ЕС ЭВМ, являвшиеся отечественным аналогом этой системы.
В архитектурном плане мэйнфреймы представляют собой многопроцессорные системы, содержащие один или несколько центральных и периферийных процессоров с общей памятью, связанных между собой высокоскоростными магистралями передачи данных. При этом основная вычислительная нагрузка ложится на центральные процессоры, а периферийные процессоры (в терминологии IBM - селекторные, блок-мультиплексные, мультиплексные каналы и процессоры телеобработки) обеспечивают работу с широкой номенклатурой периферийных устройств.
Первоначально мэйнфреймы ориентировались на централизованную модель вычислений, работали под управлением патентованных операционных систем и имели ограниченные возможности для объединения в единую систему оборудования различных фирм-поставщиков. Однако повышенный интерес потребителей к открытым системам, построенным на базе международных стандартов и позволяющим достаточно эффективно использовать все преимущества такого подхода, заставил поставщиков мэйнфреймов существенно расширить возможности своих операционных систем в направлении совместимости.

В настоящее время они демонстрируют свою "открытость", обеспечивая соответствие со спецификациями POSIX 1003.3, возможность использования протоколов межсоединений OSI и TCP/IP или предоставляя возможность работы на своих компьютерах под управлением операционной системы Unix собственной разработки.
Стремительный рост производительности персональных компьютеров, рабочих станций и серверов создал тенденцию перехода с мэйнфреймов на компьютеры менее дорогих классов: миникомпьютеры и многопроцессорные серверы. Эта тенденция получила название "разукрупнение". Однако этот процесс в самое последнее время несколько замедлился.

Основной причиной возрождения интереса к мэйнфреймам эксперты считают сложность перехода к распределенной архитектуре клиент-сервер, которая оказалась выше, чем предполагалось. Кроме того, многие пользователи считают, что распределенная среда не обладает достаточной надежностью для наиболее ответственных приложений, которой обладают мэйнфреймы.
Очевидно, выбор центральной машины (сервера) для построения информационной системы предприятия возможен только после глубокого ана-
лиза проблем, условий и требований конкретного заказчика и долгосрочного прогнозирования развития этой системы.
Главным недостатком мэйнфреймов в настоящее время остается относительно низкое соотношение производительность/стоимость. Однако фирмами-поставщиками мэйнфреймов предпринимаются значительные усилия по улучшению этого показателя.
Следует также помнить, что в мире существует огромная инсталлированная база мэйнфреймов, на которой работают десятки тысяч прикладных программных систем. Отказаться от годами наработанного программного обеспечения просто не разумно. Поэтому ожидаемая продажа мэйнфреймов будет увеличиваться по крайней мере еще очень долго.

Эти системы, с одной стороны, позволят модернизировать существующие, обеспечив сокращение эксплуатационных расходов, с другой стороны, создадут новую базу для наиболее ответственных приложений.

МАТЕМАТИЧЕСКИЕ МЕТОДЫ ТЕОРИИ НАДЕЖНОСТИ

Основы математической статистики

Математическая статистика - наука об обработке результатов измерений случайных величин. Иногда математическую статистику рассматривают как науку о статистических решениях, дающую рекомендации выбора оптимальных способов управления в случайных ситуациях.
Предметом математической статистики является изучение случайных величин по результатам наблюдений. Для получения опытных данных необходимо провести обследование соответствующих объектов.

Так как число объектов может быть очень велико, то приходится из всей совокупности объектов для обследования отбирать только часть, т.е. проводить выборочное обследование. В некоторых случаях обследование объектов всей совокупности практически не имеет смысла, поскольку они разрушаются в результате обследования.
Совокупность всех мыслимых результатов наблюдений за АИС, проводимых в неизменных условиях, называется генеральной совокупностью. Часть отобранных результатов наблюдений из генеральной совокупности называется выборочной совокупностью, или выборкой. Как уже говорилось, о свойствах генеральной совокупности можно судить по данным наблюдений над отобранными объектами, т.е. по выборке.

Однако не всякая выборка может быть действительным представлением о генеральной совокупности.



Содержание раздела