Предисловие
Проблема надежности является очень важной для современных технических систем. Можно привести примеры многих систем, для которых решение проблемы надежности в самом прямом смысле означает, быть или не быть данной системе. К ним можно отнести и различные информационные системы, включающие в свой состав большое число компьютеров, имеющих сетевую структуру, территориально распределенные информационные системы, информационные системы измерения параметров различных объектов, системы мониторинга и т.п.
Информационные системы могут иметь простую и сложную структуру. Их усложнение идет сегодня в различных направлениях. С одной стороны, в состав систем входит все большее число комплектующих элементов. С другой стороны, усложняется их структура, определяющая соединение отдельных элементов и их взаимодействие в процессе функционирования и поддержания работоспособности. При этом усложнение систем является прямым следствием постоянно возрастающей ответственности выполняемых ими функций, сложности и многообразия этих функций.
При прочих равных условиях система, состоящая из большого числа комплектующих элементов и имеющая более сложную структуру и сложный алгоритм функционирования, является менее надежной по сравнению с более простой системой. Все это требует разработки специальных методов обеспечения надежности таких систем, включая разработку математических методов расчета надежности и экспериментальной оценки.
1. Основные понятия и определения
Прежде чем начать изложение теоретических основ надежности, введем основные термины и определения, принятые в современной инженерной практике.
Под надёжностью технической системы понимают свойство системы сохранять работоспособность в заданных условиях функционирования. Говоря о работоспособности, следует сразу же определить критерий отказа системы. Отказ – это событие, после возникновения которого система утрачивает способность выполнять заданное назначение. Эти два понятия в определенном смысле выражаются одно через другое: отказ – это потеря работоспособности. Однако для той или иной информационной системы конкретное определение отказа зависит от многих факторов: назначения системы, выполняемой задачи, требований к выполнению данной конкретной функции и др.
Надежность – это сложное свойство, включающее в свой состав несколько единичных свойств: безотказность, готовность, сохраняемость, ремонтопригодность, а также безопасность и живучесть.
Под безопасностью понимается способность системы функционировать, не переходя в опасное состояние. Для информационных систем это свойство не является существенным по сравнению, например, с системами атомной энергетики.
Под живучестью технической системы понимают ее способность противостоять внешним воздействиям как естественного характера не предусмотренных условиями нормальной эксплуатации, так и преднамеренным.
Отличительным признаком надежности как свойства технической системы является то, что она характеризуется вероятностными процессами, протекающими во времени.
При изучении теории надёжности широко используются такие понятия как система, объект, элемент. Элемент – это такой объект, отдельные части которого не представляют существенного интереса в пределах проводимого анализа. Под термином «система» будем понимать множество (совокупность) действующих объектов, взаимосвязанных между собой функционально и рассматриваемых как единое структурное целое. Понятия «элемент», «объект» и «система» достаточно относительны. Подразделение системы на элементы зависит от требуемой точности проводимого анализа, от уровня наших представлений о системе и т.п. Более того, объект, считавшийся системой в одном исследовании, может рассматриваться как элемент, если изучается система большего масштаба. Например, в информационной сетевой системе элементом может считаться компьютер, терминал, канал связи и др. В тоже время, рассматривая функционирование компьютера, можно выделить процессор, входные и выходные устройства, различные интерфейсы и т.д.
В теории надежности весьма важную роль играет деление элементов и систем на восстанавливаемые и невосстанавливаемые. Содержательный смысл этих понятий очевиден.
Информационные системы бывают простыми и сложными.
Простыми системами будем считать такие, в которых чётко определён признак отказа, т.е. можно указать элемент, отказ которого приводит к отказу системы.
Основные признаки классификации отказов изделий приведены в таблице 1.
Таблица 1
Признак классификации | Вид отказа |
Характер
изменений
параметра |
внезапный постепенный (параметрический) перемежающийся (сбои) |
Степень потери полезных свойств |
полный частичный |
Восстанавливаемость полезных свойств |
необратимый обратимый |
Связь с другими отказами |
независимый зависимый |
Наличие внешних признаков |
явный неявный |
Причина возникновения |
конструктивный технологический эксплуатационный |
Период появления |
период приработки при работе нормальная эксплуатация период старения при хранении при испытаниях |
Цена отказа |
простой техники (ущерб от ремонта) невыполнение задачи (ущерб от этого) моральный ущерб |
2. Основные показатели надёжности
Одной из основных характеристик надежности объекта является время безотказной работы или наработка до отказа. Обозначим эту случайную величину Т. Будем считать, что в момент времени t=0 объект начинает работу, а в момент t=T происходит отказ. Отказ – это случайное событие во времени. Закон распределения случайной величины T характеризуется интегральной функцией распределения = Вер (Tk < t), где Tk – случайный момент времени, когда произошёл отказ. Тогда, – вероятность отказа на интервале [0, t].
Функция Q(t) есть вероятность отказа до момента t. Плотность распределения вероятности отказа
(1)
Безотказная работа – противоположное событие по отношению к событию отказа, поэтому вероятность безотказной работы в течении времени t:
(2)
Если F (t) – дифференцируемая функция (на практике это почти всегда выполняется), то дифференциальная плотность отказа:
(3)
Tогда вероятность отказа и вероятность безотказной работы объекта в течение времени t определяется через плотность вероятности отказа:
, (4)
.
В расчетах чаще всего применяют такую характеристику надежности как интенсивность отказов l(t). Интенсивность отказов можно рассматривать как относительную скорость уменьшения значений функции надежности с увеличением интервала (0, t).
(5)
Решение уравнения (5) при начальном условии p(0)=1 дает для функции надежности
формулу
(6)
При l=const формула (6) существенно упрощается:
P(t)=exp(-lt). (7)
Интенсивность отказов– это есть условная плотность вероятности отказов в предположении, что до момента t элемент функционировал безотказно. Таким образом, случайная величина имеет три характеристики – p(t), , .
В качестве показателей надежности применяют также числовые характеристики случайной наработки до отказа. Их обычно легче определить по экспериментальным данным, чем зависимости p(t), l(t), f(t). Наиболее часто используют среднюю наработку до отказа (математическое ожидание наработки до отказа или первый начальный момент).
, (8)
где F(t) – функция распределения случайной величины T.
Интегрируя (8) по частям, получаем
(9)
Таким образом, средняя наработка до отказа численно равна площади под кривой p(t).
При l=const имеем
(10)
Второй центральный момент (среднее квадратичное отклонение)
(11)
Очень часто этих двух моментов бывает достаточно для полной характеристики функций распределения наработки до отказа. Например, в практически часто встречающихся случаях, когда (экспоненциальное распределение), p(t)=exp(-lt) и mt= – несёт исчерпывающую информацию о надежности системы.
Наиболее часто встречающиеся распределения и их основные показатели представлены в таблице 2.
Таблица 2
N п/п |
Тип
|
Функция
|
Плотность |
Интенсив- |
Параметры законов | |
мат. ожид. | дисперсия | |||||
1 | 2 | 3 | 4 | 5 | 6 | 7 |
1 |
Показательные |
|||||
2 |
Рэлея |
|||||
3 |
Равномерное |
|||||
4 |
Вейбулла |
при – распределение Вейбулла превращается в показательное.
при – распределение Рэлея
3. Методы повышения надежности
Эффективность информационной системы в значительной степени зависит от уровня ее надежности, в первую очередь от уровня ее безотказности. Опыт эксплуатации показывает, что уровень надежности систем не всегда отвечает современным требованиям, поэтому весьма актуальна проблема разработки методов, позволяющих обеспечить требуемые уровни характеристик надежности системы. Надежность системы можно повысить, используя различные методы. При этом каждый раз надо выбирать пригодный метод с учетом стоимости, весовых, габаритных и других характеристик системы.
Методы повышения надежности можно классифицировать по области их использования.
Методы |
Конструктивные | Производственные | Эксплуатационные | ||
- Создание надежных элементов; – Создание благоприятного режима работы; – Методы рационального проектирования систем; – Методы введения избыточности: Нагрузочная, Параметрическая, Функциональная, Резервирование структуры. – Методы, защищающие элементы от разрушающих факторов |
– Совершенствование технологии; – Автоматизация производства; – Тренировка элементов и модулей системы. |
– Методы предупреждения отказов, основанные на прогнозировании моментов их появления; – Методы предупреждения отказов, основанные на статистических данных о долговечности элементов; – Повышение квалификации обслуживающего персонала; – Научные методы эксплуатации. |
||
|
|
|||
|
4. Резервирование как способ повышения надежности
Повышение надежности системы путем резервирования является одним из эффективных способов повышения надежности, но всегда связано с увеличением ее габаритов, массы, стоимости.
Рассмотрим кратко классификацию методов резервирования (см. табл. 3)
Таблица 3
Признак резервирования | Метод резервирования |
По виду соединения основных и резервных элементов | Общее |
Раздельное | |
Смешанное | |
С изменяющейся структурой (динамическое) | |
По нагруженности резервных элементов до их включения | Нагруженное |
Недогруженное (облегченное) | |
Ненагруженное | |
С изменяющейся нагрузкой | |
По способу переключения основных и резервных элементов | С ручным переключением |
С полуавтоматическим переключением | |
С автоматическим переключением | |
По наличию восстановления элементов | Без восстановления |
С восстановлением | |
По используемым параметрам системы |
Информационное Структурное Функциональное Временное |
Рассмотрим методы резервирования по нагруженности резервных элементов.
По нагруженности резервных элементов резервирование подразделяется на следующие виды:
Нагруженное резервирование – когда резервный элемент находится в том же режиме, что и основной элемент.
Недогруженное резервирование – когда резервный элемент находится в менее нагруженном режиме, чем основной элемент.
Ненагруженное резервирование – когда резервный элемент не несет нагрузок (выключен).
Резервирование с изменяющейся нагрузкой – когда резервный элемент в выбранные моменты времени может находиться в одном из заданных состояний (нагруженном, облегченном, ненагруженном).
5. Нагруженное резервирование
Пусть система состоит из n основных элементов и m резервных элементов. Плотность вероятности безотказной работы f(t). Условия работы элементов не зависимы, а автомат контроля и коммутации элементов (АКК) – абсолютно надежный.
; (12)
Для решения задачи используем метод гипотез [1]. Предположим, что все элементы исправны. Так как работа элементов не зависима, вероятность этой гипотезы:
(13)
Пусть отказал один конкретный (s-й) элемент, тогда вероятность этой гипотезы:
(14)
Вероятность отказа любого одного из m + n элементов:
(15)
Пусть отказали любые два элемента (сначала s-й, потом k-й). Тогда вероятность этой гипотезы:
(16)
Далее аналогично
(17)
Все рассмотренные выше гипотезы благоприятствуют работоспособному состоянию системы. Поэтому вероятность безотказной работы системы равна сумме вероятностей этих гипотез.
или (18)
(19)
Так как все элементы равнонадежны, то
Если закон распределения экспоненциальный, т.е., то , . Тогда
(20)
При n=1
, где k=m+1/ (21)
Тогда , (22)
, (23)
при
Таким образом, у резервированной системы интенсивность отказа является функцией времени наработки, даже для экспоненциального закона распределения времени наработки для элементов.
При t=0,=0; при
6. Ненагруженное резервирование
Здесь те же условия, что и в п. 5, но время безотказной работы элементов распределено по экспоненциальному закону с параметром. Интенсивность отказов такой системы , так как резервированные элементы без отказов.
Необходимо найти плотность распределения суммы независимых случайных величин
(24)
Для этого воспользуемся характеристической функцией
, где (25)
Тогда
(26)
Плотность вероятности момента выхода из строя m + 1 элемента
(27)
Вероятность безотказной работы системы определится как
(28)
Если резервирования элементов нет, т.е. m =0, то
(29)
7. Недогруженное резервирование
Система состоит из n основных элементов с интенсивностью отказов λ = а и m резервных элементов с λ = b. Условия работы элементов независимы. Автомат контроля и коммутации – абсолютно надежен. Система будет исправна, если число k отказов элементов 0≤k(t)≤m. Тогда или , (30)
так как при k = m + 1 будет отказ, а группа 0≤k(t)≤m + 1 – полная группа событий
Если в момент t система находится в состоянии k, то интенсивность ее отказов
В момент времени t + Δ t система будет находиться в состоянии k c вероятностью
(31)
– вероятность того, что система не уйдет из состояния k.
Устремив получим общее выражение для дифференциального уравнения
(32)
При k=0 (33)
k=1 (34)
k=m+1 (35)
Начальные условия
(36)
т.е. в начальный момент времени все элементы исправны.
Уравнение (32) – уравнение А.Н. Колмогорова для однородного марковского процесса (λ = const).
Уравнению (32) можно сопоставить граф переходов из одного состояния системы в другое
На основании анализа уравнений А.Н. Колмогорова, Б.В. Васильева [1] было сформулировано мнемоническое правило составления таких уравнений по заданному графу. В левой части каждого уравнения стоит производная по времени от вероятности нахождения системы в k-м состоянии в момент времени t. Число членов в правой части равно алгебраической сумме произведений интенсивностей переходов на соответствующие вероятности пребывания системы в тех узлах графа, откуда совершается непосредственный переход системы в другие (соседние) узлы. Причем, слагаемым, которым соответствуют выходящие из k-го узла стрелки графа, приписывается – знак минус, а входящем – знак плюс. Как видим уравнение (32) составлено по этому правилу.
Применяя преобразование Лапласа:
(37)
систему дифференциальных уравнений сводим к алгебраической, решая которую получим
(38)
Зная изображение по Лапласу находим
(39)
Решая (39), получим
, (40)
где (41)
Окончательно
, (42)
где (43)
Например, m=1, a/b=1
B0(1)=1+n; B1(1)=n
(44)
(45)
(46)
Из анализа выражения (46) следует, что распределение времени безотказной работы резервированной системы отлично от экспоненциального распределения, даже, если все ее элементы имеют такое распределение.
8. Надежность резервированной системы с автоматом контроля и коммутации
Влияние надежности АКК на работоспособность системы. Требования к надежности автомата.
До сих пор предполагали, что АКК абсолютно надежный.
Сделаем следующие допущения:
1) Обнаружение и замена отказавших элементов в системе происходит мгновенно.
2) Интенсивность отказов обозначим как a и в
3) fa(t)=ne-nt
4) Условия работы элементов независимы.
5) Отказ АКК не приводит к отказу системы до следующего отказа элемента.
Очевидно, что АКК может отказать до того как будет использован весь резерв, т.е. он тоже определяет надежность системы.
Можно показать, что
(47)
(48)
Литература
1. Дружинин Г.В. Надежность автоматизированных производственных систем.
М. Энергоатомиздат, 1986.
2. Ушаков И.А. Вероятностные модели надежности информационно-вычислительных
систем. М. Радио и связь, 1991.
3. Рябинин И.А. Надежность и безопасность структурно-сложных систем. Санкт-Петербург, Политехника, 2001.
4. Афанасьев В.Г., Зеленцов В.А., Миронов А.И. Методы анализа надежности и критичности отказов сложных систем. Министерство обороны, 1992.
5. Райншке К., Ушаков И.А. Оценка надежности систем с использованием графов, М. Радио и связь, 1998.
6. Рябинин И.А., черкесов Г.Н. Логико-вероятностные методы исследования надежности структурно-сложных систем. М. Радио и связь, 1986.
7. Барлоу Р., Прошан А. Математическая теория надежности. Пер. с англ. Под ред Гнеденко Б.В., М. Сов. Радио, 1969.
8. Заде Л. Понятие лингвистической переменной и его применение к принятию приближенных решений. Пер. с англ. – М., Мир, 1976.
9. Кофман А. Введение в теорию нечетких множеств Пер. с франц. М. Радио и связь, 1982.