Проблемы надежности сетей
АрхивВведение
В начале 60-х годов академик А. А. Харкевич высказал гипотезу о том, что количество информации, которую надо собирать, обрабатывать и доставлять в нужное место, "растет по меньшей мере пропорционально квадрату промышленного потенциала". Анализ подтверждает, что в передовых в техническом отношении странах такой рост действительно имеет место примерно со степенью 1,7-2,0. Это приводит к существенному росту значимости деятельности, связанной с производством, передачей и переработкой информации.
По данным ЮНЕСКО, в настоящее время более половины трудоспособного населения развитых стран прямо или косвенно принимает участие в процессе производства и распределения информации. Три ведущие отрасли информационного сектора общественного производства (вычислительная техника, промышленная электроника и связь) играют сейчас для этих стран ту же роль, которую на этапе их индустриализации играла тяжелая промышленность.
Появление глобальной "сети сетей" Internet и растущее громадными темпами количество ее пользователей (15% ежемесячно; в 1998 году ожидается 100 миллионов; с августа 1997 года по январь 1998-го, по данным компании Relevant Knowledge, число только американских пользователей WWW увеличилось на 10 миллионов) становится планетарным явлением, которое может привести даже к социальным изменениям.
Другими словами, мировое сообщество приближается к такой степени зависимости своего существования от функционирования информационных сетей, которая сравнима с зависимостью от систем обеспечения электроэнергией. Это кроме очевидных достоинств имеет и обратную сторону. Отказ сети связи может иметь последствия, превосходящие последствия аварий энергосистемы. В связи с этим проблема оценки и обеспечения надежности сетей является актуальной.
Надежность - это свойство объекта (системы), заключающееся в его способности выполнять заданные функции при определенных условиях эксплуатации. Количественно надежность характеризуется рядом показателей, состав и способ определения которых зависят от типа анализируемой системы.
Основными для теории надежности являются проблемы надежностного анализа и синтеза. Первая состоит в вычислении количественных показателей надежности существующей или проектируемой системы с целью определения соответствия ее предъявляемым требованиям. Целью надежностного синтеза является обеспечение требуемого уровня надежности системы.
Настоящая статья имеет целью ознакомление читателя с методами надежностного анализа и синтеза сетей связи (СС), основы всех корпоративных сетей (КС). Жертвуя математической строгостью изложения, главное внимание уделено содержательному аспекту.
1. Структура сетей связи и особенности их функционирования
Определим основные используемые понятия.
Под сетью связи понимается техническая система, которая предназначена для обеспечения обмена информацией ее пользователей. Часто вместо СС употребляют термин "информационная сеть предприятия". Еще в 60-70-х годах СС были представлены в основном телефонными и телеграфными сетями, обеспечивающими пользователям возможность обмениваться разговорами и письменными сообщениями. Разработка систем факсимильной и видеосвязи добавляет к этим возможностям передачу документов и видеоизображений. Развитие вычислительной техники вызвало к жизни появление сетей передачи данных, обеспечивающих обмен информацией между человеком и ЭВМ, а также между ЭВМ.
В настоящее время интенсивно развиваются цифровые сети интегрального обслуживания (ЦСИО) (ISDN - Integrated Services Digital Network). Под ЦСИО понимается СС, в которой одни и те же устройства цифровой коммутации и цифровые тракты передачи используются для осуществления более чем одного вида связи, например, телефонии, передачи данных и др.
ЦСИО содержит следующие элементы:
- Пользователи (абоненты) - источники и потребители информации, создающие и принимающие потоки сообщений.
- Пункты связи (станции), которые подразделяются на оконечные пункты (в том числе и абонентские), содержащие аппаратуру ввода и вывода информации, и коммутационные узлы, осуществляющие распределение сообщений.
- Каналы связи, через которые производится передача информации в пространстве между пунктами.
- Система управления, содержащая средства управления и технического обслуживания, реализующие алгоритмы управления на различных уровнях.
Тяготеющей парой (ТП) называется пара "передающая станция-приемная станция", связанная некоторой подсетью связи.
Последовательность "станция-канал-станция", начинающаяся передающей станцией ТП и заканчивающаяся приемной станцией ТП, называется маршрутом. Маршрут идентичен пути в графе, задающем подсеть, которая связывает ТП. Часто для каждой ТП задают подмножество разрешенных маршрутов, то есть маршрутов, принятых для использования в режиме нормальной эксплуатации. Так, разрешенными маршрутами в СС, показанной на рис.1, могут быть: для тяготеющей пары (1,4) - (1a2d4); (1a2c3e4); (1b3e4); ТП (2,3) - (2с3); (2a1b3); (2d4e3); ТП (2,4) - (2d4); (2c3e4).
В зависимости от способа передачи сообщений СС подразделяются на сети с коммутацией каналов (ССКК), сети с коммутацией сообщений (ССКС) и сети с коммутацией пакетов (ССКП).
В сети с коммутацией каналов абонентам, входящим в ТП, на время сеанса в полное распоряжение предоставляется маршрут из множества разрешенных. Это приводит к невозможности использования в это же время маршрутов, имеющих элементы, общие с занятым. Например, если для ТП (2,3) выбран маршрут (2d4e3) (рис.1), то нельзя связать абонентов ТП (1,4) и (2,4) ни по одному маршруту.
Классическая коммутация каналов предусматривает установление гальванической связи между входящими и исходящими каналами на все время соединения. Это является причиной такого недостатка, как потери времени на установление соединения. Недостатком также является то, что при обмене короткими сообщениями полезное время передачи информации по каналу связи оказывается существенно меньше затрат времени на установление соединения. Для многих сеансов передачи данных доля полезного времени не превышает 1%.
Коммутация каналов применяется в сетях, где требуется передача информации в реальном масштабе времени (при телефонных и телеграфных диалогах, в некоторых сетях передачи данных).
Обычно скорость поступления сообщений находится в пределах от 102 сообщений в секунду до одного сообщения в течение нескольких минут. Промежутки между поступлениями сообщений есть случайные величины, распределенные по пуассоновскому или равномерному законам, или представляют собой детерминированный поток. Средняя длина сообщений находится в пределах от нескольких бит до 108 бит. В общем случае длина сообщения является случайной величиной, распределенной по равномерному или экспоненциальному закону. Допустимая средняя задержка лежит в диапазоне от 10 мс при использовании передаваемой информации для управления в реальном масштабе времени до 1 с в режимах, требующих взаимодействия с терминалом ЭВМ, или до нескольких минут и более при передаче файлов.
Передача речи налагает особые требования. Здесь определяющим является не средняя, а максимально допустимая задержка, обычно не превышающая 250 мс. Требования к верности передачи существенно зависят от типа передаваемой информации и способности получателя исправлять ошибки. Наиболее высокие требования предъявляются к верности передачи файлов, содержащих важную информацию (например, банковские документы), или исполняемые файлы. Требования к верности передачи электронной почты могут быть ниже, так как ошибки в принятых сообщениях могут быть легко обнаружены пользователем визуально и исправлены, основываясь на знании языка. При передаче речи искажения приводят к увеличению зашумленности речи. Однако требования к верности резко возрастают, если при передаче речи используются методы сжатия информации.
В результате развития классического метода коммутации каналов был разработан метод быстрой коммутации каналов. Сущность его заключается в том, что для пользователей, работающих в интерактивном режиме, на каждое сообщение, готовое для передачи, организуется маршрут, который разъединяется после окончания передачи сообщения. Пользователю, занятому "обдумыванием", маршрут не выделяется.
Низкий коэффициент использования сети при передаче по ней данных, поступающих в случайные моменты времени, привел к необходимости разработки других методов передачи информации, в частности, передачи с промежуточным накоплением, реализуемой в виде коммутации сообщений и коммутации пакетов.
Характерной особенностью передачи с коммутацией пакетов является то, что передаваемая информация перед поступлением ее в сеть разбивается на пакеты. Пакет информации представляет собой конечную последовательность бит, состоящую из управляющего заголовка и данных. При использовании коммутации пакетов пакетирование осуществляется сетью.
При использовании коммутации сообщений сообщение передается как единое целое. При этом необходимо установить максимальную длину сообщения, и в случае, когда действительная длина сообщения превышает эту величину, пользователь должен сам пакетировать сообщение, причем длина каждого пакета не должна превышать максимально допустимую.
При использовании передачи с промежуточным накоплением каждый сеанс инициируется без предварительного отведения для него части пропускной способности линии и установления физического соединения между передатчиком и приемником. Элементы маршрута используются совместно в нескольких сеансах, но не на основе фиксированного выделения, а на основе запросов на использование. Это позволяет концентрировать трафик в высокоскоростных каналах, вследствие чего уменьшается стоимость и задержка передачи в сети.
На рис. 2 приведены упрощенные временные диаграммы, поясняющие суть КК (диаг. 1-8) и КП (диаг. 9-14). Пусть необходимо передать со станции С1 на станцию С4 сообщение А, начиная с момента 0, а со станции С2 на станцию С3 - сообщение В, начиная с момента 2. Допустим, что сообщение А передается по маршруту (1a2c3e4) (диаг. 1-7). Тогда из-за занятости в момент 2 каналов a, c, e от станции С2 к станции С3 нет ни одного свободного маршрута, что принуждает отложить передачу сообщения В по крайней мере до момента 4, после чего это сообщение может быть передано по маршруту 2с3 (диаг. 2, 3, 6). При этом канал d не используется, а общее время передачи сообщений А и В равно 8.
Диаграммы 9-14 иллюстрируют процессы передачи с использованием КП. Разделим оба сообщения на пакеты длительностью в один интервал каждый. Начиная с момента 2 генерации сообщения В, пакеты В1 и В2 могут быть переданы по каналу d на станцию С4 , лежащую на одном из маршрутов из С? в С3, и поставлены в очередь на доступ к каналу e (диаг. 14). Оставшиеся пакеты В3 и В4 могут быть переданы таким же образом. Однако в момент 4 освобождается канал с, который образует кратчайший маршрут из С2 в С3. Поэтому маршрутизатор направит пакеты по каналу с (диаг. 14). В этот же момент освобождается и канал е (диаг. 13), что позволяет передать по нему пакеты В1, В2 из С4 в С3 . При этом С3 примет все пакеты сообщения В уже к окончанию интервала 6 (диаг. 9), то есть общее время передачи обоих сообщений сократилось на 2 интервала. Кроме того, канал d не простаивал. Однако плата за это - нарушение порядка следования пакетов, принятых С3.
Пакет или сообщение, которое поступает на узел коммутации, входящий в маршрут к пункту назначения, ожидает в очереди, чтобы быть переданным по следующему каналу маршрута, ведущего в пункт приема. При этом каждый канал связи используется полностью всегда, когда имеется информация, которую необходимо передать. Однако этот способ передачи обладает и недостатком, заключающимся в том, что задержками, обусловленными очередями в узлах, трудно управлять. Такие очереди отсутствуют при использовании коммутации каналов.
Из изложенного принципа функционирования ССКП следует, что для осуществления передачи с промежуточным накоплением при условии неполной связности ССКП необходимо решать задачу маршрутизации. Сущность ее заключается в определении наилучшей в отношении некоторого критерия последовательности узлов коммутации (маршрут), через которые должен передаваться пакет, чтобы достигнуть адресата. Методы маршрутизации можно разделить на два больших класса: маршрутизация с виртуальными каналами и дейтаграммная (динамическая) маршрутизация.
При использовании маршрутизации первого типа во время инициализации сеанса выбирается некоторый конкретный маршрут между абонентами, который поддерживается в течение всего сеанса. Это аналогично коммутации каналов в том отношении, что используется фиксированный маршрут, но он является виртуальным в том смысле, что каналы, входящие в некоторый маршрут, могут использоваться и в других маршрутах. Важным достоинством такого метода маршрутизации является сохранение порядка следования пакетов при передаче по сети, что особенно важно при передаче пакетированной речи.
Загрузка сети является важнейшим параметром, определяющим эффективность функционирования сети, а также возможность передачи по ней речи. Управление загрузкой обеспечивает, в частности, протокол Frame Relay, разработанный на основе спецификаций для сетей ISDN и предназначенный для высокоскоростной передачи кадров или пакетов с минимальными задержками и для эффективного использования пропускной способности сети. Он применяется в сетях с коммутацией каналов и пакетов и обеспечивает доведение кадров через сеть за определенное время, что позволяет передавать по ней оцифрованную речь с требуемым качеством и при этом адаптироваться к неравномерному во времени трафику, порождаемому, например, передачей данных от ЛВС.
Повышение надежности элементов СС приводит к упрощению алгоритмов управления СС. Например, применение в сетях Frame Relay высоконадежных каналов привело к отказу от повторной передачи искаженных пакетов, как это реализуется в СС с протоколом X.25.
Таким образом, при решении задач надежностного анализа и синтеза сеть связи должна быть отнесена к категории многофункциональных систем со структурной и временной избыточностью, функционирование которых существенно зависит от реализованного вида коммутации.
Большинство современных СС строится в соответствии с многоуровневой архитектурой, определенной моделью OSI (Open System Interconnection) взаимодействия открытых систем. Эта модель в соответствии с рекомендациями МККТТ представляет СС как семиуровневую иерархию взаимодействующих модулей:
- Физического интерфейса.
- Управления линией передачи данных (канального).
- Сетевого.
- Транспортного.
- Сеансового.
- Представления.
- Приложений.
При этом алгоритм взаимодействия на i-ом уровне определяется соответствующим протоколом этого уровня и обеспечивается средствами (i-1)-го уровня.
Назначение физического уровня заключается в обеспечении виртуальной линии для передачи битовой последовательности между любой парой узлов, соединенных физическим каналом. Примерами протоколов этого уровня являются RS232C и X.21, который является протоколом физического уровня протокола X.25.
Уровень управления линией передачи данных (УЛПД) (канальный) превращает ненадежный битовый тракт первого уровня в виртуальную линию связи более высокого уровня, способную безошибочно передавать пакеты в обоих направлениях. Передающий модуль УЛПД осуществляет помехоустойчивое кодирование пакета бит, поступающего на первый уровень, а также вводит в пакет управляющие биты, превращающие пакет в кадр. Приемный модуль УЛПД осуществляет обратное преобразование.
Существующие протоколы управления СС различаются возможностями канального уровня исправлять ошибки передачи информации. Так, канальный уровень протокола X.25 обеспечивает безошибочность передачи информации за счет повторной передачи искаженных кадров (пакета). Реализация этой функции приводит к увеличению относительной доли передаваемой служебной информации и вызванному этим снижению пропускной способности сети. Очевидно, ее реализация оправданна в случае использования каналов с большой вероятностью искажений. Появление высоконадежных каналов, имеющих вероятность ошибки порядка 10-7, позволяет отказаться от повторной передачи ошибочных кадров (пакетов) и возложить функции их восстановления на более высокие уровни. Это приводит к сокращению относительной доли служебной информации и повышению пропускной способности СС.
На сетевом уровне решается задача: когда и куда отправлять пакеты? На вопрос, куда отправлять эти пакеты, ответ дает решение задачи маршрутизации. Пакеты, предназначенные для некоторого другого узла, посылаются по каналу, принадлежащему выбранному маршруту, через уровень УЛПД этого канала, а служебные пакеты, передаваемые с целью зондирования сети для сбора информации о состоянии сети, используемой для решения задачи маршрутизации, обрабатываются непосредственно на сетевом уровне.
Ответ на вопрос, когда отправлять информацию, дает решение задачи управления потоком. Одной из главных целей управления потоком является предотвращение перегрузок ССКП, что достигается, в частности, уменьшением интенсивности потока пакетов в некоторых направлениях за счет задержки их передачи. В связи с этим на сеансовом уровне осуществляется также буферизация пакетов.
Широкое распространение в СС общего пользования получил протокол X.25. Он имеет три нижних уровня: физический, обеспечивающий электрическое сопряжение аппаратных средств X.21 (цифровой эквивалент обычного интерфейса V.24 и модемного интерфейса EIA-RS232C), канальный и сетевой.
Протокол Frame Relay, будучи, вообще говоря, протоколом второго уровня, вместе с тем выполняет некоторые функции протокола третьего уровня. Выполнение этих функций аналогично установлению соединения по протоколу Х.25 в том случае, когда используются постоянные виртуальные каналы.
На четвертом, транспортном, уровне решаются задачи разбиения передаваемого сообщения на пакеты и объединения принятой последовательности пакетов в сообщение. При необходимости здесь же решается задача восстановления нарушенного при передаче порядка следования пакетов; мультиплексирования нескольких низкоскоростных сеансов, имеющих один и тот же источник и одинаковые адреса потребителей, в один высокоскоростной сеанс при передаче и обратное преобразование при приеме; обеспечения межсетевых соединений при передаче сообщений через несколько объединенных шлюзами подсетей (в том числе и объединяемых в глобальную сеть ряда локальных сетей); обеспечения надежной сквозной связи при выходе из строя узлов или линий связи.
Функционирование сети на этом уровне определяется протоколами X.28 и X.29 более высокого, чем X.25, уровня.
На следующем, сеансовом, уровне осуществляется управление взаимодействием между отправителем и получателем. Кроме того, на этом уровне проверяются права пользователя на установление сеанса и реализуются функции предотвращения несанкционированного доступа к сети. Во многих сетях функции сетевого, транспортного и сеансового уровней не разделяются.
На уровне приложений решаются задачи, специфические для данного приложения, то есть способа использования сети, целей ее применения и функций, которые при этом реализуются.
Оценка влияния факторов, определяющих процесс передачи и распределения информации, на надежность функционирования сетей связи
Для понимания методов надежностного анализа и синтеза необходимо определить факторы, влияющие на надежность СС.
Анализ процессов функционирования сетей связи позволяет отнести к числу таких факторов следующие потоки:
- отказов и восстановлений технических средств;
- заявок на использование СС;
- естественных помех;
- искусственных помех;
- разрушающих искусственных воздействий;
- ошибок программного обеспечения СС;
- отказов, вызванных деятельностью человека;
- отказов, вызванных природными явлениями.
Для оценки значимости той или иной группы факторов будем использовать результаты статистического анализа интенсивности и последствий отказов, вызванных этими факторами (см. табл. 1), на примере высокоавтоматизированной широкомасштабной распределенной СС США PSTN (Public Switched Telephone Network).
Группа факторов | Доля от общего количества отказов, % | Потери пользователь-ского времени, % |
Отказы технических средств | 19 | 7 |
Перегрузки сети | 6 | 44 |
Ошибки ПО | 14 | 2 |
Ошибки персонала | 25 | 14 |
Вандализм | 1 | 1 |
Непреднамеренная разрушительная деятельность людей | 24 | 14 |
Природные явления | 11 | 18 |
Таблица 1. Распределение отказов в сети PSTN.
Характер отказов технических средств СС и обычных радиоэлектронных систем идентичен. Влияние постепенных отказов, вызванных воздействием таких факторов, как нестабильность питания, тепловые воздействия, влажность, перепады давления, запыленность и агрессивность среды, компенсируется конструктивными методами при создании устройств и использованием специальных защитных устройств (стабилизаторы, термостаты, экраны). Таким образом, при оценке показателей надежности СС следует учитывать только потоки внезапных отказов. Среди внезапных отказов выделяют устойчивые отказы и сбои, то есть кратковременные самоустраняющиеся отказы.
Для учета характеристик потока сбоев элемента СС достаточно использовать интенсивность этого потока, а для учета потока устойчивых отказов и потока восстановлений следует использовать коэффициент готовности и интенсивность отказов либо среднее время наработки на отказ и среднее время восстановления технических средств СС.
Отметим, что пользователю СС безразлично, чем вызван отказ в обслуживании его требования на установление связи - отказом элементов СС или их занятостью обслуживанием других заявок. Современные методы надежностного анализа СС позволяют учитывать занятость элементов СС при оценке показателей ее надежности.
Чаще всего нейтрализация влияния потока естественных помех достигается путем введения временной или информационной избыточности, либо применением помехоустойчивого кодирования, либо многократной передачей сообщения (что можно рассматривать так же, как применение своеобразных помехоустойчивых кодов). Влияние этого фактора учитывается путем соответствующего увеличения длительности сеанса связи с последующим использованием этого значения при расчете вероятности поддержания связи.
Характерные особенности воздействия потока искусственных помех позволяют рассматривать искусственную помеху, как сбой элемента, и учитывать влияние этого фактора на надежностные характеристики СС аналогично способу учета сбоев технических средств.
Характерными для воздействия потоков искусственных разрушающих воздействий являются: полная потеря работоспособности элемента СС, подверженного этому воздействию; возможность одновременного повреждения нескольких элементов; устойчивый характер повреждения, то есть отсутствие самовосстановления элемента после окончания воздействия; восстановление элемента после такого воздействия возможно только путем его ремонта или замены. Эти особенности аналогичны условиям возникновения и устранения устойчивых отказов за исключением высокой кратности нарушений работоспособности элементов, большего времени восстановления и зависимости отказов элементов друг от друга.
Природа ошибок программного обеспечения СС существенно отличается от природы отказов технических средств СС. На количество и качество ошибок программы в основном влияют субъективные факторы. Поэтому отказ ПО - это событие, заключающееся в проявлении, при определенных последовательностях входных данных, тех ошибок, которые были допущены при разработке ПО и не выявлены при его тестировании. В то же время отказ технических средств - это событие, заключающееся в изменении его параметров и приводящее к потере работоспособности. Второе существенное отличие состоит в том, что программа не стареет, то есть с течением времени количество ошибок в программе не увеличивается, а может только уменьшаться в результате их обнаружения и устранения. Другие отличия: если ошибка программы исключена, то она больше в ней не появится; предварительный анализ влияния ошибки практически невозможен из-за большого числа способов влияния ошибки на поведение программы. Количественным показателем корректности программы является число ошибок, оставшихся в программе после завершения отладки и тестирования. По аналогии с количественными показателями безотказности технических устройств используют также вероятность безотказной работы программы на интервале времени и интенсивность потока ошибок.
Отказы, вызванные деятельностью человека, можно разделить на отказы, вызванные деятельностью обслуживающего персонала, и отказы, вызванные деятельностью других людей.
Первая группа отказов обусловлена ошибками персонала при эксплуатации СС. Их характер и интенсивность существенно зависят от уровня автоматизации процессов управления СС. Применительно к СС PSTN отказы этой группы вызываются следующими ошибками: эксплуатации и ремонта кабелей, систем питания, технических устройств, контроля питания, использования не тех версий программного обеспечения; некорректной инсталляции и определения конфигурации программного обеспечения (исключая ошибки, вносимые в тексты программ); неверного ввода даты. Вторая группа отказов обусловлена преднамеренной (вандализм) и непреднамеренной разрушительной по отношению к СС деятельностью людей, не являющихся персоналом СС, которая проявляется в нарушении целостности кабелей и другого оборудования вследствие катастрофических событий (в основном автомобильных аварий).
К отказам, вызванным природными явлениями, относятся повреждения кабелей, систем питания и других устройств животными, а также молнией, ураганами, землетрясениями и наводнениями.
2. Методы надежностного анализа сетей
Сети связи с коммутацией каналов
Содержательно эта задача заключается в определении количественных показателей надежности СС по известной структуре сети и надежностным характеристикам элементов сети (каналов и станций). Решение этой задачи позволяет определить соответствие имеющейся СС предъявленным требованиям. Предложенный в последнее время способ преобразования ССКК с ненадежными каналами и станциями в эквивалентную сеть с абсолютно надежными станциями и дополнительными ненадежными каналами позволяет при надежностном анализе ССКК учитывать только надежность каналов эквивалентных СС, что значительно упрощает анализ.
Сеть связи представляет собой многофункциональную систему, элементарными функциями которой является установление связей между тяготеющими парами абонентов и поддержание этих связей в течение заданного промежутка времени. Выполнение каждой их этих функций является случайным событием. Поэтому отказ СС есть сложное случайное событие, представляющее собой некоторую композицию названных случайных событий. Естественной является следующая формулировка отказа СС: невозможность установления связи хотя бы для одной ТП из заданного множества. В этом случае в качестве показателя надежности СС можно использовать вероятность наступления сложного события, заключающегося в установлении связей между всеми ТП из заданного множества. Однако в корпоративных сетях значимость ТП может существенно различаться. Поэтому в качестве показателя надежности СС используют сумму взвешенных показателями важности ТП показателей надежности подсетей, связывающих тяготеющие пары.
Показателем надежности подсети ССКК, связывающей тяготеющую пару, является вероятность успешной реализации сеанса связи между станциями этой тяготеющей пары. Успешная реализация сеанса связи между абонентами, образующими тяготеющую пару ССКК, является сложным случайным событием, наступающим при осуществлении следующих случайных событий: к моменту начала сеанса существует хотя бы один незанятый маршрут; все элементы хотя бы одного незанятого маршрута исправны; все элементы выбранного для связи маршрута остаются исправными в течение сеанса связи.
Так как эти события независимы, то можно определить вероятность успешной реализации сеанса как произведение вероятностей наступления этих событий.
Разработаны два метода учета занятости элементов сети. Первый основан на использовании диаграмм доступности маршрутов, второй - на использовании коэффициентов занятости каналов. Первый метод обладает потенциально более высокой точностью, так как позволяет использовать не только информацию о величинах интервалов доступности, но и об их взаимном расположении, а также о структурах маршрутов.
Существует принципиальное отличие влияния занятости элементов сети от влияния потока внезапных отказов, которое заключается в том, что события "возникновение отказа канала Кa" и "возникновение отказа канала Кd " так же, как и событие "завершение восстановления канала", являются независимыми, в то время как события "занятие канала Кa" и "занятие канала Кd" есть события зависимые и вызваны они вхождением каналов Кa и Кd в одни и те же маршруты. При надежностном анализе вопрос о степени зависимости событий занятости каналов является принципиальным. На степень независимости занятости каналов влияет мощность множества занятых маршрутов, причем чем больше маршрутов занимается в различные моменты времени, тем меньше зависимость между событиями занятости каналов. Поэтому степень зависимости занятости каналов уменьшается с ростом размеров сети (при неизменных интенсивностях потоков заявок). С другой стороны, степень зависимости уменьшается при увеличении в определенных пределах интервала наблюдения. Однако при этом повышается ошибка привязки значения коэффициента доступности к его истинному значению в некоторый момент времени внутри интервала наблюдения.
Вероятность того, что элементы выбранного маршрута будут исправны в течение сеанса связи, равна произведению вероятностей безотказной работы элементов маршрута в течение сеанса связи. Эти вероятности однозначно определяются интенсивностью отказов элементов маршрута и продолжительностью сеанса связи.
Методы расчета вероятности связности, которые применяются для надежностного анализа ССКК, могут быть разделены на две группы: методы получения точных значений вероятности связности и методы вычисления нижних и верхних оценок этой вероятности.
Методы первой группы требуют достаточно больших вычислительных ресурсов и при приемлемом на практике времени расчетов (порядка нескольких минут) применимы для сетей, в которых число путей не превышает 15. Эти обстоятельства вынуждают использовать методы вычисления оценок надежностных показателей сложных сетей связи.
Надежностный анализ сетей связи с коммутацией пакетов
Из-за того, что при передаче информации в ССКП каждое сообщение разделяется на пакеты ограниченной длительности (несколько сотен байт), причем в общем случае при работе в дейтаграммном режиме пакеты могут передаваться по различным маршрутам, показатели надежности ССКК не могут использоваться для ССКП. Надежность ССКП существенно зависит от реализованных в системе алгоритмов маршрутизации и управления нагрузкой. В качестве показателя надежности ССКП используется сумма взвешенных коэффициентами значимости показателей надежности подсетей, связывающих ТП. В свою очередь, показатель надежности подсети есть отношение показателя эффективности подсети с реальными элементами к показателю эффективности этой же подсети с абсолютно надежными элементами. Показателем эффективности подсети ССКП является вероятность передачи заданного количества пакетов с допустимой задержкой и верностью передачи при заданных интенсивностях потоков заявок во взаимодействующих с исследуемой подсетях при заданных алгоритмах маршрутизации и управления потоком. Таким образом, определение показателя надежности ССКП сводится к двукратному решению задачи оценки показателей эффективности ССКП.
Метод оценки показателя эффективности ССКП основан на использовании математической модели функционирования СС этого типа. Она представляет собой совокупность взаимодействующих моделей подсетей, связывающих ТП. Взаимодействие моделей ТП сетевого уровня организуется следующим образом: на алгоритмы маршрутизации и управления потоком со всех моделей взаимодействующих ТП поступает информация о текущем состоянии ТП. После выполнения алгоритма маршрутизации информация о назначенных маршрутах поступает для обработки по алгоритму управления потоком, который формирует сигналы начала передачи по тому или иному маршруту, поступающие на модели соответствующих ТП.
Сеть представляется композицией взаимодействующих вероятностных конечных автоматов Мили-Мура A1, A2, ..., Ak , причем автомат Ai описывает функционирование i-й ТП, а состояние ССКП есть декартово произведение состояний этих автоматов. Последовательность состояний ССКП в процессе функционирования является дискретной случайной последовательностью, в которой время пробегает дискретный ряд значений, определяемых моментами наступления случайных событий типа "отказ элемента", "завершение восстановления элемента", "начало передачи по маршруту", "конец передачи по маршруту". При этом вероятность состояния ССКП в некоторый момент времени зависит только от того, в каком состоянии она находилась в непосредственно предшествующий ему момент времени. Это свойство позволяет использовать для анализа поведения моделируемой ССКП аппарат теории марковских процессов и теории массового обслуживания.
Метод определения показателя надежности ССКП, работающей в режиме виртуального канала, аналогичен методу определения показателя надежности при работе ССКП в дейтаграммном режиме за тем только исключением, что используется другая модель, получаемая из модели для дейтаграммного режима при введении ряда упрощений, отражающих особенности алгоритмов маршрутизации, реализуемых в этом режиме.
Модель, описывающая функционирование ССКК, получается из модели, описывающей ССКП, работающей в режиме виртуального канала, путем введения запрета на использование элементов выбранного для сеанса связи маршрута для организации других сеансов.
Надежностный анализ цифровых сетей интегрального обслуживания
Анализ особенностей функционирования ЦСИО позволяет сделать вывод, что для них не существует единственного оптимального для всех условий передачи метода коммутации. Это вынуждает применять методы адаптивной коммутации интегральной информации с целью повышения коэффициента использования каналов и уменьшения задержки передачи, позволяющие выбирать оптимальный, применительно к текущему состоянию сети и поступившей заявке, метод коммутации.
Использование методов адаптивной коммутации существенно усложняет задачу анализа надежности ЦСИО. Очевидно, что это является одной из причин малой изученности и освещенности в литературе методов оценки показателей надежности ЦСИО. Вследствие этого при решении задач синтеза не учитываются отказы и сбои аппаратно-программных средств ЦСИО. Вместо этого исходят из эмпирического допущения о том, что для распределенных сетей передачи данных требования по надежности будут выполнены, если между парой абонентов ЦСИО существует два и более независимых пути. Поэтому при решении задачи синтеза топологии структур распределенных ЦСИО вместо требования к показателям надежности используется ограничение на минимальное число независимых маршрутов между любой парой абонентов ЦСИО. Очевидно, что уровень требований по надежности, определенный на основе описанного выше подхода, не может быть рациональным для различных СС даже одного класса, а именно корпоративных, так как он определяется рядом таких факторов, как число пользователей, интенсивность потока заявок, тип аппаратных средств и т. д., по которым СС существенно отличаются одна от другой.
3. Методы обеспечения требуемого уровня надежности сетей
Сети связи с коммутацией каналов
Обеспечение высокой надежности не является самоцелью, а представляет собой средство достижения максимальной эффективности сети. Уровень надежности, при котором достигается максимум показателя эффективности СС, является оптимальным для нее. Этот уровень определяется многими факторами, к числу которых относятся: назначение СС, ее структура, размер убытков, вызванных потерей заявки на обслуживание, используемые алгоритмы управления, уровень надежности элементов СС, их стоимость, условия эксплуатации и т. д. Оптимальный уровень надежности СС определяется на этапе системного проектирования системы более высокого порядка, в которую СС входит в качестве подсистемы.
Задача обеспечения требуемой надежности может решаться как при синтезе СС, так и в ходе управления уже существующей СС. В первом случае она сводится к определению варианта назначения типов элементов из заданного множества, обеспечивающего требуемый уровень надежности при минимальной стоимости. Решение ее применительно ко всей СС сразу для реальных сетей оказывается невозможным из-за большой размерности задачи. Поэтому ее вначале решают для подсети, связывающей пару абонентов с высшим приоритетом. Затем с учетом сделанных назначений типов элементов решают эту же задачу для следующей по приоритетности тяготеющей пары и т. д., пока требования по надежности связи не будут удовлетворены для всех заданных тяготеющих пар.
Задача назначения типов элементов подсети относится к задачам целочисленного программирования с линейной целевой функцией и нелинейными ограничениями. При ее решении может оказаться, что при заданном наборе типов каналов и станций требуемый уровень надежности не может быть достигнут. Тогда используется резервирование элементов. Резервированный элемент рассматривается как некоторый эквивалентный элемент, который вводится в исходный набор элементов, после чего задача распределения решается описанным способом.
Обеспечение требуемого уровня надежности на этапе управления существующей СС вначале решается с целью использования для этого внутренних ресурсов сети, без введения структурной избыточности, и сводится к формированию множества маршрутов для каждой тяготеющей пары, обеспечивающего требуемый уровень надежности.
Формирование множества маршрутов осуществляется итеративно, причем на каждом шаге для сформированного к началу этого шага множества рассчитывается вероятность успешной реализации сеанса. Если эта вероятность не меньше требуемой, процесс завершается.
Формирование начального множества маршрутов может осуществляться двумя способами. Первый заключается в том, что пользователь включает в него маршруты, отобранные им на основании некоторого критерия, например, исходя из прежнего опыта их использования. Второй способ применяется, когда пользователь не имеет возможности самостоятельно сформировать это множество. В этом случае отбирается некоторое количество (обычно не более десяти) наиболее надежных маршрутов, из которых пользователь выбирает по своему усмотрению некоторое подмножество. Если показатель надежности сформированной таким образом подсети меньше требуемого, из оставшегося множества выбираются наиболее надежные маршруты (возможно, один), оценивается обеспечиваемая при этом вероятность связности и т. д.
Формирование множества маршрутов не всегда обеспечивает требуемую вероятность связности даже при включении в него всех возможных маршрутов между передающей и приемной станциями. В этом случае достигнуть требуемой вероятности связности можно только путем введения структурной избыточности (резервирования) элементов подсети, связывающей ТП.
Известен метод определения рационального варианта резервирования, обеспечивающего максимальное приращение вероятности связности при минимальной стоимости. Под рациональным понимается вариант резервирования, отличие которого от оптимального, найденного полным перебором, варианта практически несущественно.
Задача повышения надежности СС может возникать как в глобальной, так и в локальной постановках. Одной из целей решения этой задачи в глобальной постановке может быть повышение надежности СС в целом. Формально это сводится к тому, что в качестве целевой функции выбирают стоимость мероприятий по совершенствованию СС, а в качестве ограничения - сумму взвешенных коэффициентами важности тяготеющих пар вероятностей их связности. Такой подход приемлем, если заранее известно требуемое значение обобщенного показателя надежности всей СС, которое должно быть достигнуто введением структурной избыточности, и совершенствование СС осуществляется за один этап.
При невозможности обеспечения выполнения второго условия, совершенствование сети осуществляется в несколько этапов, на каждом из которых желательно обеспечивать минимально возможную стоимость приращения обобщенного показателя надежности СС. Поэтому в качестве критерия отбора варианта резервирования используют отношение суммы взвешенных коэффициентами значимости ТП приращений вероятностей связности их, обусловленных принятием варианта резервирования, к стоимости варианта.
На первый взгляд, принятие второго критерия вместо первого ничего не меняет. Однако на самом деле меняется содержание задач улучшения СС. Если принять первый, то задача заключается в определении варианта резервирования, который обеспечивает получение требуемых значений обобщенного показателя надежности сети за минимальную стоимость. При выборе второго критерия задача сводится к определению варианта резервирования, обеспечивающего максимальное приращение обобщенного показателя надежности на единицу затрат, то есть в этой постановке любое улучшение СС за цену, превышающую стоимость одного резервного элемента, приемлемо, в то время как в первой постановке приемлемым может считаться только тот вариант, при котором достигается требуемое значение обобщенного показателя надежности сети.
В локальной постановке задача резервирования возникает в ходе оперативного управления СС. Характерные особенности этих ситуаций состоят в следующем:
- требуется обеспечить заданные значения вероятности связности для некоторого подмножества ТП (возможно, даже одной ТП);
- имеются средства, достаточные для решения этой задачи за один этап.
В этом случае целесообразно использовать второй критерий отбора варианта резервирования, а в качестве ограничения, то есть условия, которому должен удовлетворять каждый приемлемый вариант, должно выступать удовлетворение требований по вероятности связности для всех ТП из заданного подмножества.
В связи с этим задача определения варианта резервирования сводится к определению варианта подключения множества резервных элементов, имеющего максимальное значение отношения суммы взвешенных коэффициентами значимости ТП из заданного множества приращений вероятности их связности, к стоимости варианта резервирования, обеспечивающего выполнение требований по величине вероятности связности для всех ТП из этого множества. Эта задача относится к классу задач многошаговой оптимизации. Для ее точного решения, дающего оптимальный вариант резервирования, можно использовать метод динамического программирования. Однако применение его для СС реальной сложности приводит к недопустимо большим требуемым вычислительным ресурсам. Учитывая, что наиболее часто эта задача решается в ходе оперативного управления СС, применение методов точного решения задач резервирования представляется бесперспективным. Поэтому используются приближенные методы, обеспечивающие получение близких к оптимальным (так называемых рациональных) вариантов резервирования реальных СС при приемлемых затратах вычислительных ресурсов. Одним из таких методов является квазиградиентный метод, основанный на пошаговой оптимизации вместо глобальной. В основу метода, обеспечивающего сокращение объема перебора, положена идея поэтапного сокращения размеров участка СС, для которого отыскивается рациональный вариант резервирования. Вначале эта область сужается до подмножества ТП, затем - до ТП, на следующем этапе - до маршрута в этой ТП. На последнем этапе осуществляется перебор возможных вариантов резервирования каналов выбранного маршрута и их комбинаций. Для сужения возможного множества вариантов, среди которых отыскивается рациональный, используются производные функции вероятности связности по маршрутам. Величины этих производных характеризуют "скорость" повышения значения вероятности связности ТП при резервировании каналов, входящих в эти маршруты. Метод позволяет определять рациональный вариант резервирования, предусматривающий резервирование как каналов, так и станций.
Обеспечение требуемой надежности сетей связи с коммутацией пакетов
Требуемый уровень надежности ССКП, как и ССКК, может быть достигнут как формированием соответствующего множества маршрутов, так и резервированием элементов маршрутов.
Анализ метода формирования множества маршрутов для ТП ССКК позволяет сделать вывод о том, что в основу положена итеративная процедура, состоящая из следующих операций:
а) формирования нового подмножества маршрутов для заданной подсети (ТП);
б) определения надежностных характеристик связи в заданном направлении, достигаемых при наличии в подсети текущего подмножества маршрутов;
в) оценки соответствия полученных значений надежностных характеристик нормативным и принятие на этой основе решения о продолжении процесса расширения подмножества маршрутов.
Применительно к формированию множества маршрутов для подсетей ССКП содержание процедур а) и в) остается тем же, что и для ССКК. Содержание процедуры б) определяется особенностями функционирования ССКП, проявляющимися в специфике метода расчета показателей надежности. В соответствии с этим выполнение процедуры б) применительно к ССКП отличается тем, что после формирования очередного текущего подмножества маршрутов определяется множество ТП, взаимодействующих с данной ТП, с учетом этого корректируется модель ССКП и рассчитываются показатели надежности подсети для текущего подмножества маршрутов.
При разработке метода определения рациональных вариантов резервирования элементов сетей с коммутацией пакетов оказалось необходимым дополнительно задавать в качестве исходных данных характеристики потоков заявок, обслуживаемых во взаимодействующих подсетях.
Для решения этой задачи используется квазиградиентный метод, модифицированный в соответствии со спецификой функционирования ССКП.
Заключение
Задачи оценки и обеспечения требуемого уровня надежности сетей связи, возникающие как при проектировании, так и в ходе оперативного управления, являются актуальными в теоретическом и практическом отношении. Сложность методов их решения существенно зависит от типа коммутации, используемого в сети. Проблемы надежности сетей связи с коммутацией пакетов можно отнести к числу наиболее сложных проблем надежности. Методы решения этих задач применительно к цифровым сетям интегрального обслуживания, в которых используется адаптивный выбор алгоритмов маршрутизации и управления нагрузкой, практически не разработаны.
В качестве рекомендаций можно указать следующее. При проектировании и управлении существующими СС целесообразно использовать единую систему надежностного анализа и синтеза сетей связи, которая позволяет:
- задавать на экране структуру СС, обрабатывать статистическую информацию о занятости каналов;
- рассчитывать показатели надежности сети с учетом занятости элементов СС;
- определять множество маршрутов, обеспечивающих максимальную надежность связи;
- определять рациональный вариант резервирования каналов и станций, обеспечивающий требуемую надежность;
- определять рациональный вариант наращивания СС, обеспечивающий требуемую надежность связи.
|
С автором можно связаться по e-mail: totsenko@ipri.kiev.ua.
Литература
- Бертсекас Д., Галлагер Р. Сети передачи данных. М.: Мир, 1989.
- Гадасин В. А. Методы расчета структурной надежности сетей связи. М.: 1986.
- Лясковский Ю. К. Frame Relay - путь к цифровой суперсвязи. Журнал "Сети" #7, 1995.
- CCITT, "Provision recommendations X.3, X.25, X.28 and X.29 on packet-switched data transmission services". Int. Telecommunications Union, Geneva, Switzerland, 1977.
- Советов Б. Я., Яковлев С. А. Построение сетей интегрального обслуживания. Л.: Машиностроение, 1990.
- Тоценко В. Г., Александров А. В., Парамонов Н. Б. Корректность, устойчивость, точность программного обеспечения. К.: Наукова думка, 1990.
- Филин Б. П. Методы анализа структурной надежности сетей связи. М.: Радио и связь, 1988.
- J. Bowles. A Model for Assesing Computer Network Reliability. IEEE Southeast CON'89: Conf. and Exhib. Energy and Inf. Technol. Southeast. Columbia, S.C. Apr. 9-12, 1989: Proc. vol.2. NewYork (NY), 1989.
- D. Richard Kuhn. Sources of failure in the Public Switched Telephone Network. Computer, April 1997.