Архивы: по дате | по разделам | по авторам

Методы и средства обеспечения устойчивости функционирования корпоративных сетей

Архив

автор : Александр Александров 18.05.1998

Человек, имеющий одни часы, твердо знает, который час.
Человек, имеющий несколько часов, ни в чем не уверен.

Закон Сегала

Обозначив проблемы надежности корпоративных систем в предыдущем приложении, в данном выпуске я поместил материалы, посвященные конкретным методам и средствам контроля и восстановления сетей.

При создании интегрированных информационных систем используются два классических подхода к повышению надежности их функционирования:

интолерантный, обеспечивающий работоспособность системы за счет уменьшения степени воздействия дестабилизирующих факторов (снижения вероятностей ошибок персонала и программ, сбоев и отказов аппаратуры и т. п.);
толерантный, допускающий наличие ошибок и отказов и обеспечивающий требуемую устойчивость систем с помощью средств обнаружения и устранения ошибок информации и восстановления работоспособности вычислительных комплексов.

Интолерантный подход реализуется на этапе проектирования системы в виде выбора надежной элементной и компьютерной базы, сетевого оборудования, технологии программирования, использования средств и методов ввода информации в соответствии с требованиями инженерной психологии и т. п. Данный подход влияет на количественные характеристики факторов нестабильности, которые учитываются на этапе системного анализа.

На этапе разработки проекта корпоративной сети и оценки устойчивости ее функционирования используются заданные параметры дестабилизирующих факторов, и для обеспечения требуемой работоспособности системы необходимо применять толерантные методы.

В основе толерантного подхода лежит использование программно-аппаратных средств контроля и восстановления информации и процессов обработки корпоративных данных.

Но, как это всегда бывает, на практике чаще всего используется третий путь, суть которого заключается в итеративном применении толерантного и интолерантного подходов в течение всего жизненного цикла систем автоматизации. Накопление статистики по сбоям и отказам, позволяющей выявить узкие места систем, влечет за собой подготовку обоснования замены оборудования и ПО на более качественное. А за появлением новых версий сетевых устройств и программ, новых, более надежных технологий обработки, хранения и передачи данных следует замена неустойчивых элементов и систем, производится апгрейд или полное изменение схемотехнических решений и т. д.

В соответствии с иерархической схемой построения комплексных решений автоматизации процессов управления предприятиями (см. рисунок) для обеспечения надежности их функционирования применяются специальные методы и средства, распределяющиеся по трем основным уровням:

на физическом уровне принимаются меры по повышению надежности элементов сети, осуществляется резервирование оборудования, резервное копирование и архивирование данных;
на системном уровне используются программно-аппаратные средства контроля и восстановления работоспособности сети;
на административном уровне распределяются полномочия пользователей и подсистем, разрабатываются и реализуются планы действий в чрезвычайных ситуациях и т. п.

И если методы и средства для обеспечения устойчивости работы корпоративных сетей на физическом и системном уровне хоть как-то применяются на российских предприятиях (это видно хотя бы по направленности публикуемых материалов), то административные меры по обеспечению непрерывной работоспособности систем управления компаний почти не проработаны и очень слабо освещаются в печати.

Решения компании "Анкей"

ВЦ межрегионального центра информатизации ЦБ РФ

Данное решение позволяет обеспечить полное резервирование деятельности ВЦ за счет дублирования вычислений и информации и решить проблему катастрофоустойчивости информационной системы МИЦ ЦБ. Основной и резервный вычислительные комплексы расположены на расстоянии 29 км. Непрерывность финансовых расчетов гарантируется распределенным четырехмашинным кластером на базе RISC-серверов Digital AlphaServer 8400, работающих под управлением ОС OpenVMS и СУБД Oracle Parallel Server.

В каждом вычислительном комплексе установлено по два сервера с общей дисковой подсистемой и горячей заменой накопителей и источников питания. Передача данных между парами компьютеров осуществляется по оптоволоконному каналу FDDI (100 Мбит/с), при этом обеспечивается взаимный контроль работоспособности и перехват вычислений при выходе из строя одного из компьютеров или его компонентов. Даже при отказе четырех компьютеров комплекса информация после устранения неисправностей будет восстановлена с помощью устройств резервного копирования - магнитооптических библиотек.

Для резервирования линии передачи данных, связывающей оба комплекса, используются коммутаторы Digital GigaSwitch и канал АТМ с быстродействием 622 Мбит/с. Такое решение должно защитить информацию ЦБ РФ от технических неполадок, стихийных бедствий и действий злоумышленников.

Система защиты корпоративной сети с использованием оборудования компании Cisco Systems

Для авторизации доступа к собственным intranet-ресурсам (прикладные сервисы FTP, WWW и т. п.) и контроля работы пользователей Internet (к каким серверам был доступ, с каких рабочих мест, в течение какого времени и т. д.) компания "Анкей" использует программную систему CiscoSecure ACS для ОС Sun Solaris и Windows NT. Основные сервисные функции CiscoSecure ACS:

возможность работы с группами пользователей;
установление графика по дням недели и времени суток;
контроль количества одновременных сессий при работе по телефонным линиям и В-каналам ISDN для каждого пользователя;
возможность задания информационных сообщений на различных языках и др.

В дополнение к системе компанией Cisco разработан и подключается ряд средств FireWall, как программных (Centri FireWall), так и аппаратных (PIX). Применение для защиты информации в корпоративной сети продуктов, интегрированных с сетевым оборудованием, обеспечивает высокий уровень надежности функционирования системы в целом и предоставляет возможности централизованного управления безопасностью.

Для подавляющего большинства не только предприятий, нои банков этой проблемы будто бы и не существует. На мой вопрос(см. приложение к "КТ" #14 от 13 апреля): кто, где и как использует активно применяющиеся на Западе программные пакеты для планирования восстановления корпоративной сети после аварии? мне не ответил НИ ОДИН СИСАДМИН! Хотя всем известно, что отдельные области деятельности (банковские и финансовые институты, информационные сети, государственные органы, транспорт и т. п.) нуждаются в специальных мерах обеспечения безопасности данных на всех уровнях и предъявляют повышенные требования к надежности функционирования своих информационных систем.

Хотя, может, я ошибаюсь, и все не так плохо, а планы перехода на резервные мощности и перераспределения полномочий управляющих структур в случае нештатных ситуаций есть везде, и только чрезвычайная их конфиденциальность мешает их обнародовать. Дай-то бог…

Актуальной является также тема экономического обоснования повышения надежности корпоративных сетей, оценки стоимости времени простоя и пути его сокращения, так называемый надежностный менеджмент, решающий задачу, каким образом, когда и где использовать методы и средства обеспечения работоспособности систем с максимальной эффективностью. Эти вопросы и некоторые базовые понятия устойчивости сетей рассмотрены в статье Александра Мурадяна.

Удобным инструментом для моделирования возможных событий в системе и оценки реакций на эти события являются сетевые протокольные анализаторы, описанные Евгением Ерошкиным. Осуществляя ситуационное тестирование, они помогают получить данные, незаменимые при модернизации сетей. Анализатор, конечно, не дает количественной оценки надежности, но позволяет убедиться, насколько сеть устойчива к различного рода "стрессам".

Решения компании TopS Systems Integrator

Проект ГВЦ в Министерстве путей сообщения

В конце 1997 года в Главном вычислительном центре МПС РФ был введен в эксплуатацию отказоустойчивый центр управления сетями и вычислительными ресурсами. Объединенные локальные сети ГВЦ и Министерства путей сообщения, построенные на современном сетевом оборудовании производства компаний Cisco Systems и UB Networks, насчитывают более 2 тыс. активных узлов управления.

Для обеспечения непрерывной качественной работы технических служб ГВЦ и персонала Министерства путей сообщения, а также для поддержания работоспособности и оперативного обслуживания комплекса сетевого и телекоммуникационного оборудования было принято решение о развертывании многофункциональной отказоустойчивой системы управления на основе следующих технических решений:

В качестве центра управления сетью установлен отказоустойчивый кластер на базе двух RISC/UNIX-серверов HP 9000 D270/1 SMP c 64-битными процессорами PA-8000 производства компании Hewlett-Packard. В дальнейшем серверы будут работать в многопроцессорном режиме (SMP). Особенностью построения кластера на RISC-серверах является использование дискового пространства на RAID-системе Symmetrix компании EMC.
В качестве основы для программных средств управления выбрана платформа управления сетями HP OpenView Network Node Manager/HP-UX (версия 5.01), отвечающая требованиям заказчика (LAN/WAN-управление, распределенность, Internet-доступ, поддержка кластера и др.).
Для расширенного управления оборудованием Cisco Systems и UB Networks использованы соответственно системы CiscoWorks for HP-UX-OpenView (версия 4.0) и NetDirector for UNIX FocusView/HP-UX-OpenView. Эти системы устанавливаются поверх платформы HP OpenView Network Node Manager, тем самым образуя интегрированную систему управления.
Для защиты данных центра управления сетью предусмотрено несколько уровней защиты как по разделению доступа (на основе собственных средств HP-UX 10.20 и HP OV NNM и системы FireWall-1), так и по сохранности (на основе автоматизированной системы резервного копирования и восстановления ARCserve производства компании Computer Associates и 200-гигабайтной DLT-библиотеки QTM4500S производства компании Quantum).
Для круглосуточного анализа каналов ЛВС (включая оптические магистрали), определения источников перегрузки сети, оперативного определения отказов сетевых узлов, контроля использования протоколов, оптимизации и планирования сетевых топологий (с учетом эффективности) применена система контроля и анализа трафика HP NetMetrix совместно со стационарным анализаторам трафика по RMON-стандартам HP LanProbe.

Совсем, кажется, недавно прошла выставка "Комтек '98", на которой ведущие российские системные интеграторы рассказали о разрабатываемых ими высоконадежных корпоративных сетях. В материалах приложения представлены характеристики некоторых проектов, технические решения по созданию кластеров, резервированию аппаратуры и данных.

Свои отзывы и предложения присылайте по адресу alexand@computerra.ru.