ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 04.12.2023
Просмотров: 321
Скачиваний: 2
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
СОДЕРЖАНИЕ
Резервирование в информационной системе — стандартные решения
Архитектура системы управления
Структура ЭС интеллектуальных систем
Наиболее известные/распространённые ЭС[править|править вики-текст]
Принципы организации хранилища
Стратегии работы с внешней памятью[править|править вики-текст]
Практически все катастрофы и аварии, угрожающие целостности бизнеса, являются предсказуемыми с определенной степенью вероятности. Катастрофические события могут быть природными (землетрясение, наводнение) либо механическими (неисправность жесткого диска, разрыв водопроводной трубы и т. д.). Например, если служба приема заявок клиентов на техническое обслуживание расположена в Ваките (шт. Оклахома), весьма вероятно, что информационные системы центра рано или поздно окажутся на пути торнадо. Точно так же, в любой компании, использующей результаты технического прогресса, всегда вероятен отказ аппаратных средств.
Определив критически важные системы, можно приступать к моделированию угроз со стороны предсказуемых и вероятных событий. Моделирование позволяет реализовать структурный подход к определению потенциальных угроз, несущих в себе максимальную опасность для целостности бизнеса, и ослаблению их негативных последствий. Составьте список возможных сценариев нарушения работоспособности критически важных информационных систем, а также событий, предшествующих реализации каждой из угроз. Например, работоспособность центра приема заявок клиентов может быть нарушена из-за недоступности базы регистрируемых заявок. Предшествующим событием может стать отказ аппаратных средств, перебой в питании либо нечто более серьезное, например разрушение информационного центра из-за торнадо.
Этап 4. Разработка планов и процедур сохранения целостности бизнеса
После составления списка критически важных деловых операций, перечисления информационных систем, обеспечивающих их выполнение, и определения возможных и вероятных событий, способных нарушить работоспособность указанных информационных систем, можно приступить к выработке превентивных мер, имеющих целью сохранение целостности бизнеса, с использованием моделей угроз. В рамках ВСР существуют четыре категории превентивных мер: отказоустойчивость и восстановление после сбоя, резервное копирование, «холодное» запасное оборудование и помещения и «горячее» запасное оборудование и помещения.
Отказоустойчивость и восстановление после сбоя. Эта категория превентивных мер предполагает использование резервируемых аппаратных средств, сохраняющих работоспособность при отказе отдельных элементов. В ИТ для обеспечения отказоустойчивости наиболее широко используются массивы жестких дисков, технологии кластеризации, аккумуляторные и генераторные источники питания.
Резервное копирование. Резервное копирование с использованием внутрисистемных и внесистемных средств занимает центральное место среди превентивных мер в рамках DRP. В случае утраты данных резервное копирование обеспечивает возможность восстановления и реконструкции информации по последним данным, соответствующим работоспособному состоянию систем.
«Холодное» запасное оборудование и помещения. «Холодное» запасное оборудование — это автономные устройства, которые можно быстро подготовить к выполнению рабочих функций. Например, можно держать набор серверов без подключения к сети, на которых установлены операционные системы с настройками, принятыми в компании. В случае аварии можно завершить настройку конфигурации и восстановить либо скопировать данные, необходимые для возобновления работы. «Холодное» помещение вмещает автономное оборудование, которое можно использовать для возобновления работы в случае аварии на главном оборудовании. Часто «холодное» помещение представляет собой просто зал, способный вместить рабочие столы и стулья. Для большинства организаций малого и среднего бизнеса (SMB) содержание «холодных» помещений не является экономически выгодным.
«Горячее» запасное оборудование и помещения. «Горячее» запасное оборудование - это устройства, готовые к немедленной работе в чрезвычайной ситуации. Например, можно непрерывно дублировать критически важную информацию с занесением в удаленную базу данных и обеспечить возможность перенаправления клиентских приложений к этим копиям данных в случае необходимости. «Горячее» оборудование позволяет очень быстро возобновлять выполнение операций. Скорость приведения «горячего» оборудования в работоспособное состояние обычно определяется временем, необходимым сотрудникам для прибытия к месту хранения запасного оборудования. «Горячее» оборудование располагает точными копиями данных в реальном времени (или почти в реальном времени) и всегда работоспособно. Содержание «горячего» запасного оборудования и помещений обходится дорого, так что этот вариант используется только в организациях, которые должны сохранять работоспособность в чрезвычайных ситуациях, например в ведомствах государственной безопасности.
Этап 5. Разработка планов и процедур послеаварийного восстановления
Не все события являются предсказуемыми и вероятными. Трудно найти более удачный пример непредсказуемой катастрофы, чем атака на всемирный торговый центр 11 сентября 2001 г. Для чрезвычайных обстоятельств такого рода, а также для других серьезных катастроф, в которых возможна полная потеря данных и работоспособности главных систем, необходима разработка планов и процедур восстановления. Поскольку послеаварийное восстановление относится к стрессовым ситуациям, очень важно иметь под рукой хорошо документированные, проверенные и испытанные на практике процедуры. Убедиться в работоспособности данных, хранящихся на резервных носителях, можно в режиме имитации работы процедур восстановления. Необходимо позаботиться о средствах внесистемного хранения копий процедур, выполняемых в рамках DRP, вместе с проверенными работоспособными резервными копиями. Для большинства организаций наиболее эффективным, доступным и безопасным вариантом внесистемного хранения проверенных резервных копий и планов DRP являются депозитарные ячейки и банковские сейфы.
РЕКЛАМА
Этап 6. Проверка работоспособности планов сохранения целостности бизнеса и испытание на практике средств послеаварийного восстановления
Сам характер обстоятельств, вынуждающих составлять планы ВСР и DRP, предполагает необходимость гарантии работоспособности планов, процедур и технологий, используемых для сохранения целостности бизнеса. Проведите планируемые и спонтанные учения для проверки состоятельности стратегий ВСР и DRP. Можно раз в месяц имитировать отказ кластерных узлов, периодически выполнять восстановление «холодных» запасных серверов либо проводить полномасштабные имитации катастрофических ситуаций с проверкой работоспособности «холодных» и «горячих» средств восстановления. Как минимум, следует выполнить восстановление критически важных данных по резервным копиям с хранящихся вне офиса носителей. Хранящиеся вне офиса носители резервных копий - последняя линия защиты от полной утраты данных.
Шесть этапов защиты от катастрофы
Выполняя перечисленные этапы, можно помочь предприятию создать программу BCP и DRP, которая обеспечит защиту от последствий природных, механических и обусловленных человеческим фактором катастроф. Когда сотовый телефон звонит в два часа ночи, меньше всего хочется лихорадочно изобретать пути восстановления данных, находящихся на сервере и лентах и пробывших под водой в течение 30 часов, или, что еще хуже, после физического разрушения информационного центра в результате катастрофы.
Бен Смит - Специалист по безопасности в компании Microsoft.
Раздел 5. Замена расходных материалов и мелкий ремонт периферийного оборудования, определение устаревшего оборудования и программных средств сетевой инфраструктуры.
Лекция 27. Принципы локализации неисправностей.
Локализация неисправностей - это возможность быстро изолировать сбой. Найти неисправность при поиске сбоев в сетях, - это значит сделать половину дела по ее устранению. Программа сбора статистики может сообщить, что число пакетов в сегменте вдруг многократно увеличилось, но она далеко не всегда "знает", откуда эти пакеты появляются. Поэтому некоторые пользователи, например, Натан Цурхер, специалист по локальным сетям компании MagneTek предпочитают такие продукты как LANalyzer компании Novell. Другие пользователи, среди которых Ричард Манникс, управляющий сетевыми службами компании Fuller предпочитают программу Sniffer, разработанную компанией Network General.
По мере усложнения сетей все большую актуальность приобретает задача локализации неисправностей.
С другой стороны, отмечает Хантингтон-Ли, такие продукты как LANalyzer приемлемы лишь в том случае, если вы располагаете достаточным временем. Вместе с тем она считает, что программы NetView и Spectrum предлагают наилучшие средства локализации неисправностей. Инструментарий сетевого управления OpenView, пожалуй, наиболее перспективен в этой области, поскольку такие производители как Maxm Systems и Boole & Babbage обеспечили совместимость своих систем с NetView, которая является компонентом программы OpenView, разработанной компанией Hewlett-Packard.
Томайно считает, что эта весьма важная характеристика во всех программных продуктах представлена примерно одинаково. "Я думаю, что все программы неплохо справляются с этой задачей. Если компания не может обеспечить локализацию неисправностей в своих продуктах, она просто не выдержит конкуренции".
Алгоритм поиска неисправности сети.
В наше с Вами время зависимость от сетевых ресурсов (интернета, локальной сети организации) многократно возросла. В современном мире работа многих компаний частично или полностью зависит от доступности сети. Начиная от сетевого сообщения внутри компании между сотрудниками, обмена информацией и документами между фирмами и заканчивая компаниями, работа которых целиком и полностью зависит от работоспособности и качества сети (например, трейдерские компании, теряющие огромные средства от несостоявшихся online-сделок). Внутрисетевые ресурсы компаний растут и усложняются, в их построение вовлекается все больше оборудования, сервисов, связей между сетями интернет-провайдера и частными сетями, а конвергенция голосового и видеопотоков в сети передачи данных добавляет ко всему прочему еще больше сложности и, как следствие, важности вопросов стабильности, надежности и безопасности. Усложняющаяся структура сетей означает рост вероятности возникновения проблем, источник которых часто локализировать становится очень сложно. В итоге неполадки, отказы и перебои функционирования сети становятся все более крупной проблемой, которую необходимо предупреждать. Поэтому, поиск и устранение неисправностей в сети стали неотъемлемой частью гарантии успеха функционирования предприятий.
Отказы в сети характеризуются определенными признаками. Это могут быть как общие проблемы (клиенты не могут получить доступ к определенным ресурсам), так и более конкретные (нарушения в таблице маршрутизации). Неисправность любого вида может быть локализована до одной или нескольких конкретных причин при использовании определенных алгоритмов и методов поиска неисправностей. Будучи идентифицированной, к каждой проблеме может быть применен ряд действий, осуществляющий решение данной неисправности. То есть, работать по принципу «от общего к частному», устраняя каждую наиболее вероятную причину неисправности от более вероятной к маловероятной, тем самым систематизировав процесс восстановления работоспособности сети и уменьшив временные затраты.
Шаг 1. Анализ проблемы.
Детектирование проблемы, учитывая текущие признаки и потенциальные причины, а так же, какие из причин могли повлечь за собой возникновение неисправности. Например, некоторые узлы сети не отвечают на запросы или отдельные их интерфейсы, недоступность линии связи между двумя узлами, в то время, как физически соединение присутствует, возможные неполадки в маршрутизации или функционировании отдельных устройств и т.д.
Шаг 2. Сбор статистики.
Опрос узлов сети на предмет получения log-файлов, диагностические команды узла сети, нарушающего общее функционирование (при условии его доступности)
Шаг 3. Локализация причины
Базируясь на полученных сведениях, отброс некоторых потенциальных проблем. В зависимости от полученных данных, стоит определить характер проблемы – аппаратная ли она или программная.
Шаг 4. Устранение проблемы.
Представляя вероятные причины неисправности, пошагово осуществлять ряд операций, ведущий к ее устранению, параллельно проверяя результат своих действий. Нужно четко понимать, какое конкретное действие приводит к правильному пути для устранения неисправности, чтобы, во-первых, всегда была возможность вернуться на шаг назад, а во-вторых, иметь представление о том, как решить подобную проблему в будущем используя уже выверенный план действий.
Шаг 5. Анализ результатов.
Если проблема решена, значит примененный инструментарий для ее решения был верен. Процесс завершен. Если разработанный алгоритм не принес успеха, необходимо вернуться на Шаг 3 и пересмотреть ход действий, осуществив процесс устранения заново.