Диагностика проблем кластеров Windows Server 2008 R2

Главное, что следует искать

В этой статье мы рассмотрим методы устранения неполадок отказоустойчивых кластеров Windows Server 2008 R2. Существует много способов диагностики кластеров, и каждый специалист может иметь свои особые приемы. Однако здесь я представлю наиболее общие подходы к решению проблем. Вначале поговорим о файлах, с которыми обычно приходится иметь дело, и об их описаниях.

Первое, с чем предстоит работать, —диспетчер отказоустойчивости кластеров. Этот новый инструмент управления кластером позволяет руководить группами и ресурсами и выполнять диагностику неполадок. Диспетчер отказоустойчивости кластеров открывается из пункта «Администрирование» в меню «Пуск».

Каналы событий

Каждый, вероятно, знаком с журналом системных событий, в котором регистрируются критически важные события, ошибки и предупреждения. Однако это не единственное место, где фиксируются события. Начиная с Server 2008 существуют еще и каналы событий. На экране 1 показано, как найти каналы, имеющие отношение к отказоустойчивой кластеризации. Именно здесь следует искать все информационные и отладочные/диагностические события. На схеме мы видим следующие журналы и их каналы.

• FailoverClustering:

— Operational;

— Diagnostic (если выбран пункт Show Analytic and Debug Logs («отобразить журналы анализа и отладки»));

— Performance-CSV (если выбран пункт Show Analytic and Debug Logs).

• FailoverClustering-Client:

— Diagnostic (если выбран пункт Show Analytic and Debug Logs).

• FailoverClustering-Manager:

— Admin;

— Diagnostic (если выбран пункт Show Analytic and Debug Logs).

• FailoverClustering-WMIProvider:

— Admin;

— Diagnostic (если выбран пункт Show Analytic and Debug Logs).

События запуска/остановки службы кластеров, перемещения групп, перевода групп в онлайн/автономный режим и т. д. регистрируются в журнале FailoverClustering\Operational. Например:

Идентификатор события: 1061 Описание: служба кластеров успешно настроила отказоустойчивый кластер JohnsCluster.

Неудачные попытки установления соединения с другими узлами при открытии диспетчера отказоустойчивости кластеров регистрируются в журнале FailoverClustering-Manager\Admin. Например: Идентификатор события: 4684 Описание: диспетчеру отказоустойчивости кластеров не удалось связаться с серверами DNS для разрешения имени W2K8-R2-NODE2.contoso.com. Дополнительные сведения можно найти в канале диагностики диспетчера отказоустойчивости кластеров.

В журнале FailoverClustering-Manager\ Diagnostic можно увидеть следующее:

Идентификатор события: 4609

Описание: ошибка при попытке проверки связи с W2K8-R2-NODE2.contoso.com. System.ApplicationException: не удалось связаться с одним или несколькими DNS-серверами. Убедитесь в правильности настройки DNS и полном подключении компьютера к сети.

Идентификатор события: 4612 Описание: проверка связи с W2K8-R2-NODE2.contoso.com завершилась сбоем.

Именно по этим событиям можно установить проблему подключения узла к серверу DNS и затем приступить к ее устранению. Не просматривая указанные журналы, о наличии неполадок можно будет судить по тому, что в диспетчере отказоустойчивости кластеров узел W2K8-R2-NODE2 будет отображен как неисправный. Еще один журнал в числе упомянутых выше, Failover-Clustering\Diagnostic, мы обсудим несколько позже.

Популярные шаблоны