Сборники трудов ИСП РАН


Автоматизация обнаружения и анализа ошибок в гиперконвергентных системах

Силаков Д.В. (Виртуоззо Рисерч, Москва, Россия)

Аннотация

Статья посвящена проблеме выявления и оперативного анализ ошибок, возникающих при эксплуатации гиперконвергентных систем. Одним из подходов к организации гиперконвергентных систем является установка на каждый физический сервер отдельного экземпляра операционной системы (ОС), несущей в себе средства виртуализации и инструментарий для администрирования и использования распределенного хранилища данных. Возникновение ошибок возможно как на уровне отдельного экземпляра ОС, так и на уровне всего кластера, Например, некорректные команды управляющих элементов с одного узла инфраструктуры могут вызвать сбой ПО на другом узле. Кроме того, ошибки со стороны подсистем кластера могут спровоцировать нештатные ситуации внутри виртуальных машин. Сложность архитектуры гиперконвергентных систем обуславливает сложность анализа возникающих в них ошибок. Для упрощения такого анализа и повышения его эффективности необходима автоматизация процесса обнаружения проблем и сбора данных, необходимых для их изучения и исправления. Рассматриваются подходы к автоматизации подобных процессов в существующих ОС и предлагаются способы их адаптации к системам, использующим распределенное хранилище данных и виртуализацию. Описывается опыт применения адаптированных решений в продуктах Virtuozzo.

Ключевые слова

обнаружение ошибок; виртуализация; хранилище данных

Издание

Труды Института системного программирования РАН, том 31, вып. 4, 2019, стр. 29-38.

ISSN 2220-6426 (Online), ISSN 2079-8156 (Print).

DOI: 10.15514/ISPRAS-2019-31(4)-2

Для цитирования

Силаков Д.В. Автоматизация обнаружения и анализа ошибок в гиперконвергентных системах. Труды Института системного программирования РАН, том 31, вып. 4, 2019, стр. 29-38. DOI: 10.15514/ISPRAS-2019-31(4)-2.

Полный текст статьи в формате pdf Вернуться к содержанию тома