Разработанное программное обеспечение позволит аналитикам более эффективно выявлять аномалии в информационных системах и размечать данные для автоматизации данного процесса.
Современные информационные системы зачастую подвергаются серьезным кибератакам. Так, например, по данным компании «Ростелеком-Солар», 92 % кибератак, совершенных высокопрофессиональными злоумышленниками в 2021 году, были направлены на объекты критической информационной инфраструктуры, а именно государственные организации, предприятия энергетики, промышленности и военно-промышленного комплекса.
Для обеспечения безопасности кибер-физических объектов, таких как «умные» системы очистки водоснабжения, цифровые объекты электрической генерации или ракетные двигатели используются методы машинного обучения и искусственного интеллекта. На основании выявленных ранее аномалий появляется возможность в будущем предотвратить подобную кибератаку. Чтобы алгоритмы машинного обучения работали корректно, необходимы размеченные данные — данные, дополненные тегами о типах атак или аномалий с присвоением справочных тегов или выходной информацией.
Ручная разметка данных — это непростая и дорогостоящая задача. Для ее решения ученые кафедры информационных систем СПбГЭТУ «ЛЭТИ» разработали специальный инструмент — программное обеспечение, которое позволит упростить ручную разметку за счет автоматизированного определения различных состояний объекта, выявления выбросов и применения интерактивных моделей визуализации.
«Новизна предлагаемого инструмента состоит в реализуемой методике выявления аномалий путем построения интегрального показателя оценки изменения состояний объекта, позволяющего выявить аномалии в поведении, алгоритме его вычисления и подходе к визуальной разметке данных на основе данного показателя», — отмечает руководитель проекта, доцент кафедры ИС Евгения Новикова.
Работа ПО основана на вычислении триангуляции Делоне для последовательности точек данных, описывающих состояние кибер-физического объекта на заданном интервале времени. Полученное интегральное значение может быть легко визуализировано на временной шкале. График изменения данного значения способен отражать изменение состояния объекта во времени, а всплески и пики укажут как на возможные отклонения от нормы в состоянии объекта, так и на переходные состояния в его функционировании.
Программное обеспечение универсально по сфере использования и найдет свое место в работе компаний, занимающихся разработкой средств защиты информации, которым для обучения моделей машинного обучения, широко используемых сейчас в информационной безопасности, требуются размеченные наборы данных.
На данный момент проект находится на этапе тестирования разработанного программного инструмента и выполнения экспериментов на различных наборах данных для оценки его эффективности. Далее планируется доработка методики выявления аномалий и подача заявления на патент.
Проект «Программное средство аннотирования многомерных данных для выявления аномалий в поведении кибер-физических объектов» поддержан грантом конкурса научно-исследовательских, опытно-конструкторских и технологических проектов СПбГЭТУ «ЛЭТИ». Проект получил финансирование на реализацию в размере 400 тысяч рублей.