Подготовка данных для кластеризации событий в журналах информационной безопасности
Аннотация
Дата поступления статьи: 25.04.2022В статье показано, что подготовка данных для использования в дальнейшем в алгоритмах играет важную роль и этому стоит уделить внимание. Рассмотрены задачи обработки исходных данных: выборка данных, очистка данных, генерация признаков, интеграция, форматирование. Исследование данных состоит в изучении следующих шагов: обобщение данных, группировка данных, исследование отношений между разными атрибутами. Приведен алгоритм действий подготовки данных в рамках событий журнала информационной безопасности для дальнейшей кластеризации.
Ключевые слова: данные, кластеризация данных, события, журнал информационной безопасности, алгоритм, Data Mining, Data Preparation, dataset, Machine Learning
05.13.01 - Системный анализ, управление и обработка информации (по отраслям)
.