Методы объединения, сокращения размеров и обработка больших данных
Аннотация
Дата поступления статьи: 02.11.2021Актуальность исследования обусловлена тем, что анализ больших данных может быть проблематичным, так как он зачастую включает сбор и хранение смешанных данных, которые основаны на разных правилах или закономерностях. В связи с этим, данная статья направлена на анализ существующих методов обработки больших данных, которые можно применить к обработке смешанных или разнородных данных. В статье описываются преимущества и недостатки самых часто применяемых методов обработки смешанных данных. Раскрываются проблемы обработки разнородных данных. Приведены инструменты обработки больших данных, некоторые традиционные методы интеллектуального анализа данных, а также машинного обучения. Представлены преимущества слияния больших смешанных данных. В данной работе под разнородными данными следует понимать любые данные с высокой изменчивостью типов данных, форматов и характера происхождения. Материалы статьи представляют практическую ценность для обработки больших данных, выбора методов обработки больших данных, включая очистку данных, объединение данных, сокращения размеров и обработки смешанных данных и соответствующего аналитического и системного анализа.
Ключевые слова: разнородные данные, смешанные данные, разномасштабные данные, методы обработки данных, интеллектуальный анализ, аналитика данных
05.13.01 - Системный анализ, управление и обработка информации (по отраслям)
.