Способ автоматизированного формирования обучающего набора данных для алгоритмов машинного обучения классификации электронных документов
Аннотация
Дата поступления статьи: 24.08.2023В статье рассмотрен способ автоматизированного формирования обучающего набора данных для алгоритмов машинного обучения классификации электронных документов, отличающийся от известных формированием обучающих наборов данных на основе синтеза методов кластеризации и аугментации данных на основе расчета расстояния между объектами в многомерных пространствах.
Ключевые слова: обучение с учителем, кластеризация, распознавание образов, алгоритм машинного обучения, электронный документ, векторизация, формализованные документы
.