Извлечение ключевых понятий и связей между ними из тематических текстов на русском языке
Аннотация
Дата поступления статьи: 15.11.2022В работе рассматриваются подходы к решению таких задач обработки естественного языка, как извлечение ключевых понятий или терминов, а также семантических связей между ними для построения IT-решений на основе данных. Тема работы актуальна ввиду постоянного роста объёмов слабо структурированного и неструктурированного текста в электронном формате. Извлечённая информация может быть использована для улучшения многих процессов: автоматическое тегирование, оптимизация поиска по контенту, построение облаков слов и навигации; кроме того, для создания черновых версий словарей, тезаурусов и даже базы для экспертных систем.
Ключевые слова: обработка естественного языка, термин, лемма, семантическая связь, статистическая обработка, машинное обучение, word2vec
.