Анализ изображений математических и химических формул из патентных документов
Аннотация
Дата поступления статьи: 03.11.2023В настоящее время в патентных документах содержатся графические изображения чертежей устройств, графиков, химических и математических формул, причем формулы зачастую необходимо распознать и привести к унифицированному стандарту. В данной работе осуществляется анализ графических изображений, извлеченных из описаний патентов ФИПС Роспатента. Обеспечивается тематическая фильтрация математических и химических формул, содержащихся в патентных документах, и их распознавание. Теоретическая ценность заключается в разработанных алгоритмах парсинга патентов в системе Яндекс.Патенты; распознавания среди графических патентных изображений химических и математических формул; перевода графических изображений химических формул в формат SMILES; конвертации графических изображений математических формул в формат LaTeX. Практическая значимость работы заключается в разработанном программном модуле анализа графических изображений из патентных документов. Область применения разработанной системы — исследование патентов и приведение графических изображений к унифицированному стандарту для решения задач патентного поиска.
Ключевые слова: патент, изображение, математическая формула, химическая формула, LaTeX, SMILES
.