ivdon3@bk.ru
В данной работе представлен обзор задачи автоматического реферирования текстов. Проведена классификация алгоритмов автоматического реферирования текстов по типу получаемого реферата и по подходу к решению задачи. Описаны некоторые существующие проблемы в области автоматического реферирования текстов и недостатки отдельных классов алгоритмов. Определены понятия качества и информационной полноты реферата. Рассмотрены наиболее популярные подходы к оценке информационной полноты реферата и их классификация в соответствии с используемой методологией. Рассмотрены метрики семейства ROUGE применительно к задаче автоматического реферирования текстов. Отдельное внимание уделено оценке информационной полноты реферата с использованием таких метрик информационной близости, как расстояние Кульбака-Лейблера, расстояние Дженсена-Шеннона и косинусное расстояние (сходство).
Ключевые слова: автоматическое реферирование, реферат, информационная полнота, ROUGE, векторизация, TF IDF, статическая модель векторизации, расстояние Кульбака-Лейблера, расстояние Дженсена-Шеннона, косинусное расстояние
Рассматривается вопрос использования экрана коллиматорной системы самолета как средства вывода подсказки пилоту о вертикальном профиле траектории полета в условиях плохой видимости на малой и предельно малой высотах пилотирования.
Ключевые слова: малая высота полета, предельно малая высота полета, угроза столкновения, коллиматор, виртуальная карта высот, виртуальная реальность, дополненная реальность, искусственный интеллект, комплексирование информации, система помощи пилоту
Рассматриваются исторические аспекты возникновения задачи помехоустойчивого кодирования изображений на примере доставки фотографий поверхности Марса на Землю. На примере обобщения ортогональных матриц квазиортогональными показывается расширение представительства матриц для использования в преобразовании изображений для передачи в каналах связи с помехами.
Ключевые слова: матрицы Адамара, адамарово кодирование, коды Рида-Соломона, ортогональные матрицы, квазиортогональные матрицы, помехоустойчивое кодирование изображений
В данной статье проводится анализ и обзор современных методов и технологий, используемых в системах антиплагиата, с акцентом на российский рынок. Целью рассмотрения всего вышеперечисленного является выбор подходящей для интеграции системы антиплагиата. В статье представлены наиболее популярные российские сервисы для детекции заимствований, их бизнес-модели, алгоритмы работы, а также представлено общее описание принципов и механизмов, лежащих в основе этих алгоритмов. Было определено, что наиболее универсальной и эффективной системой поиска заимствований является сервис Antiplagiat.ru, так как в нем присутствует возможность интеграции через API, а также 34 дополнительных модуля, предоставляющих возможность адаптировать функционал системы под индивидуальные потребности.
Ключевые слова: антиплагиат, анализ текста, алгоритмы обработки текста, семантический анализ, стилистический анализ
В данной статье рассматриваются основные принципы и шаблоны проектирования приложения для сбора данных из сторонних источников. Проведено исследование различных способов получения данных, включая веб-скрапинг, использование API и парсинг файлов. Также описываются различные подходы к извлечению информации из структурированных и неструктурированных источников.
Ключевые слова: интернет-источники, API, парсинг, web, веб, безголовый браузер, скрапинг, etag, сбор данных
2.3.1 - Системный анализ, управление и обработка информации , 2.3.3 - Автоматизация и управление технологическими процессами и производствами
Оценка качества дорожного покрытия – одна из самых актуальных задач в мире. Для ее решения существует множество систем, которые в основном взаимодействуют с изображениями дорожного полотна. Они работают на основе как традиционных методов (не используется машинное обучение), так и на алгоритмах машинного обучения. Традиционные подходы, например, включают методы выделения контуров на изображениях, которые являются объектом данного исследования. Однако каждый из алгоритмов обладает определенными особенностями. Например, некоторые из них позволяют быстрее получить обработанную версию оригинальной фотографии. В качестве методов для анализа выбраны: «Алгоритм Кэнни» «Оператор Кирша», «Оператор Лапласа», «Алгоритм Марра-Хилдрета», «Оператор Прюитта» и «Оператор Собеля». Основным показателем эффективности в исследовании является среднее время получения обработанной фотографии. Исходный материал эксперимента - 10 различных изображений дорожного покрытия 5 размеров (1000x1000, 894x894, 775x775, 632x632, 447x447) в форматах bmp, jpg, png. В ходе исследования установлено, что «Оператор Кирша», «Оператор Лапласа» и «Оператор Прюитта» и «Оператор Собеля» имеют линейную зависимость O(n), «Алгоритм Кэнни» и «Алгоритм Марра-Хилдрета» обладают квадратичным характером O(n2). Наилучшие результаты демонстрируют «Оператор Прюитта» и «Оператор Собеля».
Ключевые слова: сравнение, эффективность, метод, выделение контуров, изображение, фото, дорожная поверхность, зависимость, размер, формат
2.1.8 - Проектирование и строительство дорог, метрополитенов, аэродромов, мостов и транспортных тоннелей , 2.3.1 - Системный анализ, управление и обработка информации
Во всех каналах передачи данных возникают непреднамеренных ошибки. Стандартным способом борьбы с ними является использование помехоустойчивых кодеков, основанных на применении алгебраических кодов исправления ошибок. Существуют каналы передачи, в которых возникает особый вид ошибок – стирания, т.е. разновидность ошибки, при которой известно местоположение ошибки, но не известна ее величина. В теории кодирования утверждается, что методы борьбы с ошибками могут быть применены для защиты данных от стираний, однако, эти утверждения не сопровождаются подробностями. Данная работа восполняет этот пробел. Построены алгоритмы исправления стираний с помощью произвольных декодеров для кодов, корректирующих ошибки. Сформулированы леммы о корректности построенных алгоритмов, получены некоторые оценки вероятности успешного декодирования.
Ключевые слова: каналы со стираниями, помехоустойчивый код, алгебраический код, декодер кода исправления ошибок, алгоритм исправления стираний
Рассматривается проблема уязвимостей в операционной системе Robot Operating System (ROS) при реализации мультиагентной системы на базе робота Turtlebot3. ROS предоставляет мощные инструменты для коммуникации и обмена данными между различными компонентами системы. Однако, при обмене данными между роботами Turtlebot3 могут возникать уязвимости, которые могут быть использованы злоумышленниками для несанкционированного доступа или атак на систему. Одной из возможных уязвимостей является перехват и подмена данных между роботами. Злоумышленник может перехватить данные, изменить их и повторно отправить, что может привести к непредсказуемым последствиям. Другой возможной уязвимостью является несанкционированный доступ к командам и управлению роботами Turtlebot3, что может привести к потере контроля над системой. Для решения данных уязвимостей разработаны и представлены методы защиты от возможных угроз безопасности, возникающих в ходе эксплуатации указанных систем.
Ключевые слова: роботизированная операционная система (ROS), мультиагентная система, системные пакеты, шифрование, SSH, TLS, система аутентификации и авторизации, канал связи, ограничение доступа, анализ угроз
2.3.1 - Системный анализ, управление и обработка информации , 2.3.6 - Методы и системы защиты информации, информационная безопасность
В статье рассматривается авторская методика проектирования и разработки инструмента генерации тестовых данных под названием «QA Data Source», которые в последующем могут быть использованы при проведении тестирования программного обеспечения. В работе описываются основные требования, функциональность приложения, модель данных, а также примеры использования. При описании приложения использовались методы системного анализа и моделирования информационных процессов. В результате применения предложенной модели реализации информационных процессов можно многократно сократить время и ресурсы на генерацию тестовых данных и последующего тестирования продукта.
Ключевые слова: обеспечение качества, тестирование ПО, тестовые данные, информационные технологии, генерация данных, базы данных, разработка приложений
Работа посвящена проблематике обеспечения электрической энергией удаленных производственных предприятий при отсутствии централизованного энергоснабжения. Целью работы является развитие инструментария поддержки принятия решений при выборе проектов автономнойэлектрогенерации из большого числа возможных альтернатив. Для достижения этой цели построена иерархия критериев и проведен сравнительный анализ существующих технико-экономических решений в области малой автономной энергетики. Показано, что при выборе проекта электрогенерации для конкретного предприятия имеется достаточно большое число альтернатив, что делает неэффективным применение обычно используемых процедур поддержки принятия решений на основе метода анализа иерархий/метода аналитических сетей (в классическом варианте). Предложена итерационная процедура с динамическим изменением обратных связей между критериями и альтернативами, позволяющая в процессе вычислений снизить размерность суперматрицы и, тем самым, уменьшить временную сложность алгоритмов. Эффективность предложенной модификации метода аналитических сетей подтверждена проведенными расчетами. Построенная процедура выбора проекта автономной электрогенерации позволяет повысить уровень научной обоснованности технико-экономических решений при расширении производственной деятельности малых предприятий на удаленных и малонаселенных территориях.
Ключевые слова: автономная энергосистема, поддержка принятия решений, метод аналитических сетей
2.3.1 - Системный анализ, управление и обработка информации , 2.4.2 - Электротехнические комплексы и системы
Среди обширного круга задач, которые стоят перед современными передовыми системами видеонаблюдения, доминирующее положение занимает задача трассировки различных объектов в видеопотоке, которая является одной из фундаментальных проблем в области видеоаналитики. Многочисленные исследования показали, что, несмотря на динамичность процессов в области информационных технологий и внедрение различных средств и методов, задача сопровождения объектов до сих пор остается актуальной и требует дальнейшего усовершенствования разработанных ранее алгоритмов с целью устранения некоторых, присущих данным алгоритмам недостатков, систематизации приемов и методов и разработки новейших систем и подходов. Представленная статья посвящена описанию процесса пошаговой разработки алгоритма отслеживания перемещений человека в видеопотоке на основе анализа цветовых групп. Ключевыми этапами работы данного алгоритма являются: отбор определенных кадров при разделении видеопотока, выбор исследуемого объекта, который в дальнейшем подвергается процедуре цифровой обработки, основой которой является получение информации о цветовых группах, их средних значений и процентов их заполняемости относительно исследуемого объекта. Данная информация применяется для процедуры поиска, обнаружения и распознавания выбранного объекта с дополнительной функцией прогнозирования направления движения на видеокадрах, результатом которой является формирование всей картины перемещения исследуемого человека. Материалы, изложенные в настоящей работе, могут представлять интерес для специалистов, в чьих исследованиях центральное место занимают вопросы, связанные с автоматизированным получением определенных данных при анализе различных изображений и видео.
Ключевые слова: камеры наблюдения, нейронная сеть u2 – net, библиотека rembg, распознавание образов, распознавание одежды, дельта E, трассировка, прогнозирование направления движения, обнаружение объектов, трекинг, математическая статистика, прогнозируемая область
В настоящее время в патентных документах содержатся графические изображения чертежей устройств, графиков, химических и математических формул, причем формулы зачастую необходимо распознать и привести к унифицированному стандарту. В данной работе осуществляется анализ графических изображений, извлеченных из описаний патентов ФИПС Роспатента. Обеспечивается тематическая фильтрация математических и химических формул, содержащихся в патентных документах, и их распознавание. Теоретическая ценность заключается в разработанных алгоритмах парсинга патентов в системе Яндекс.Патенты; распознавания среди графических патентных изображений химических и математических формул; перевода графических изображений химических формул в формат SMILES; конвертации графических изображений математических формул в формат LaTeX. Практическая значимость работы заключается в разработанном программном модуле анализа графических изображений из патентных документов. Область применения разработанной системы — исследование патентов и приведение графических изображений к унифицированному стандарту для решения задач патентного поиска.
Ключевые слова: патент, изображение, математическая формула, химическая формула, LaTeX, SMILES
В статье рассматривается применение рекуррентной нейронной сети в задаче прогнозирования загрязняющих веществ в воздухе на основе фактических данных в виде временного ряда. Приводится описание архитектуры сети, применяемый метод обучения и способ формирования обучающих и проверочных данных. При обучении использовался набор данных, состоящий из 126 измерений различных компонент. В результате была проведена оценка качества выводов полученной модели и были вычислены усредненные коэффициенты метрики MSE.
Ключевые слова: загрязнения воздуха, прогнозирование, нейронные сети, машинное обучение, рекуррентная сеть, анализ временных рядов
2.1.10 - Экологическая безопасность строительства и городского хозяйства , 2.3.1 - Системный анализ, управление и обработка информации
В работе анализируются различные подходы к выделению и распознаванию номерной пластины в интеллектуальных транспортных сетях. Была предложена модель глубокого обучения для локализации и распознавания номерных знаков на естественных изображениях, которая позволяет достичь удовлетворительных результатов с точки зрения точности и скорости распознавания по сравнению с традиционными. Приводятся оценки эффективности модели глубокого обучения.
Ключевые слова: VANET, интеллектуальные транспортные сети, YOLO, система управления городским движением, стеганография, deep learning, глубокое обучение, защита информации, convolutional neural network, CNN
В работе приведены аспекты разработки устройства для беспроводного съема сигнала виброускорения с поверхности барабана шаровой мельницы. Приведены результаты измерения виброускорения для макета шаровой мельницы для различных уровней загрузки измельчаемым материалом. Согласно данных результатов с увеличением загрузки измельчаемыми материалами относительно шаровой уровень вибрации понижается. Также в работе приведены полученные круговые диаграммы распределения вибрационной нагрузки по барабану мельницы, по которым можно судить о ее текущем режиме функционирования.
Ключевые слова: шаровая мельница, беспроводной съем сигнала, виброускорение, контроль загрузки мельницы
2.3.1 - Системный анализ, управление и обработка информации , 2.3.3 - Автоматизация и управление технологическими процессами и производствами
В статье представлена теоретико-множественная модель, обобщающая понятие системы мониторинга. Модель представляет собой кортеж, включающий объект мониторинга, инфраструктуру системы мониторинга, исходные данные и результаты мониторинга и множество отношений между компонентами модели. Она может быть использована для создания новых или модификации уже действующих систем мониторинга.
Ключевые слова: система мониторинга, объект мониторинга, теоретико-множественная модель, кортеж, обработка данных, инфраструктура, датчик, программное обеспечение
1.2.2 - Математическое моделирование, численные методы и комплексы программ , 2.3.1 - Системный анализ, управление и обработка информации
В данной работе рассматриваются проблемы оптимизации загрузки клиентских веб-приложений и способы их решения с учетом различных практических условий. Приводятся способы ускорения загрузки веб-приложений и устранения блокирующих элементов в цепях обработки данных с целью улучшения различных аспектов пользовательского опыта. Предлагается подход, который позволяет спроектировать оптимальную цепь загрузки приложения, отвечающую высшим стандартам качества в front end индустрии и обеспечивающую наилучший опыт использования.
Ключевые слова: front end, рендеринг, клиентские веб-приложения, время загрузки, оптимизация производительности, пользовательский опыт
В данной работе проводится анализ эффективности механизма Tree-Shaking, который является ключевым способом оптимизации размера клиентских веб-приложений. Сравнивается его реализация в пяти популярных инструментах для сборки проектов: Webpack, Rollup, Parcel, Vite и Esbuild. Результаты тестирования демонстрируют различия в их поведении и общей эффективности при удалении избыточного кода, подчеркивая актуальность применения Tree-Shaking в веб-разработке.
Ключевые слова: tree-shaking, javascript, front end, веб-приложения, оптимизация, скорость загрузки
В работе рассматривается стегоалгоритм с локализацией области встраивания в цветовом пространстве YCbCr для защиты изображений номерной пластины, транспортного средства с разных ракурсов, дорожного события, а также вопросы разработки программной системы, реализующей стегоалгоритм. Защита изображений позволяет эффективно реализовать концепцию многомодального взаимодействия социокиберфизических систем в автомобильной самоорганизующейся сети. Приводятся оценки эффективности разработанного метода.
Ключевые слова: VANET, интеллектуальные транспортные сети, система управления городским движением, стеганография, защита информации, водяной знак
2.3.1 - Системный анализ, управление и обработка информации , 2.3.6 - Методы и системы защиты информации, информационная безопасность
В статье рассматриваются методы защиты логических элементов комбинационных схем от одиночных отказов. До недавнего времени проблема создания микроэлектронных устройств, устойчивых к единичным отказам в логических элементах, была актуальна преимущественно в военной и космической промышленности. В этих областях предъявляются повышенные требования к отказоустойчивости схем из-за воздействия внешних дестабилизирующих факторов. Такими факторами могут быть тяжелые заряженные частицы, влияющие на работу логических элементов и вызывающие их единичные отказы. В связи с масштабированием полупроводниковых устройств меняются технологические стандарты проектирования и изготовления интегральных схем, и проблема отказоустойчивости становится актуальной и для устройств гражданского рынка. В статье предложена методика ресинтеза уязвимых участков логических комбинационных схем. Для оценки устойчивости предлагается использовать логические ограничения, полученные методом резолюций.
Ключевые слова: ресинтез, комбинационные схемы, надежность, логические корреляции, метод резолюций
Статья детально исследует облачные, туманные и граничные вычисления, выявляя уникальные черты каждой технологии. Облачные вычисления обеспечивают гибкость и надежность с возможностью удаленного доступа, однако сталкиваются с задержками и высокой стоимостью. Туманные вычисления фокусируются на обработке данных на низком уровне инфраструктуры, обеспечивая высокую скорость и минимальные задержки. Граничные вычисления перемещают вычисления к самому источнику данных, исключая задержки и улучшая безопасность. Анализируются применения этих технологий в различных сферах, предсказывается их будущее развитие в быстро меняющемся мире информационных систем.
Ключевые слова: облачные вычисления, туманные вычисления, граничные вычисления, облачные технологии, инфраструктура обработки данных, сфера применения, гибридные вычисления, интернет вещей, искусственный интеллект, развитие информационных систем
В данной статье рассматривается проблема анализа и распознавания эмоций человека с помощью обработки звуковых данных. Ввиду увеличения сфер применения, что в большей степени вызвано сложной эпидемиологической ситуацией в мире, решение описанной задачи является актуальным вопросом. Описаны основные этапы: аудиопоток данных записывается в аудиофайл и в соответствии с подходом «дактилоскопии звука» преобразуется в изображение, являющееся спектрограммой звукового набора данных. Описаны этапы обучения сверточной нейронной сети на заранее заготовленном наборе звуковых данных, а также описана структура алгоритма. Для валидации нейронной сети был отобран иной, не участвующий в тренировке, набор аудиоданных. В результате проведения исследования, были построены графики, демонстрирующие точность работы предлагаемого метода.
Ключевые слова: нейронная сеть; распознавание эмоций человека; сверточная нейронная сеть; дактилоскопия звука; Tenserflow; Keras; Matlab; Deep Network Toolbox
В работе представлено решение проблемы ускорения процесса визуализации результатов численного моделирования. Объемы таких данных могут быть весьма велики и разработка средств, позволяющих ускорить процесс анализа результатов моделирования является актуальной задачей. В данной статье предложено решение задачи, основанное на разработке комплекса программ, автоматизирующих процесс обработки однотипных научных данных большого объема для создания высококачественной визуализации результатов численного моделирования. Результаты приведены на примере решения задач астрофизики, но предложенная методика может быть достаточно легко применена и к другим предметным областям, в которых используются модели основанные на динамике системы частиц.
Ключевые слова: визуализация данных, триангуляция Делоне, ускорение визуализации, ParaView, NVIDIA IndeX, VTK
1.2.2 - Математическое моделирование, численные методы и комплексы программ , 2.3.1 - Системный анализ, управление и обработка информации
В настоящее время наблюдается рост количества научных работ по моделям, методам и программно-аппаратным средствам обработки и анализа изображений. Это связано с широким внедрением технологий компьютерного зрения в системы обработки информации и управления. При этом актуальны подходы, обеспечивающие быструю обработку изображений в реальном времени с использованием ограниченных вычислительных ресурсов. Такие подходы, как правило, базируются на низкоуровневых алгоритмах фильтрации изображений. Одной из задач, подлежащих решению в системах на основе компьютерного зрения, является локализация круглых объектов. Данные объекты обладают свойством радиальной симметрии. Поэтому для решения указанной задачи эффективен подход на основе быстрого преобразования радиальной симметрии, который рассматривается в данной работе. В статье описаны основные шаги базового преобразования, приведена процедура определения центров радиально-симметричных областей для локализации круглых объектов на изображениях, рассмотрены примеры ее применения.
Ключевые слова: компьютерное зрение, обработка изображений, анализ изображений, локализация объектов, методы локализации круглых объектов, быстрое преобразование радиальной симметрии, определение центров радиально-симметричных областей
1.2.2 - Математическое моделирование, численные методы и комплексы программ , 2.3.1 - Системный анализ, управление и обработка информации
Данное исследование посвящено анализу возможностей языка программирования Python при создании информационных систем обнаружения опасных предметов в багаже. В результате разработана архитектура системы распознавания, включающая следующие основные компоненты: модуль обработки изображений, модуль машинного обучения, базу данных и интерфейс пользователя. В качестве программного обеспечения выбран Python с библиотеками PySide6, SQLite, Numpy, YOLO. Проведена реализация и тестирование информационной системы на реальных данных, что подтвердило правильность выбранных возможностей и технологий языка Python для разработки информационных систем безопасности.
Ключевые слова: информационная система, безопасность, нейронная сеть, машинное обучение, распознавание образов, быстродействие
2.3.1 - Системный анализ, управление и обработка информации , 2.3.3 - Автоматизация и управление технологическими процессами и производствами