Инженерный вестник Дона

Реализация алгоритма LSH средствами Pl/PgSQL
- Плотникова Н.П.
- Кевбрин В.А.
- Аннотация
- pdf
Нашу жизнь пронизывают данные, бесконечные потоки информации проходят через компьютерные системы. Сегодня нельзя представить современное программное обеспечение без взаимодействия с базами данных. Существует много различных СУБД в зависимости от цели использования информации. В статье рассматривается алгоритм Locality-sensitive hashing (LSH) на основе языка Pl/PgSQL, который позволяет искать похожие документы в базе.

Ключевые слова: LSH, хэширование, поле, строка, текстовые данные, запрос, программное обеспечение, SQL

2.3.1 - Системный анализ, управление и обработка информации
Оптимизация процесса дедупликации на основе баз данных
- Плотникова Н.П.
- Кевбрин В.А.
- Аннотация
- pdf
Нельзя представить настоящее время без программного обеспечения. Огромные потоки информации проходят через компьютерные вычислительные системы. Совершенно невозможно обработать неструктурированные бесконечно поступающие данные, поэтому необходимо выделять конкретные задачи и подготавливать информацию к обработке. Одним из подобных действий является дедупликация. В данной статье рассматриваются возможные оптимизации метода удаления дубликатов с использованием баз данных.

Ключевые слова: дедупликация, база данных, поле, строка, текстовые данные, запрос, программное обеспечение, неструктурированные данные

2.3.1 - Системный анализ, управление и обработка информации
Применение иерархической кластеризации DIANA для улучшения качества классификации текста
- Аннотация
- pdf
В статье представлены способы повышения точности классификации нормативно-справочной информации при помощи алгоритмов иерархической кластеризации.

Ключевые слова: машинное обучение, искусственная нейронная сеть, сверточная нейронная сеть, нормативно-справочная информация, иерархическая кластеризация, DIANA

2.3.1 - Системный анализ, управление и обработка информации
Дедупликация больших объемов данных при помощи баз данных
- Аннотация
- pdf
На сегодняшний день огромное количество разнородной информации проходит через электронные вычислительные системы. Возникает критическая необходимость в анализе нескончаемого потока данных ограниченными средствами, а это в свою очередь требует структурирования информации. Одним из этапов решения задачи упорядочивания данных является дедупликация. В данной статье рассматривается метод удаления дубликатов с использованием баз данных, анализируются результаты тестирования работы с различными типами систем управления баз данных с разными наборами параметров.

Ключевые слова: дедупликация, база данных, поле, строка, текстовые данные, искусственная нейронная сеть, множества, запрос, программное обеспечение, неструктурированные данные

2.3.1 - Системный анализ, управление и обработка информации
Применение дерева отрезков в PostgreSQL
- Мартынов В.А.
- Плотникова Н.П.
- Аннотация
- pdf
В статье рассматривается подход к решению задачи оптимизации скорости агрегирующих запросов к непрерывному диапазону строк таблицы базы данных PostgreSQL. Создан программный модуль на базе расширения PostgreSQL Extensions, обеспечивающий построение дерева отрезков для таблицы и запросов к нему. Достигнуто увеличение скорости запросов более чем в 80 раз для таблицы размером 100 миллионов записей по сравнению с существующими решениями.

Ключевые слова: PostgreSQL, дерево отрезков, запрос, агрегация, оптимизация, PosgreSQL Extensions, асимптотика, индекс

1.2.2 - Математическое моделирование, численные методы и комплексы программ , 2.3.1 - Системный анализ, управление и обработка информации
Оценка воздействия строительного производства на окружающую среду
- Кондратенко Т.О.
- Сайбель А.В.
- Аннотация
- doc
Строительное производство связано с возникновением ряда негативных воздействий на окружающую среду. В статье рассмотрены основные виды строительных работ, сопровождающиеся основныи нагрузками на экологию. Особое внимание уделено проблеме строительного мусора, вариантам решения проблемы со свалкой. Варианты решения вопроса утилизации строительного мусора - сортировка, переработка. Экономические аспекты решения проблемы с утилизацией строительного мусора: эконолмия материалов, снижение количества отходов.

Ключевые слова: окружающая среда, негативное воздействие, строительное производство, утилизация, строительный мусор, переработка материалов

08.00.05 - Экономика и управление народным хозяйством (по отраслям и сферам деятельности)

27.06.2025

Положение о защите персональных данных авторов статей журнала ИВД

Положение о защите, хранении, обработке и передаче персональных данных авторов статей, представляемых для публикации в сетевое издание Ростовского отделения общероссийской общественной организации...

Подробнее...

26.06.2025

Вручение дипломов вновь избранным действительным членам (академикам) и членам-корреспондентам Российской инженерной академии

25 июня 2025 года в Москве в зале Президиума Российской инженерной академии состоялось вручение дипломов вновь избранным действительным членам (академикам) и членам-корреспондентам Академии. В...

Подробнее...

24.06.2025

Собрание Общероссийской общественной организации «Российская инженерная академия»

21 мая 2025 года в Москве в Российском государственном университете имени А.Н. Косыгина (Технологии. Дизайн. Искусство) состоялось Собрание (Конференция) Общероссийской общественной организации...

Подробнее...

25.05.2025

Всероссийская конференция «Информационные технологии в промышленности 2025»

Всероссийская конференция «Информационные технологии в промышленности 2025» состоится 15 августа 2025 г. в Москве. Всероссийская конференция «Информационные технологии в промышленности 2025»...

Подробнее...

25.05.2025

Международная научная конференция «Современные методы, проблемы и приложения теории операторов и гармонического анализа - 2025"

Международная научная конференция «Современные методы, проблемы и приложения теории операторов и гармонического анализа - 2025" (OTHA-2025)» пройдет в Ростове-на-Дону с 24 по 29 августа 2025.

Подробнее...

25.05.2025

HoReCa PRO Business 2025 - международный форум индустрии гостеприимства

HoReCa PRO Business 2025 - международный форум индустрии гостеприимства пройдет 21 августа 2025 г. в Санкт-Петербурге.

Подробнее...

Реализация алгоритма LSH средствами Pl/PgSQL

Оптимизация процесса дедупликации на основе баз данных

Применение иерархической кластеризации DIANA для улучшения качества классификации текста

Дедупликация больших объемов данных при помощи баз данных

Применение дерева отрезков в PostgreSQL

Оценка воздействия строительного производства на окружающую среду

Новости

Архив новостей