ivdon3@bk.ru
Нашу жизнь пронизывают данные, бесконечные потоки информации проходят через компьютерные системы. Сегодня нельзя представить современное программное обеспечение без взаимодействия с базами данных. Существует много различных СУБД в зависимости от цели использования информации. В статье рассматривается алгоритм Locality-sensitive hashing (LSH) на основе языка Pl/PgSQL, который позволяет искать похожие документы в базе.
Ключевые слова: LSH, хэширование, поле, строка, текстовые данные, запрос, программное обеспечение, SQL
Нельзя представить настоящее время без программного обеспечения. Огромные потоки информации проходят через компьютерные вычислительные системы. Совершенно невозможно обработать неструктурированные бесконечно поступающие данные, поэтому необходимо выделять конкретные задачи и подготавливать информацию к обработке. Одним из подобных действий является дедупликация. В данной статье рассматриваются возможные оптимизации метода удаления дубликатов с использованием баз данных.
Ключевые слова: дедупликация, база данных, поле, строка, текстовые данные, запрос, программное обеспечение, неструктурированные данные
В статье представлены способы повышения точности классификации нормативно-справочной информации при помощи алгоритмов иерархической кластеризации.
Ключевые слова: машинное обучение, искусственная нейронная сеть, сверточная нейронная сеть, нормативно-справочная информация, иерархическая кластеризация, DIANA
На сегодняшний день огромное количество разнородной информации проходит через электронные вычислительные системы. Возникает критическая необходимость в анализе нескончаемого потока данных ограниченными средствами, а это в свою очередь требует структурирования информации. Одним из этапов решения задачи упорядочивания данных является дедупликация. В данной статье рассматривается метод удаления дубликатов с использованием баз данных, анализируются результаты тестирования работы с различными типами систем управления баз данных с разными наборами параметров.
Ключевые слова: дедупликация, база данных, поле, строка, текстовые данные, искусственная нейронная сеть, множества, запрос, программное обеспечение, неструктурированные данные
В статье рассматривается подход к решению задачи оптимизации скорости агрегирующих запросов к непрерывному диапазону строк таблицы базы данных PostgreSQL. Создан программный модуль на базе расширения PostgreSQL Extensions, обеспечивающий построение дерева отрезков для таблицы и запросов к нему. Достигнуто увеличение скорости запросов более чем в 80 раз для таблицы размером 100 миллионов записей по сравнению с существующими решениями.
Ключевые слова: PostgreSQL, дерево отрезков, запрос, агрегация, оптимизация, PosgreSQL Extensions, асимптотика, индекс
1.2.2 - Математическое моделирование, численные методы и комплексы программ , 2.3.1 - Системный анализ, управление и обработка информации
Строительное производство связано с возникновением ряда негативных воздействий на окружающую среду. В статье рассмотрены основные виды строительных работ, сопровождающиеся основныи нагрузками на экологию. Особое внимание уделено проблеме строительного мусора, вариантам решения проблемы со свалкой. Варианты решения вопроса утилизации строительного мусора - сортировка, переработка. Экономические аспекты решения проблемы с утилизацией строительного мусора: эконолмия материалов, снижение количества отходов.
Ключевые слова: окружающая среда, негативное воздействие, строительное производство, утилизация, строительный мусор, переработка материалов
08.00.05 - Экономика и управление народным хозяйством (по отраслям и сферам деятельности)