Организация быстрого поиска без индекса

А. А. Пономаренко

?

Организация быстрого поиска без индекса

С. 194–200.

Классическим подходом к организации информации для последующего быстрого поиска является построение индекса. Однако этот подход имеет несколько недостатков. Индекс необходимо перестраивать и поддерживать в актуальном виде, что затруднительно в случае разрозненной информации, такой как текстовая информация в WEB. Эти недостатки являются следствием того, что индекс является реорганизованной копией индексируемой информации. В данной работе предлагается способ организации информации, для последующего быстрого поиска, в структуру данных без дублирования.

Язык: русский

Полный текст

Текст на другом сайте

Ключевые слова: информационный поиск распределенные сетевые структуры самоорганизующиеся распределенные системы алгоритмы теории графов структуры данных поиск ближайшего соседа

В книге

Труды 38-й конференции "Информационные технологии и системы - 2014"

Н. Новгород: ИППИ РАН, 2014.

Three Algorithms for Merging Hierarchical Navigable Small World Graphs

Пономаренко А. А., / Series Computer Science "arxiv.org". 2025.

Добавлено: 30 июля 2026 г.

Cognitive load measurement during navigation and information retrieval in digital text

Леднева Т. С., Kovalev A., Procedia Computer Science 2021 Vol. 192 P. 2720–2730

Добавлено: 27 апреля 2023 г.

Optimal monomial quadratization for ODE systems: extended abstract

Бычков А., Погудин Г. А., ACM Communications in Computer Algebra 2021 Vol. 54 No. 3 P. 119–123

Transformation of a polynomial ODE system to a special quadratic form has been successfully used recently as a preprocessing step for model order reduction methods. However, to the best of our knowledge, there has been no practical algorithm for performing this step automatically with any optimality guarantees. We present an algorithm that, given a system of ...

Добавлено: 19 октября 2021 г.

Подходы к организации поискового дерева решений в методе ветвей и границ для асимметричной задачи коммивояжера

Фомичев М. И., Ульянов М. В., Информационные технологии 2018 Т. 24 № 11 С. 698–704

Повышение временной эффективности программных реализаций метода ветвей и границ для асимметричной задачи коммивояжера может быть достигнуто как за счет выбора наиболее приемлемой структуры данных, обеспечивающей эффективные по времени операции с листьями поискового дерева решений, так и за счет использования дополнительной памяти для хранения усеченных матриц в листьях поискового дерева решений. Дополнительно могут быть предложены и ...

Добавлено: 26 января 2020 г.

Proceedings of the 27th ACM International Conference on Information and Knowledge Management

Association for Computing Machinery (ACM), 2018.

Добавлено: 27 декабря 2019 г.

АНАЛИЗ ПРОИЗВОДИТЕЛЬНОСТИ СТРАТЕГИЙ СИНХРОНИЗАЦИИ ПОТОКОВ В СТРУКТУРАХ ДАННЫХ, ОСНОВАННЫХ НА FLAT-COMBINING

Галимуллин М. Ф., Калишенко Е. Л., Рапоткин Н. А., Известия Санкт-Петербургского государственного электротехнического университета ЛЭТИ 2016 № 7 С. 13–23

Рассматриваются некоторые сценарии использования конкурентных структур данных, показывающие повышение производительности при увеличении времени работы одного потока, которому остальные потоки делегируют свои задачи. Данный подход получил название flat-combining (FC) [1]. Представлены несколько разработанных стратегий синхронизации, описаны их преимущества и область применения. ...

Добавлено: 1 ноября 2018 г.

Hybrid neural network and bi-criteria tabu-machine: comparison of new approaches to maximum clique problem

Бабкина Т. С., Демидовский А. В., Бабкин Э. А., International Journal of Big Data Intelligence 2018 Vol. 5 No. 3 P. 143–155

В этой работе представлены два новых подхода к решению классической NP-трудной задачи по поиску максимальной клики. Эта задача, которая часто возникает в области управления информацией, включая проектирование структур баз данных и обработку больших объемов данных. В нашем исследовании мы фокусируемся на решении этой задачи с использованием парадигмы искусственных нейронных сетей. Первый подход объединяет парадигму искусственных нейро-сетей и ...

Добавлено: 3 октября 2018 г.

Texterra: инфраструктура для анализа текстов

Денис Турдаков, Астраханцев Н. А., Недумов Я. Р. и др., Труды Института системного программирования РАН 2014 Т. 26 С. 421–438

В статье описан проект Texterra, в рамках которого была создана инфраструктура для анализа текстов. Texterra предоставляет масштабируемое решение для быстрой обработки текстовых документов, основанное на использовании знаний, извлекаемых из Веб-ресурсов и текстовых документов. В данной статье раскрываются детали реализации проекта, варианты использования и результаты экспериментальных исследований разработанных инструментов. ...

Добавлено: 6 ноября 2017 г.

A Model of Optimal Network Structure for Decentralized Nearest Neighbor Search

Пономаренко А. А., Irina Utkina, Mikhail Batsyn, , in: Computational Aspects and Applications in Large-Scale Networks. Springer Proceedings in Mathematics & StatisticsVol. 247.: Springer, 2018. P. 197–203.

Добавлено: 18 октября 2017 г.

9th Russian Summer School in Information Retrieval (RuSSIR 2015)

Браславский П., Markov I., Пардалос П. О. и др., ACM SIGIR Forum 2016 Vol. 49 No. 2 P. 72–79

В статье приведен отчет о проведении 9-ой Российской летней школы по информационному поиску 9th Russian Summer School in Information Retrieval (RuSSIR 2015). ...

Добавлено: 27 февраля 2017 г.

Alexander Kotov, Elena Treshcheva, Leonid Bessonov, Dmitry I. Ignatov, Yana Volkovich, Maria Eskevich, Pavel Braslavski: 10th Russian Summer School in Information Retrieval (RuSSIR 2016)

Kotov A., Treshcheva E., Bessonov L. и др., SIGIR Forum (ACM Special Interest Group on Information Retrieval) 2016 Vol. 50 No. 2 P. 28–35

Статья является отчетом о проведенной 10-й Российской летней школе по информационному поиску (10th Russian Summer School in Information Retrieval (RuSSIR 2016) ) ...

Добавлено: 27 февраля 2017 г.

A Searching Tool for Russian Error-Annotated Learner English Corpus

Феногенова А. С., Кузьменко Е. А., / NRU HSE. Series WP BRP "Linguistics". 2016.

Добавлено: 14 декабря 2016 г.

Resource characteristics of ways to organize a decision tree in the branch-andboundmethod for the traveling salesmen problem

Ulyanov M.V., Fomichev M.I., Business Informatics 2015 No. 4 (34) P. 38–46

Добавлено: 5 ноября 2016 г.

СРАВНИТЕЛЬНЫЙ АНАЛИЗ СТРУКТУР ДАННЫХ ДЛЯ ПРИБЛИЖЕННОГО ПОИСКА БЛИЖАЙШЕГО СОСЕДА

Пономаренко А. А., Аврелин Н. С., Найдан Б. С. и др., Алгоритмы, методы и системы обработки данных 2015 Т. 4 № 33 С. 91–106

Поиск по похожести широко применяется в различных областях компьютерных наук. Множество методов было предложено для решения задачи в точной постановке, однако все они подвержены "проклятью" размерности и не эффективны для данных высокой размерности. Приближенные алгоритмы отчасти позволяют справиться с "проклятьем". Однако из-за сложной стохастической природы, теоретические оценки для большинства приближенных алгоритмов отсутствуют. Более того, на ...

Добавлено: 27 сентября 2016 г.

Query-Based Improvement Procedure and Self-Adaptive Graph Construction Algorithm for Approximate Nearest Neighbor Search

Пономаренко А. А., Lecture Notes in Computer Science 2015 P. 314–319

Добавлено: 9 октября 2015 г.

Технологии разработки информационных систем: сборник статей международной научно-практической конференции

Таганрог: Издательство ЮФУ, 2015.

Сборник составлен по материалам VI Международной научно-практической конференции "Технологии разработки информационных систем", состоявшейся 6-12 сентабря 2015 г. в г. Геленджик. Ответственность за аутентичность и точность цитат, имен, названий и иных сведений несут авторы публикуемых материалов. Материалы публикуются в авторской редакции. Мероприятие проведено при финансовой поддержке Российского фонда фундаментальных исследований (грант № 15-07-20559-г). ...

Добавлено: 13 сентября 2015 г.

8th Russian Summer School in Information Retrieval (RuSSIR 2014)

Braslavski P., Karpov Nikolay, Worring M. и др., ACM SIGIR Forum 2014 Vol. 48 No. 2 P. 105–110

Статья содержит отчет по проведении 8-й Российской летней школы по информационному поиску (The 8th Russian Summer School in Information Retrieval (RuSSIR 2014)). ...

Добавлено: 22 августа 2015 г.

Критерий MRMR и уменьшение размерности пространства признаков в задаче классификации спама поисковой системы

Белов А. В., Карбачинский И. О., Качество. Инновации. Образование 2014 № 6 С. 24–32

Веб спам является одной из ключевых проблем современных поисковых систем в интернете. В данной работе мы исследуем эффективность применения различных методов уменьшения размерности пространства на примере спам классификатора поисковой системы go.mail.ru. Эффективное применение подобных методов позволяет значительно увеличить количество признаков и качество самого классификатора без потери в скорости обучения и классификации. Был проведен ряд экспериментов ...

Добавлено: 2 февраля 2015 г.

The Inverted Multi-Index

Babenko A., IEEE Transactions on Pattern Analysis and Machine Intelligence 2014 Vol. PP No. 99 P. 1

A new data structure for efficient similarity search in very large datasets of high-dimensional vectors is introduced. This structure called the inverted multi-index generalizes the inverted index idea by replacing the standard quantization within inverted indices with product quantization. For very similar retrieval complexity and pre-processing time, inverted multi-indices achieve a much denser subdivision of ...

Добавлено: 19 декабря 2014 г.

Организация поиска нотных записей

Корухова Ю. С., Мытрова М. В., Открытые системы. СУБД 2013 № 7 С. 57–58

Большинство поисковых систем ищут нотные записи музыкальных произведений по названию и автору композиции, однако исходными данными может служить фрагмент нотной записи либо аудиозапись. В работе рассматривается задача поиска нотных записей по содержимому. ...

Добавлено: 15 ноября 2014 г.