?
Организация быстрого поиска без индекса
С. 194-200.
Классическим подходом к организации информации для последующего быстрого поиска является построение индекса. Однако этот подход имеет несколько недостатков. Индекс необходимо перестраивать и поддерживать в актуальном виде, что затруднительно в случае разрозненной информации, такой как текстовая информация в WEB. Эти недостатки являются следствием того, что индекс является реорганизованной копией индексируемой информации. В данной работе предлагается способ организации информации, для последующего быстрого поиска, в структуру данных без дублирования.
В книге
Н. Новгород : ИППИ РАН, 2014
Бабкина Т. С., Демидовский А. В., Бабкин Э. А., International Journal of Big Data Intelligence 2018 Vol. 5 No. 3 P. 143-155
В этой работе представлены два новых подхода к решению классической NP-трудной задачи по поиску максимальной клики. Эта задача, которая часто возникает в области управления информацией, включая проектирование структур баз данных и обработку больших объемов данных. В нашем исследовании мы фокусируемся на решении этой задачи с использованием парадигмы искусственных нейронных сетей. Первый подход объединяет парадигму искусственных нейро-сетей и ...
Добавлено: 3 октября 2018 г.
Babenko A., Lempitsky V., , in : Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR 2012). : Providence : IEEE, 2012. P. 3069-3076.
Добавлено: 1 октября 2014 г.
Kucherov G., Nekrich Y., Стариковская Т. А., , in : Lecture Notes in Computer Science. Vol. 7608: Proceedings of the 19th International Symposium on String Processing and Information Retrieval.: Berlin : Springer, 2012. P. 307-317.
We study the following three problems of computing generic or discriminating words for a given collection of documents. Given a pattern $P$ and a threshold $d$, we want to report (i) all longest extensions of $P$ which occur in at least $d$ documents, (ii) all shortest extensions of $P$ which occur in less than $d$ ...
Добавлено: 30 октября 2013 г.
M. : HSE, 2013
Doctoral students were invited to the Doctoral Consortium held in conjunction with the main conference of ECIR 2013. The Doctoral Consortium aimed to provide a constructive setting for presentations and discussions of doctoral students’ research projects with senior researchers and other participating students. The two main goals of the Doctoral Consortium were: 1) to advise ...
Добавлено: 27 октября 2013 г.
Пульманс Й., Игнатов Д. И., Виене С. и др., , in : Advances in Data Mining. Applications and Theoretical Aspects. 12th Industrial Conference, ICDM 2012, Berlin, Germany, July 13-20, 2012. Proceedings. Vol. 7377.: Berlin, Heidelberg : Springer, 2012. P. 273-287.
Formal Concept Analysis (FCA) is an unsupervised clustering technique and many scientific papers are devoted to applying FCA in Information Retrieval (IR) research. We collected 103 papers published between 2003-2009 which mention FCA and information retrieval in the abstract, title or keywords. Using a prototype of our FCA-based toolset CORDIET, we converted the pdf-files containing ...
Добавлено: 3 декабря 2012 г.
Vildhoj H. W., Стариковская Т. А., , in : Lecture Notes in Computer Science. Vol. 7922: Proceedings of the 24th Symposium on Combinatorial Pattern Matching.: Berlin : Springer, 2013. P. 223-234.
Lexicographically minimal and lexicographically maximal suffixes of a string are fundamental notions of stringology. It is well known that the lexicographically minimal and maximal suffixes of a given string $S$ can be computed in linear time and space by constructing a suffix tree or a suffix array of $S$. Here we consider the case when ...
Добавлено: 30 октября 2013 г.
Белов А. В., Карбачинский И. О., Качество. Инновации. Образование 2014 № 6 С. 24-32
Веб спам является одной из ключевых проблем современных поисковых систем в интернете. В данной работе мы исследуем эффективность применения различных методов уменьшения размерности пространства на примере спам классификатора поисковой системы go.mail.ru. Эффективное применение подобных методов позволяет значительно увеличить количество признаков и качество самого классификатора без потери в скорости обучения и классификации. Был проведен ряд экспериментов ...
Добавлено: 2 февраля 2015 г.
Berlin, Heidelberg : Springer, 2012
This book constitutes the refereed proceedings of the 12th Industrial Conference on Data Mining, ICDM 2012, held in Berlin, Germany in July 2012. The 22 revised full papers presented were carefully reviewed and selected from 97 submissions. The papers are organized in topical sections on data mining in medicine and biology; data mining for energy ...
Добавлено: 3 декабря 2012 г.
Баранов М. А., Вестник компьютерных и информационных технологий 2012 № 12 С. 43-47
В данной статье представлена концепция характеристического поиска, в основе которого лежат разделение характеристик объекта на основные и второстепенные и представление информации в иерархическом виде. Описаны основные функциональные возможности, которые должны быть реализованы в такой системе. Приводится описание разработанного прототипа системы поиска. ...
Добавлено: 4 марта 2013 г.
Aachen : CEUR Workshop Proceedings, 2013
Formal Concept Analysis (FCA) is a mathematically well-founded theory aimed at data analysis and classication, introduced and detailed in the book of Bernhard Ganter and Rudolf Wille, \Formal Concept Analysis", Springer 1999. The area came into being in the early 1980s and has since then spawned over 10000 scientic publications and a variety of practically ...
Добавлено: 10 октября 2013 г.
Ekaterinburg : CEUR Workshop Proceedings, 2014
АИСТ'2014 — Третья Международная Научная Конференция по Анализу Изображений, Сетей и Текстов.
УЧАСТНИКИ
исследователи, чьи научные интересы связаны с разработкой математических моделей, алгоритмов и инструментов анализа данных;
практики, которые в своей повседневной работе сталкиваются с задачами обработки и анализа графических, текстовых, и других структурированных и неструктурированных данных;
студенты, интересующихся задачами анализа данных, и желающих расширить свои компетенции в области ...
Добавлено: 28 августа 2014 г.
Карпов Н. В., Малафеев А. Ю., , in : Proceedings of the 14th Conference of the European Chapter of the Association for Computational Linguistics. : Association for Computational Linguistics, 2014.
In this paper we present an approach to lexical adaptation of news articles written in Russian language. Such adapted texts could then be used in learning/teaching Russian as a foreign language. To this end, we propose an algorithm of finding substitutes for low-frequency words by ranking all hypothetic synonyms. The ranking is based on whether ...
Добавлено: 24 октября 2013 г.
Игнатов Д. И., Кузнецов С. О., , in : Conceptual Structures: Leveraging Semantic Technologies. 17th International Conference on Conceptual Structures, ICCS 2009, Moscow, Russia, July 26-31, 2009, Proceedings. Vol. 5662.: Berlin, Heidelberg : Springer, 2009. P. 185-200.
A vast amount of documents in the Web have duplicates, which is a challenge for developing efficient methods that would compute clusters of similar documents. In this paper we use an approach based on computing (closed) sets of attributes having large support (large extent) as clusters of similar documents. The method is tested in a ...
Добавлено: 9 декабря 2012 г.
Пономаренко А. А., Аврелин Н. С., Найдан Б. С. и др., Алгоритмы, методы и системы обработки данных 2015 Т. 4 № 33 С. 91-106
Поиск по похожести широко применяется в различных областях компьютерных наук. Множество методов было предложено для решения задачи в точной постановке, однако все они подвержены "проклятью" размерности и не эффективны для данных высокой размерности. Приближенные алгоритмы отчасти позволяют справиться с "проклятьем". Однако из-за сложной стохастической природы, теоретические оценки для большинства приближенных алгоритмов отсутствуют. Более того, на ...
Добавлено: 27 сентября 2016 г.
Бычков А., Погудин Г. А., ACM Communications in Computer Algebra 2021 Vol. 54 No. 3 P. 119-123
Добавлено: 19 октября 2021 г.
Корухова Ю. С., Мытрова М. В., В кн. : Сборник статей молодых ученых факультета ВМК МГУ, 2012. : М. : Издательский отдел факультета ВМК МГУ им. М.В. Ломоносова, 2012. С. 68-85.
В статье предложен метод поиска нот музыкальных произведений в формате MusicXML по записи фрагмента мелодии. В основе подхода лежит использование волновых правил, позволяющих устранять различия в похожих математических выражениях. Метод позволяет находить в коллекции файлов множество похожих на поисковый запрос и оценивать их соответствие запросу. ...
Добавлено: 14 ноября 2014 г.
Поляков И. В., Чеповский А. А., Чеповский А. М., Вестник Новосибирского государственного университета. Серия: Информационные технологии 2013 Т. 11 № 4 С. 77-83
В статье представлена специализированная структура данных, предназначенная для хранения и выполнения различных операций с графами социальных сетей больших объемов. Предложенная структура хранения ориентирована на поддержку операций пополнения и выгрузки подграфов и поиска кратчайших путей между двумя группами вершин. ...
Добавлено: 17 октября 2013 г.
Игнатов Д. И., Пульманс Й., , in : Diagnostic Test Approaches to Machine Learning and Commonsense Reasoning Systems. : Hershey : IGI Global, 2012. Ch. 8. P. 185-195.
Recommender systems are becoming an inseparable part of many modern Internet web sites and web shops. The quality of recommendations made may significantly influence the browsing experience of the user and revenues made by web site owners. Developers can choose between a variety of recommender algorithms; unfortunately no general scheme exists for evaluation of their ...
Добавлено: 3 декабря 2012 г.
В статье приведен отчет о проведении 9-ой Российской летней школы по информационному поиску 9th Russian Summer School in Information Retrieval (RuSSIR 2015). ...
Добавлено: 27 февраля 2017 г.
Корухова Ю. С., Мытрова М. В., Открытые системы. СУБД 2013 № 7 С. 57-58
Большинство поисковых систем ищут нотные записи музыкальных произведений по названию и автору композиции, однако исходными данными может служить фрагмент нотной записи либо аудиозапись. В работе рассматривается задача поиска нотных записей по содержимому. ...
Добавлено: 15 ноября 2014 г.
Ulyanov M.V., Fomichev M.I., Business Informatics 2015 No. 4 (34) P. 38-46
Добавлено: 5 ноября 2016 г.
Денис Турдаков, Астраханцев Н. А., Недумов Я. Р. и др., Труды Института системного программирования РАН 2014 Т. 26 С. 421-438
В статье описан проект Texterra, в рамках которого была создана инфраструктура для анализа текстов. Texterra предоставляет масштабируемое решение для быстрой обработки текстовых документов, основанное на использовании знаний, извлекаемых из Веб-ресурсов и текстовых документов. В данной статье раскрываются детали реализации проекта, варианты использования и результаты экспериментальных исследований разработанных инструментов. ...
Добавлено: 6 ноября 2017 г.
Пульманс Й., Игнатов Д. И., Кузнецов С. О. и др., International Journal of General Systems 2014 Vol. 43 No. 2 P. 105-134
Добавлено: 9 июня 2014 г.
Корухова Ю. С., Мытрова М. В., / ИПМ им. М.В. Келдыша РАН. Серия :: "ИПМ им. М.В. Келдыша РАН". 2013. № 48.
Работа посвящена проблеме поиска нот музыкальных произведений, записанных в формате MusicXML. Данный формат является одним из самых распространенных и поддерживается многими программами – нотными редакторами. В большинстве современных поисковых систем имеется возможность искать ноты по названию и автору композиции. В данной работе предлагается подход к решению задачи поиска произведений по нотной записи фрагмента мелодии. Для ...
Добавлено: 14 ноября 2014 г.