Статья
The inverted multi-index
A new data structure for efficient similarity search in very large datasets of high-dimensional vectors is introduced. This structure called the inverted multi-index generalizes the inverted index idea by replacing the standard quantization within inverted indices with product quantization. For very similar retrieval complexity and pre-processing time, inverted multi-indices achieve a much denser subdivision of the search space compared to inverted indices, while retaining their memory efficiency. Our experiments with large datasets of SIFT and GIST vectors demonstrate that because of the denser subdivision, inverted multi-indices are able to return much shorter candidate lists with higher recall. Augmented with a suitable reranking procedure, multi-indices were able to significantly improve the speed of approximate nearest neighbor search on the dataset of 1 billion SIFT vectors compared to the best previously published systems, while achieving better recall and incurring only few percent of memory overhead. © 2014 IEEE.
Рассматривается методология автоматизированного формирования слабоформализуемых производственно-технологических документов для поддержки производственных процессов предприятия на основе кибернетических методов. Приводится модель разработки автоматизированной технологии подготовки документов с использованием автоматизированного лексикологического синтеза. Предлагаемая технология позволяет существенно сократить трудозатраты при создании полнотекстовых документов.
математический некролог
Similarity searching has a vast range of applications in various fields of computer science. Many methods have been proposed for exact search, but they all suffer from the curse of dimensionality and are, thus, not applicable to high dimensional spaces. Approximate search methods are considerably more efficient in high dimensional spaces. Unfortunately, there are few theoretical results regarding the complexity of these methods and there are no comprehensive empirical evaluations, especially for non-metric spaces. To fill this gap, we present an empirical analysis of data structures for approximate nearest neighbor search in high dimensional spaces. We provide a comparison with recently published algorithms on several data sets. Our results show that small world approaches provide some of the best tradeoffs between efficiency and effectiveness in both metric and non-metric spaces.
В статье рассматривается метод защиты информации при передаче слабоформализуемых документов, создаваемых с помощью способа автоматизированного лексикологического синтеза документов. Экспериментальная проверка рассматриваемого способа защиты информации показывает практическую невозможность несанкционированного восстановления документов при их передаче по каналам связи на основе зафиксированной индексной последовательности при отсутствии согласованного лексикологического дерева на передающей и приемной сторонах. Дополнительным достоинством является возможность восстановления не только содержания, но и формы передаваемого документа.
В статье рассматриваются основы построения моделей измерительных приемников, предназначенных для виртуальных исследований в области ЭМС, в формах, отличных от схемной. Анализируются модели на основе цифровой обработки сигналов, формальные математические модели, а также базирующиеся на графическом программировании. Формулируется общий вывод о перспективах использования таких моделей при построении системы автоматизированного проектирования, реализующей процедуру виртуальной сертификации радиоэлектронных средств по эмиссии излучаемых радиопомех.
Излагаются результаты разработки моделей надёжности для проектных исследований надёжности радиоэлектронной аппаратуры, полученные в ходе выполнения II этапа научно-исследовательской работы «Разработка методов и средств для проектных исследований надёжности радиоэлектронной аппаратуры» выполняемой в рамках тематического плана МИЭМ по теме № 100077: «Разработка моделей надёжности для проектных исследований надёжности радиоэлектронной аппаратуры».
Приводятся результаты разработки унифицированных топологических моделей надёжности резервированных групп. Описываются формальные модели типовых групп для нагруженного резервирования, для ненагруженного резервирования, для комбинированного контроля работоспособности, для групп с переключателями и групп с восстановлением. Проанализированы способы реализации γ-процентного контроля работоспособности РЭА и СЧ и даны рекомендации по модификации алгоритмов формирования временных диаграмм состояний типовых резервированных групп для различных способов контроля. Предложены методы формирования временных диаграмм состояний для восстанавливаемых резервированных групп для «последовательного» и «параллельного» соединения компонентов. Приводятся результаты экспериментальной проверки разработанных моделей и методов для проектных исследований надёжности РЭА.
В работе была предложена схемная модель отдельных узлов фликерметра. Эту модель можно использовать для оценки уровня фликера в электросетях при виртуальных исследованиях кондуктивных помех, которые являются составляющей общей теории виртуальной сертификации. В будущем на основе этой модели могут быть разработаны инженерные методики, нацеленные на решение практических задач в области ЭМС с широким привлечением средств автоматизации и моделирования.
Документ содержит проект методологических рекомендаций по статистическому измерению технологий. Он включает предложения по формированию операциональных определений технологий, подходы к идентификации классификации новых и возникающих технологий, а также предложения по разработке системы показателей, характеризующих жизненный цикл технологий, и стратегиям сбора данных. Разработанные рекомендации предлагается использовать в качестве методологической основы гармонизированной системы сбора и интерпретации статистических данных о технологиях. В приложении приводятся сведения о доступных определениях технологий и краткие результаты исследования опыта национальных статистических служб в области статистического наблюдения науки и технологий.
Атлас содержит 8 карт, графики и таблицы, иллюстрирующие основные закономерности и ограничения в области утилизации твердых бытовых отходов в Центральном Федеральном округе. Социальная значимость Атласа состоит в выявлении и типологизации основных "ядер" антропогенного загрязнения, представленных полигонами и свалками ТБО.
Создание атласа осуществлялось при финансовой поддержке Русского Географического общества (грант РГО №59-2013/Н7 "Экологические риски в пригородных и межселенных территориях")