Статья
Формальный метод пополнения словарей морфологического анализа с использованием несловарной лексики
В статье разрабатывается математический аппарат описания словаря системы морфологического анализа и синтеза. На его основе предложен алгоритм кластеризации слов, отсутствующих в словаре. С целью пополнения словаря на основе полученных кластеров строятся гипотезы о парадигме изменения таких слов.
В работе обсуждаются первые результаты обобщения сведений, полученных в ходе апробации мониторинга цифровой трансформации общеобразовательных организаций, который разрабатывает и реализует Институт образования НИУ ВШЭ по заказу ФГАУ «Фонд новых форм развития образования» в интересах Министерства просвещения Российской Федерации. Представлен аналитический инструмент, опирающийся на метод кластеризации, позволивший выделить специфику процессов цифровой трансформации для разных групп школ и подтверждающий различительные возможности мониторинга. Показано, что характер развития цифровой инфраструктуры школ и проходящие в школах процессы цифровой трансформации могут существенно различаться. Сделан вывод о необходимости дальнейшего развития представленного подхода в рамках следующих этапов мониторинга цифровой трансформации, запланированного на 2020–2021 гг.
В монографии представлены результаты исследований, отражающие процессы цифровой трансформации экономики и новые вызовы в области создания и развития инновационных кластеров. В монографии нашли отражение вопросы влияния процессов глобализации, информатизации и рецессии на формирование цифровой экономики, особенности цифровой трансформации промышленности, теории и практики кластерного развития экономики. В рамках анализа процессов цифровой трансформации экономики и формирования инновационных кластеров рассмотрены методы и инструменты моделирования, а также проблемы функционирования предприятий и интегрированных структур в условиях цифровизации. Монография отражает результаты исследований авторов. Материалы монографии будут полезны преподавателям, научным работникам, специалистам промышленных, научных предприятий, организаций и учреждений, а также аспирантам и студентам. Материалы монографии размещены в базе данных Российского индекса научного цитирования на платформе Elibrary.ru.
A vast amount of documents in the Web have duplicates, which is a challenge for developing efficient methods that would compute clusters of similar documents. In this paper we use an approach based on computing (closed) sets of attributes having large support (large extent) as clusters of similar documents. The method is tested in a series of computer experiments on large public collections of web documents and compared to other established methods and software, such as biclustering, on same datasets. Practical efficiency of different algorithms for computing frequent closed sets of attributes is compared.
Несловарные формы - единицы текста, отсутствующие в словаре программы морфологического анализа - представляют проблему как для морфологического парсинга текста, так и для создания словарей, основанных на текстовых корпусах. Оценка эффективности алгоритма построения кластеров несловарных слов проводилась на материале словника Национального корпуса русского языка и набора данных "База словоформ Яндекса".
Работа посвящена вопросу воздействия реактивной составляющей автоматизированной обучающей системы на методики обучения с целью достижения оптимального результата образовательной деятельности этой системы. Предлагается использовать модель вычисления показателя синонимической близости двух текстовых выражений, основанную на учете коэффициентов синонимии терминов предметной области, для адаптации учебных курсов. Отмечено, что данная модель принципиально не зависит от изучаемой предметной области и методов организации работы с обучающей системой, что предоставляет большие возможности при очном, компьютерном либо дистанционном обучении.
Целью данной работы является представление возможностей нового для гуманитарных наук метода анализа динамик, укладывающихся в числовые ряды, - метода вейвлет-анализа, который, в отличие от традиционных методов, не накладывает жестких ограничений на математические характеристики ряда данных, а также позволяет обнаружить неочевидные процессы и закономерности.
Атлас содержит 8 карт, графики и таблицы, иллюстрирующие основные закономерности и ограничения в области утилизации твердых бытовых отходов в Центральном Федеральном округе. Социальная значимость Атласа состоит в выявлении и типологизации основных "ядер" антропогенного загрязнения, представленных полигонами и свалками ТБО.
Создание атласа осуществлялось при финансовой поддержке Русского Географического общества (грант РГО №59-2013/Н7 "Экологические риски в пригородных и межселенных территориях")
В статье рассматриваются основы построения моделей измерительных приемников, предназначенных для виртуальных исследований в области ЭМС, в формах, отличных от схемной. Анализируются модели на основе цифровой обработки сигналов, формальные математические модели, а также базирующиеся на графическом программировании. Формулируется общий вывод о перспективах использования таких моделей при построении системы автоматизированного проектирования, реализующей процедуру виртуальной сертификации радиоэлектронных средств по эмиссии излучаемых радиопомех.
Излагаются результаты разработки моделей надёжности для проектных исследований надёжности радиоэлектронной аппаратуры, полученные в ходе выполнения II этапа научно-исследовательской работы «Разработка методов и средств для проектных исследований надёжности радиоэлектронной аппаратуры» выполняемой в рамках тематического плана МИЭМ по теме № 100077: «Разработка моделей надёжности для проектных исследований надёжности радиоэлектронной аппаратуры».
Приводятся результаты разработки унифицированных топологических моделей надёжности резервированных групп. Описываются формальные модели типовых групп для нагруженного резервирования, для ненагруженного резервирования, для комбинированного контроля работоспособности, для групп с переключателями и групп с восстановлением. Проанализированы способы реализации γ-процентного контроля работоспособности РЭА и СЧ и даны рекомендации по модификации алгоритмов формирования временных диаграмм состояний типовых резервированных групп для различных способов контроля. Предложены методы формирования временных диаграмм состояний для восстанавливаемых резервированных групп для «последовательного» и «параллельного» соединения компонентов. Приводятся результаты экспериментальной проверки разработанных моделей и методов для проектных исследований надёжности РЭА.
В работе была предложена схемная модель отдельных узлов фликерметра. Эту модель можно использовать для оценки уровня фликера в электросетях при виртуальных исследованиях кондуктивных помех, которые являются составляющей общей теории виртуальной сертификации. В будущем на основе этой модели могут быть разработаны инженерные методики, нацеленные на решение практических задач в области ЭМС с широким привлечением средств автоматизации и моделирования.
Документ содержит проект методологических рекомендаций по статистическому измерению технологий. Он включает предложения по формированию операциональных определений технологий, подходы к идентификации классификации новых и возникающих технологий, а также предложения по разработке системы показателей, характеризующих жизненный цикл технологий, и стратегиям сбора данных. Разработанные рекомендации предлагается использовать в качестве методологической основы гармонизированной системы сбора и интерпретации статистических данных о технологиях. В приложении приводятся сведения о доступных определениях технологий и краткие результаты исследования опыта национальных статистических служб в области статистического наблюдения науки и технологий.