В старых версиях браузеров сайт может отображаться некорректно. Для оптимальной работы с сайтом рекомендуем воспользоваться современным браузером.
Мы используем файлы cookies для улучшения работы сайта НИУ ВШЭ и большего удобства его использования. Более подробную информацию об использовании файлов cookies можно найти здесь, наши правила обработки персональных данных – здесь. Продолжая пользоваться сайтом, вы подтверждаете, что были проинформированы об использовании файлов cookies сайтом НИУ ВШЭ и согласны с нашими правилами обработки персональных данных. Вы можете отключить файлы cookies в настройках Вашего браузера.
Коллаборация одного из экспериментов Большого адронного коллайдера, LHCb, в которую входит также и группа ученых Высшей школы экономики, опубликовала сообщение об открытии новых тетракварков – экзотических адронов, состоящих из четырех кварков. Эти открытия стали возможны благодаря массивным выборкам данных, собранным экспериментом LHCb при помощи алгоритмов, разработанных в ВШЭ.
Онкологические заболевания окутаны множеством мифов. Последствия заблуждений и слабой информированности плачевные — запущенные стадии заболевания, ранние смерти. Профилактика и ранняя диагностика рака должны стать рутинными практиками, считают участники круглого стола «От канцерофобии к онконастроженности», организованного в НИУ ВШЭ проектной группой «Онкология и дефициты агентности: автономные практики заботы россиян о себе в условиях кризиса биомедицины».
Группа ученых из четырех стран подвела итоги «Супертеста» – масштабного исследования прогресса студентов-инженеров в России, Китае, Индии и США. Исследование впервые позволило отследить, как меняются компетенции в области физики, математики и навыки критического мышления студентов компьютерных наук и электронной инженерии на протяжении учебы, и сопоставить данные четырех стран.
Ананьева М. И., Кобозева М. В., Соловьев Ф. Н. и др. Вестник Новосибирского государственного университета. Серия: Информационные технологии. 2016. Т. 14. № 4. С. 5-13.
Рассматриваются методы, используемые для обнаружения экстремистских текстов из Интернета. Дальнейшее исследование необходимо, чтобы найти новые методы классификации текстов и дифференцирующие признаки для классификации текстов экстремистской тематики.
Дурандин О. В., Золотых Н. Ю., Хилал Н. Р. и др. Научно-технический вестник информационных технологий, механики и оптики. 2017. № 1(107). С. 110-116.
Предмет исследования. Предложен подход к решению задачи классификации, использующий информацию о распределении вероятностей на множестве классов в обучающей выборке. Алгоритм проиллюстрирован на одной из сложных задач автоматической обработки текстов на естественном языке – классификации арабских диалектов. Метод.Каждому объекту обучающей выборки сопоставляется распределение вероятностей над метками классов, вместо сопоставления единственной метки класса. Предлагаемый подход решает задачу с учетом распределения вероятностей над множеством классов для повышения качественных показателей работы классификатора. Основные результаты. Предложенный подход проиллюстрирован на примере задачи классификации арабских диалектов. Анализируемые данные,содержащие слова-метки,получены из социальной сети Twitter, относящиеся к шести арабским диалектам: саудовский, левантийский, алжирский, египетский, иракский, иорданский; использованы также сообщения на современном стандартном арабском языке (MSA). Показан рост качества классификации при учете вероятностного распределения над множеством классов в обучающей выборке. Показано, что даже относительно простой учет вероятностного распределения увеличивает точность предсказания с 44% до 67%. Практическая значимость.Предложенный подход и соответствующий алгоритм могут найти применение в случае, когда разметка данных экспертом требует значительных временных и финансовых ресурсов, но имеется возможность разработки эвристических правил. Реализация предложенного алгоритма позволит снизить затраты при подготовке данных без значительной потери точности классификации.
Lomotin K. E., Kozlova E. S., Romanov A. In bk.: Information Innovative Technologies: Materials of the International scientific–рractical conference. M.: Association of graduates and employees of AFEA named after prof. Zhukovsky, 2017. P. 359-363.
Ломотин К. Е., Романова И. И. В кн.: ФЭЭ 2017: Физика, Электроника, Электротехника. Материалы научно-технической конференции. Сумы: СумДу, 2017. С. 152-152.
Романов А. Ю., Ломотин К. Е., Козлова Е. С. Информационные технологии. 2017. Т. 23. № 6. С. 418-423.
Работа посвящена исследованию применимости современных методов машинного обучения к задаче автоматической генерации кодов УДК научных статей. В качестве классификаторов рассматриваются такие модели, как искусственные нейронные сети, логистическая регрессия и бустинг. Разработаны графовые алгоритмы и прототип программного модуля для генерации кода УДК.
Romanov A., Lomotin K.E., Kozlova E.S. et al. In bk.: 2016 International Siberian Conference on Control and Communications (SIBCON). Proceedings. M.: HSE, 2016. Ch. 543fu4t.
В данной работе рассмотрена реализация автоматической рубрикации текстов научных статей по классификатору UDC, проведено исследование эффективности применения нейросетевых технологий для данной задачи. Предложены оптимальная архитектура и параметры нейронной сети.