• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • A
  • A
  • A
  • A
  • A
Обычная версия сайта
  • RU
  • EN
  • Национальный исследовательский университет «Высшая школа экономики»
  • Публикации ВШЭ
  • Глава
  • Machine-learning models for cancer breakpoints prediction based on DNA structure distributions
  • RU
  • EN
Расширенный поиск
Высшая школа экономики
Национальный исследовательский университет
Приоритетные направления
  • бизнес-информатика
  • государственное и муниципальное управление
  • гуманитарные науки
  • инженерные науки
  • компьютерно-математическое
  • математика
  • менеджмент
  • право
  • социология
  • экономика
по году
  • 2027
  • 2026
  • 2025
  • 2024
  • 2023
  • 2022
  • 2021
  • 2020
  • 2019
  • 2018
  • 2017
  • 2016
  • 2015
  • 2014
  • 2013
  • 2012
  • 2011
  • 2010
  • 2009
  • 2008
  • 2007
  • 2006
  • 2005
  • 2004
  • 2003
  • 2002
  • 2001
  • 2000
  • 1999
  • 1998
  • 1997
  • 1996
  • 1995
  • 1994
  • 1993
  • 1992
  • 1991
  • 1990
  • 1989
  • 1988
  • 1987
  • 1986
  • 1985
  • 1984
  • 1983
  • 1982
  • 1981
  • 1980
  • 1979
  • 1978
  • 1977
  • 1976
  • 1975
  • 1974
  • 1973
  • 1972
  • 1971
  • 1970
  • 1969
  • 1968
  • 1967
  • 1966
  • 1965
  • 1964
  • 1963
  • 1958
  • еще
Тематика
Новости
18 мая 2026 г.
В Вышке прошла XXX юбилейная научно-техническая конференция имени Е.В. Арменского
Организатором научного события выступает Московский институт электроники и математики им. А.Н. Тихонова ВШЭ. В этом году главный инженерный студенческий форум проходил 30-й раз и собрал рекордное число участников. Студенты, аспиранты и молодые специалисты из 50 вузов и организаций России представили научно-исследовательские доклады в ИТ-области. Отдельная секция была посвящена научно-исследовательским работам школьников.
15 мая 2026 г.
В НИУ ВШЭ разрабатывают нейросеть для сферы науки и инноваций
Исследователи НИУ ВШЭ учат большие языковые модели понимать русскоязычную научную терминологию, увеличивая при этом их энергоэффективность. Адаптированная модель работает в 2,7 раза быстрее и требует на 73% меньше памяти, чем исходная открытая модель, что позволяет запускать ее на более доступном оборудовании. Программа прошла государственную регистрацию.
15 мая 2026 г.
Стартовал совместный спецпроект бренд-медиа Вышки IQ Media и iFORA ИСИЭЗ
В мае 2026 года стартовал научно-популярный проект «Искусственный интеллект: технологии, данные и будущее», который стал результатом работы двух команд — проекта iFORA Института статистических исследований и экономики знаний НИУ ВШЭ и редакции бренд-медиа IQMedia. Медийно-аналитический спецпроект посвящен современному развитию искусственного интеллекта и аналитике больших данных.

 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!

Публикации
  • Книги
  • Статьи
  • Главы в книгах
  • Препринты
  • Верификация публикаций
  • Расширенный поиск
  • Правила использования материалов
  • Наука в ВШЭ

?

Machine-learning models for cancer breakpoints prediction based on DNA structure distributions

P. 1–5.
Челошкина К. С., Попцова М. С.
В печати

With the advances in the sequencing technology the International Cancer Genome Consortium (ICGC) [1] and The Cancer Genome Atlas (TCGA) [2] collected data on more than 16 000 genome-wide pairs tumor-normal tissue providing a valuable resource to study cancer mutations. In this research we focus on pre- evaluation of the relationship between cancer breakpoint hotspots and DNA regions potentially forming secondary structures such as stem-loops (cruciforms) and quadru- plexes. We performed analysis of 2 234 samples covering 10 cancer types and built machine-learning models predicting cancer breakpoint distribution over chromosome based on the density distribution of stem-loops and quadruplexes. We developed pro- cedure for machine learning models building and evaluation as the considered data are extremely imbalanced and it is needed to get reliable estimate of prediction power. We conducted a set of experiments to select the best appropriate resampling scheme, class balancing technique and parameters of machine learning algorithms. The best final models were applied to cancer breakpoints data. From the performed analysis it could be concluded that the relationship between cancer breakpoints hotspots and studied DNA secondary structures exists, however, generally, this relationship is weak for stem-loops, but higher for quadruplexes. We also found differences in model predictive power depending on cancer types. Thus, stem-loop-based model performs better for pancreatic, prostate, ovary, uterus, brain and liver cancer, and quadruplex- based model works better for blood, bone, skin and breast cancer.

Язык: английский
Полный текст
Ключевые слова: machine learningDNA structurescancerCancer genomicsstem-loopsnon-B DNAG-quadruplexescancer breakpointsrandom forest
ПУБЛИКАЦИЯ ПОДГОТОВЛЕНА ПО РЕЗУЛЬТАТАМ ПРОЕКТА:
Роль вторичных структур ДНК в функционировании генома (2018)

В книге

Сборник трудов 42-й междисциплинарной школы-конференции ИППИ РАН "Информационные технологии и системы 2018"
Институт проблем передачи информации им. А.А. Харкевича РАН, 2018.
Похожие публикации
Machine Learning Approach to Anticancer Activity Prediction of Transition-Metal Complexes Based on a Large-Scale Experimental Database
Krasnov L., Malikov D., Kiseleva M. и др., Journal of Medicinal Chemistry 2026 Vol. 69 No. 8 P. 8838–8851
Добавлено: 23 апреля 2026 г.
Saying “Yes” to NONO: A Therapeutic Target for Neuroblastoma and Beyond
Pogodaeva S., Miletina O., Antipova N. и др., Cancers 2025 Vol. 17 No. 19 Article 3228
Добавлено: 15 апреля 2026 г.
Особые экономические зоны Российской Федерации: моделирование решений потенциальных резидентов и процесса их генерации
Плесовских А. Е., Journal of Applied Economic Research 2023 Т. 22 № 2 С. 323–354
В современных исследованиях широко обсуждается роль особых экономических зон в стимулировании экономического роста и развития России, формировании необходимых инвестиционных потоков и повышении инновационного потенциала страны за счет расширения производства продукции в высокотехнологичных отраслях экономики с высокой добавленной стоимостью. Цель исследования – моделирование процесса генерации резидентов и детерминация количественных факторов, оказывающих статистически значимый эффект на среднегодовой ...
Добавлено: 13 апреля 2026 г.
Replacing Criterion of Creativity with Criterion of Investment for Results Created by Artificial Intelligence
Пакшин П. К., Legal Issues in the Digital Age 2026 Vol. 7 No. 1 P. 32–48
Искусственный интеллект выполняет значимую функцию в процессе автоматизации, минимизируя операционное участие человека в таких сферах, как медицина, искусство и юриспруденция. Несмотря на исторически тесную взаимосвязь искусства и технологий, именно генеративный искусственный интеллект расширил потенциал для творческой деятельности. Существенным катализатором этого процесса стало распространение предобученных систем искусственного интеллекта, интенсифицировавших развитие технологий в области обработки естественного языка ...
Добавлено: 31 марта 2026 г.
A Tool for Mass Generation of Random Step Environment Models with User-Defined Landscape Features
Gabdrahmanov R., Tsoy T., Martinez-Garcia E. и др., , in: Proceedings of the 21st International Conference on Informatics in Control, Automation and Robotics - (Volume 1) ICINCO 2024.: SciTePress, 2024. P. 511–518.
Добавлено: 17 марта 2026 г.
Real-Bogus Classification for ZTF Data Releases: Two Approaches
Semenikhin T., Корнилов М. В., Pruzhinskaya M. и др., , in: 26th International Conference, DAMDID/RCDL 2024, Nizhny Novgorod, Russia, October 23–25, 2024, Revised Selected Papers. Data Analytics and Management in Data Intensive Domains. (CCIS, volume 2641).: Springer, 2026. P. 211–219.
Добавлено: 11 марта 2026 г.
Кластеризация паттернов потребления электроэнергии умного дома на основе ансамблевых методов машинного обучения
Мальцева С. В., Бериков В. Б., Кладов Д. Е. и др., В кн.: Информатика и прикладная математика: Материалы X Международной научно-практической конференции (08.10 - 11.10.2025 г.)Т. 1: Сборник материалов часть 1.: Алматы: Институт информационных и вычислительных технологий КН МНВО РК, 2025. С. 227–232.
В работе рассматривается задача кластеризации паттернов потребления для частного домохозяйства. Для кластеризации суточных профилей нагрузки разработан и применен ансамблевый алгоритм на основе метрики Вассерштейна. Предложенный подход позволяет выделить типичные сценарии энергопотребления, интерпретировать поведение потребителя. Приводятся результаты вычислительных экспериментов на реальных данных. ...
Добавлено: 3 марта 2026 г.
Построение системы опережающих индикаторов для прогнозирования валютного кризиса
Щепелева М. А., Финансы: теория и практика 2025 Т. 29 № 4 С. 146–162
Данная работа посвящена анализу финансовых кризисов. Рассматриваются различные классификации кризисов, методы их прогнозирования, подходы к составлению системы опережающих индикаторов. Для лучшего понимания возможностей прогнозирования финансовых кризисов проводится собственное эмпирическое исследование по развивающимся странам с использованием традиционного эконометрического подхода для предсказания валютных кризисов и метода случайного леса. Выявлены наиболее значимые переменные, изменение которых может сигнализировать о ...
Добавлено: 12 февраля 2026 г.
Method of Automated Dataset Collection for Microwave Filters Synthesis
Arinin O. V., Bakhmach D. M., Кацнельсон А. И. и др., , in: 2025 Systems of Signals Generating and Processing in the Field of on Board Communications.: IEEE, 2025. P. 1–5.
Добавлено: 6 декабря 2025 г.
Почему нам нужен онкоэтикет?
Нагорная А. В., Логос 2025 № 5(168) С. 133–150
Онкозаболевание – это тяжелейшее испытание, с которым сталкивается в своей жизни человек. Оно не только калечит тело, но и терзает душу, вызывая глубокий экзистенциальный кризис и требуя существенной ревизии казавшихся незыблемыми смыслов. Эта смыслосозидательная работа представляет собой весьма сложный и деликатный процесс, любое вмешательство в который грозит утратой с таким трудом достигаемого баланса. Именно поэтому ...
Добавлено: 6 октября 2025 г.
ОТСЛЕЖИВАНИЕ РАЗВИТИЯ РАЗРУШЕНИЯ С ПОМОЩЬЮ КЛАСТЕРИЗАЦИИ ИМПУЛЬСОВ ТЕРМИЧЕСКИ СТИМУЛИРОВАННОЙ АКУСТИЧЕСКОЙ ЭМИССИИ ПРИ ОТСУТСТВИИ ЛОКАЦИИ
Индаков Г. С., Казначеев П. А., Майбук З. Я. и др., Геофизические исследования 2025 Т. 26 № 2 С. 99–124
Исследована группируемость импульсов акустической эмиссии при высокотемпературном нагреве образца песчаника, предварительно подвергнутого механическому нагружению. Механическое нагружение осуществлялось в одноосном режиме до нагрузки, близкой к разрушающей, с проявлением на поверхности признаков крупных трещин. После этого образец нагревался до 650 °C с регистрацией импульсов термоакустической эмиссии (ТАЭ). Проведена кластеризация импульсов на основе их сходства, установленного методом взаимной ...
Добавлено: 19 сентября 2025 г.
Rewriting the Rules: LLMs Vs. Traditional ML in University Admissions
Чепиков И. А., Карпов И. А., , in: 26th International Conference, AIED 2025, Palermo, Italy, July 22–26, 2025, Proceedings, Part I. Artificial Intelligence in Education. Posters and Late Breaking Results, Workshops and Tutorials, Industry and Innovation Tracks, Practitioners, Doctoral Consortium, Blue Sky, and WideAIED.: Springer, 2025. P. 352 – 358.
Добавлено: 4 сентября 2025 г.
Proceedings of the 63rd Annual Meeting of the Association for Computational Linguistics
Wien: Association for Computational Linguistics, 2025.
Добавлено: 26 августа 2025 г.
Analysis of a Company Model in Conditions of Unstable Demand Using Reinforcement Learning Methods
Delev A., Semakov S., , in: 2025 8th International Conference on Artificial Intelligence and Big Data (ICAIBD).: IEEE, 2025. P. 318–322.
Добавлено: 25 августа 2025 г.
Deep learning deciphers the related role of master regulators and G-quadruplexes in tissue specification
Башкатов А. Б., Andreasyan A., Коновалов Д. Л. и др., Scientific Reports 2025 Vol. 15 Article 23119
G-quadruplexes (GQs) are non-canonical DNA structures encoded by G-flipons with potential roles in gene regulation and chromatin structure. Here, we explore the role of G-flipons in tissue specification. We present a deep learning-based framework for the genome-wide G-flipon predictions across 14 human tissue types. The model was trained using high-confidence experimental maps of GQ-forming sequences ...
Добавлено: 8 августа 2025 г.
Metaphorical conceptualization of cancer in English medical creative nonfiction
Alexandra V. Nagornaya, James Chike Nwankwo, Вестник Волгоградского государственного университета. Серия 2: Языкознание 2025 Vol. 24 No. 2 P. 59–72
В статье рассматривается феномен литературного жанра «медицинский художественный нон-фикшн». Определены факторы, способствующие формированию спроса на такую литературу; охарактеризованы его основные разновидности этого жанра. Обоснована важность выбора языковых средств для представления медицинских фактов, поскольку художественный нон-фикшн стремится не только донести информацию простым и понятным языком, но и создать увлекательный и эстетически привлекательный нарратив. В фокусе исследования ...
Добавлено: 9 июля 2025 г.
Прогнозирование цен на золото с использованием алгоритмов нейросетей
Солдатова А. О., Финансы, деньги, инвестиции 2023 № 4 С. 9–15
Стоимость золота - важнейший экономический индикатор. Ожидания роста инфляции и повышения ключевых ставок со стороны Центральных банков формируют интерес инвесторов к золоту во всем мире. С учетом все большего числа факторов, оказывающих влияние на динамику курса золота в мире, прогнозирование цен на золото требует новых методов и современных технологических решений. В статье представлен обзор методов ...
Добавлено: 8 июля 2025 г.
Predicting Systemic Risk in the Russian Financial Sector with Boosting Techniques
Щепелева М. А., Procedia Computer Science 2024 Vol. 242 P. 51–56
Добавлено: 17 июня 2025 г.
Экономические и социальные аспекты атомной энергетики в условиях развития технологий искусственного интеллекта
Подчуфаров А. Ю., Галкина А. Н., Ванина С. С. и др., Экономика и управление: проблемы, решения 2025 Т. 5 № 4 С. 61–74
В современных условиях внедрение технологий искусственного интеллекта становится значимым фактором развития высокотехнологичных отраслей промышленности. В статье представлены результаты исследования перспектив применения интеллектуальных аналитических систем в атомной энергетике. Проанализирован опыт зарубежных стран и выявлены особенности успешных проектов с использованием искусственного интеллекта в данной области. Обоснованы рекомендации по развитию технических и социальных компетенций в отечественной атомной и ...
Добавлено: 5 июня 2025 г.
Forecasting Stadium Attendance Using Machine Learning Models: A Case of the National Football League
Пан Ю., Ван Ф., Studia Sportiva 2024 Vol. 18 No. 2 P. 147–164
Добавлено: 16 мая 2025 г.
Periods of high uncertainty: How fertility intentions in Russia changed during 2022–2023
Вакуленко Е. С., Горский Д. И., Kondrateva V. и др., Demographic Research 2025 Vol. 52 P. 939–970
Добавлено: 6 мая 2025 г.
Prospects for Big Text Data Application in Technology Maturity Assessment (Publications Review)
Логинова И. В., Грозовский Ф. М., Аксенова А. С., Automatic Documentation and Mathematical Linguistics 2025 Vol. 59 No. 3 P. 145–153
Добавлено: 28 апреля 2025 г.
  • О ВЫШКЕ
  • Цифры и факты
  • Руководство и структура
  • Устойчивое развитие в НИУ ВШЭ
  • Преподаватели и сотрудники
  • Корпуса и общежития
  • Закупки
  • Обращения граждан в НИУ ВШЭ
  • Фонд целевого капитала
  • Противодействие коррупции
  • Сведения о доходах, расходах, об имуществе и обязательствах имущественного характера
  • Сведения об образовательной организации
  • Людям с ограниченными возможностями здоровья
  • Единая платежная страница
  • Работа в Вышке
  • ОБРАЗОВАНИЕ
  • Лицей
  • Довузовская подготовка
  • Олимпиады
  • Прием в бакалавриат
  • Вышка+
  • Прием в магистратуру
  • Аспирантура
  • Дополнительное образование
  • Центр развития карьеры
  • Бизнес-инкубатор ВШЭ
  • Образовательные партнерства
  • Обратная связь и взаимодействие с получателями услуг
  • НАУКА
  • Научные подразделения
  • Исследовательские проекты
  • Мониторинги
  • Диссертационные советы
  • Защиты диссертаций
  • Академическое развитие
  • Конкурсы и гранты
  • Внешние научно-информационные ресурсы
  • РЕСУРСЫ
  • Библиотека
  • Издательский дом ВШЭ
  • Книжный магазин «БукВышка»
  • Типография
  • Медиацентр
  • Журналы ВШЭ
  • Публикации
  • http://www.minobrnauki.gov.ru/
    Министерство науки и высшего образования РФ
  • https://edu.gov.ru/
    Министерство просвещения РФ
  • http://www.edu.ru
    Федеральный портал «Российское образование»
  • https://elearning.hse.ru/mooc
    Массовые открытые онлайн-курсы
  • НИУ ВШЭ1993–2026
  • Адреса и контакты
  • Условия использования материалов
  • Политика конфиденциальности
  • Правила применения рекомендательных технологий в НИУ ВШЭ
  • Карта сайта
Редактору