?
Comparative Study Of Data Clustering Algorithms And Analysis Of The Keywords Extraction Efficiency: Learner Corpus Case
NRU HSE
,
2020.
Щербакова А. М.
Язык:
английский
ПУБЛИКАЦИЯ ПОДГОТОВЛЕНА ПО РЕЗУЛЬТАТАМ ПРОЕКТА:
Сулейкин А. С., Сорокина В., Пятецкий В. Е., , in: 2025 7th International Conference on Control Systems, Mathematical Modeling, Automation and Energy Efficiency.: [б.и.], 2025. P. 748–753.
Добавлено: 17 апреля 2026 г.
Kisselev O., Климов А. А., Mihail Kopotev, , in: Complexity, Accuracy and Fluency in Learner Corpus Research. Volume vi.: Amsterdam: John Benjamins Publishing Company, 2022. Ch. 3 P. 51–80.
Добавлено: 25 ноября 2024 г.
Дьяконов А. Г., Штыков П. А., Прикладная дискретная математика 2023 № 59 С. 111–127
Предлагается определение обобщённого диалогового графа, с помощью которого описывается структура диалога по корпусу однородных диалогов. Задача построения такого графа является актуальной в современном разговорном искусственном интеллекте, однако работ с конкретными результатами мало, часто не даётся полного описания алгоритмов, не выкладывается код с их реализацией. В настоящей работе предложен метод построения обобщённого диалогового графа, который реализован ...
Добавлено: 18 марта 2024 г.
Климова М. А., Виклова А. В., Оверникова Д. А., Вестник Санкт-Петербургского университета. Язык и литература 2023 Т. 20 № 4 С. 824–837
Статья посвящена экспериментальному исследованию влияния частотности орфографических ошибок в слове на качество его репрезентации в ментальном лексиконе. Гипотеза о том, что слова, в которых часто совершаются ошибки правописания, затрудняют восприятие при чтении, даже если написаны правильно, ранее была подтверждена для носителей русского и английского языков. Данная работа нацелена на проверку гипотезы на материале учебного корпуса ...
Добавлено: 26 января 2024 г.
Климова М. А., Виклова А. В., Оверникова Д. А., В кн.: Современная лингвистика: от теории к практике. III Казанский международный лингвистический саммит (Казань, 14–19 ноября 2022 г.): Труды и материалы, в трёх томах, том 1.: Каз.: Издательство Казанского университета, 2022. С. 46–50.
В данной статье рассматривается классификация ошибок, используемая в учебном корпусе REALEC, в аспекте ее соответствия требованиям и приспособленности для исследовательских задач. ...
Добавлено: 17 января 2023 г.
Москвина А. Д., Кирина М. А., Anastasia Gavrilyuk, , in: 2022 32nd Conference of Open Innovations Association (FRUCT).: IEEE, 2022. P. 187–195.
Добавлено: 9 декабря 2022 г.
Смирнова Е. А., Language Learning in Higher Education 2022 Vol. 12 No. 2 P. 453–475
Добавлено: 7 декабря 2022 г.
Виноградова О. И., Ляшевская О. Н., , in: Text, Speech, and Dialogue. 25th International Conference, TSD 2022, Brno, Czech Republic, September 6–9, 2022, Proceedings Lecture Notes in Computer Science (LNAI), vol. 13502Vol. 13502.: Cham: Springer Publishing Company, 2022. P. 77–88.
Добавлено: 5 октября 2022 г.
Щербакова А. М., В кн.: Межкультурное пространство: лингвистический и дидактический аспекты. Материалы секций "Межкультурная лингвистика", "Межкультурная транслатология" и студенческого научного форума. Пленарное заседание и секция «Межкультурная дидактика».Ч. 2.: Издательство ПетрГУ, 2021.
В статье основное внимание уделяется задаче кластеризации эссе, написанных учащимися, изучающими английский язык в качестве иностранного. Данные были взяты из учебного корпуса REALEC. Разделение текстов по определенным характеристикам может быть полезно для быстрого анализа отдельного корпуса или доступа к нужным разделам большого количества документов. В исследовании обсуждаются не только некоторые существующие подходы к кластеризации текстовых ...
Добавлено: 30 сентября 2021 г.
Выренкова А. С., Смирнов И. Ю., Вестник Новосибирского государственного университета. Серия: Лингвистика и межкультурная коммуникация 2021 Т. 19 № 3 С. 57–68
Учебные корпуса представляют собой один из наиболее ценных источников статистических данных об ошиб-ках учащихся. Например, информация из корпусов учащихся, которые изучают язык как иностранный, ис-пользуется для исследований в области усвоения второго языка [Granger, 1996]. Однако достоверность содер-жащихся в корпусах данных зависит от качества разметки ошибок, которая чаще всего выполняется вручную и, таким образом, представляет собой ...
Добавлено: 24 сентября 2021 г.
Alexander Pugachev, Voronov A., Макаров И. А., , in: Recent Trends in Analysis of Images, Social Networks and Texts. 9th International Conference, AIST 2020, Skolkovo, Moscow, Russia, October 15–16, 2020 Revised Supplementary ProceedingsVol. 12602.: Springer, 2021. Ch. 4 P. 37–51.
In the last years, news agencies have become more influential in various social groups. At the same time, the media industry starts to monetize online distributed articles with contextual advertising. However, the efficiency of online marketing highly depends on the popularity of news articles. In our work, we present an alternative and effective way for ...
Добавлено: 24 марта 2021 г.
Panfilov P., Suleykin A., , in: Resilience in the Digital AgeVol. 12660: Lecture Notes in Computer Science.: Springer, 2021. Ch. 8 P. 139–153.
Добавлено: 5 февраля 2021 г.
Sidorov Nikita, Slastnikov Sergey, Journal of Physics: Conference Series 2021 Vol. 1740 P. 1–6
Добавлено: 2 февраля 2021 г.
Moskvina Anna, Sokolova E., Mitrofanova O., , in: Data Analytics and Management in Data Intensive Domains. Proceedings of the XX International Conference – DAMDID/RCDL’2018, October 9-12, 2018, Moscow.: M.: FRC CSC RAS, 2018. P. 369–372.
Добавлено: 29 сентября 2020 г.
Жукова Л. В., Чугунов В. Р., Кирюшина А. А. и др., В кн.: Actual Problems of System and Software Engineering. Proceedings of the 6th International Conference Actual Problems of System and Software Engineering. Moscow, Russia, 12-14 November, 2019Vol. 2514.: CEUR Workshop Proceedings, 2019. С. 336–346.
Аннотация: в статье предлагается описание подхода к решению задачи структурирования спроса и предложения товаров и услуг. Предлагаемый подход, основанный на использовании методов Data Science, позволит реализовать современный инструментарий контроля за развитием промышленности в г. Москве. Подобный инструментарий дает возможность анализировать большое количество важнейших разнообразных структурированных, не структурированных и слабо структурированных данных из любых открытых источников, ...
Добавлено: 11 декабря 2019 г.
Поспелова К. В., Viklova A., Виноградова О. И., , in: Learner Corpus Conference. LCR 2019. Book of Abstracts.: [б.и.], 2019. P. 0–20.
Добавлено: 10 ноября 2019 г.