?
Классификация текстов по жанрам при помощи алгоритмов машинного обучения
Научно-техническая информация. Серия 2: Информационные процессы и системы. 2018. № 8. С. 34-38.
Буйлова Н. Н.
В настоящем обзоре была рассмотрена проблема классификации документов по жанрам, выделены основные характеристики текста, используемые для распознавания жанра текста, и описаны наиболее широко применяемые алгоритмы машинного обучения. Рассмотренные методы служат для классификации научных, технических, публицистических и художественных текстов.
Научное направление:
Филология и лингвистика
Приоритетные направления:
гуманитарные науки
Язык:
русский
Толдова С. Ю., Ляшевская О. Н., Вопросы языкознания 2014 № 1 С. 120-145
Статья посвящена обзору современных тематик и актуальных направлений компьютерной лингвистики на основе анализа материалов одной из конференции в этой области, а именно, 24-ой Международная конференция по компьютерной лингвистике Coling2012. В ней приводится анализ основных подходов и проблемных точек в таких традиционных областях автоматической обработки текста, как автоматический морфологический и синтаксический анализ, машинный перевод и др. ...
Добавлено: 15 октября 2013 г.
Работа посвящена исследованию применимости современных методов машинного обучения к задаче автоматической генерации кодов УДК научных статей. В качестве классификаторов рассматриваются такие модели, как искусственные нейронные сети, логистическая регрессия и бустинг. Разработаны графовые алгоритмы и прототип программного модуля для генерации кода УДК. ...
Добавлено: 30 июля 2017 г.
Бонч-Осмоловская А. А., Вопросы языкознания 2016 № 2 С. 100-120
Статья посвящена обзору работ последних лет, в которых теоретическая исследовательская задача решается с помощью методов или инструментов, используемых в компьютерной лингвистике. В обзоре проводится подробный анализ того, как именно с помощью применения того или иного инструмента или метода можно получить новые знания о природе языка. В частности, выделяются два основных направления, развитие которых в рамках ...
Добавлено: 14 апреля 2015 г.
Кибрик А. А., Худякова М. В., Добров Г. Б. и др., Frontiers in Psychology 2016 Vol. 7 No. 1429 P. 1-21
Добавлено: 28 сентября 2016 г.
Фокина М. А., Политическая лингвистика 2014 № 4(50) С. 188-193
Рассматривается специфика блогов политиков в аспекте тематики, коммуникативной цели, образа автора, коммуникативного будущего и языкового оформления, в котором особое внимание уделяется особенностям функционирования прецедентных высказываний. Сделан вывод о необходимости предоставления блогам политиков статуса особой жанровой разновидности. С точки зрения коммуникативной цели в блогах политиков совмещаются информативность и оценочность. Стратегия самопрезентации и создания позитивного политического имиджа ...
Добавлено: 24 октября 2014 г.
Тулякова Н. А., Вестник Ишимского государственного педагогического университета им. П.П. Ершова 2013 № 1 (7) С. 29-35
Статья посвящена выявлению жанрового канона легенды в системе жанров Мамина-Сибиряка. Тексты, вошедшие в сборник «Легенды», сопоставляются с рассказами, занимающими центральное место в творчестве писателя. Выделяются интегральные признаки, объединяющие два жанра, и дифференцирующие, характерные только для легенд. ...
Добавлено: 18 апреля 2013 г.
Монография освещает вопросы применения в лингвистике ряда сквозных технологий, приведенных в Национальной программе «Цифровая экономика Российской Федерации», таких как технологии хранения и анализа больших данных, искусственный интеллект. Извлечение мнений, детектирование эмоций — темы, чрезвычайно востребованные в современных исследованиях, выполняемых на стыке лингвистики и компьютерных наук. В данном издании решается нетривиальная задача — создать модель, которая ...
Добавлено: 30 октября 2022 г.
Association for Computational Linguistics, 2014
Proceedings of the 14th Conference of the European Chapter of the Association for Computational Linguistics held 26–30 April 2014 in Gothenburg, Sweden. ...
Добавлено: 24 октября 2013 г.
Berlin : Association for Computational Linguistics, 2016
Добавлено: 12 ноября 2016 г.
Сметанин С. И., , in : Компьютерная лингвистика и интеллектуальные технологии: по материалам ежегодной международной конференции «Диалог» (Москва, 17–20 июня 2020 г.). Issue 19(26): дополнительный том.: -, 2020. P. 1149-1159.
Добавлено: 30 ноября 2020 г.
Алиева О. В., Schole. Философское антиковедение и классическая традиция 2022 Т. 16 № 2 С. 693-705
В этой статье предпринята попытка эмпирически оценить эффективность метода измерения стилистической разницы, известного как Delta Берроуза, на материале древнегреческого корпуса. Эксперимент с корпусом из четырнадцати (и затем восьми) авторов подтвердил общую эффективность метода. Даже на небольших выборках в 1000–5000 слов решения Delta по большей части корректны, а ее ошибки связаны в основном с текстами, близкими ...
Добавлено: 9 февраля 2022 г.
Алиева О. В., Аристей. Aristeas: Вестник классической филологии и античной истории 2022 Т. 25 С. 19-37
В статье рассматривается возможность количественного измерения стилистической неоднородности текстов на материале Платоновского корпуса с применением метода измерения стилистической разницы, известного как Delta Берроуза. Автор приходит к выводу, что использование для машинной классификации ограниченного числа авторских профилей, соотносимых с заведомо известными или предполагаемыми колебаниями авторского стиля, малоинформативно. Вместо этого предлагается использование шорт-листов на отрезках разной длины, ...
Добавлено: 15 декабря 2021 г.
Выренкова А. С., Смирнов И. Ю., Вестник Новосибирского государственного университета. Серия: Лингвистика и межкультурная коммуникация 2021 Т. 19 № 3 С. 57-68
Учебные корпуса представляют собой один из наиболее ценных источников статистических данных об ошиб-ках учащихся. Например, информация из корпусов учащихся, которые изучают язык как иностранный, ис-пользуется для исследований в области усвоения второго языка [Granger, 1996]. Однако достоверность содер-жащихся в корпусах данных зависит от качества разметки ошибок, которая чаще всего выполняется вручную и, таким образом, представляет собой ...
Добавлено: 24 сентября 2021 г.
Braslavski P., Karpov Nikolay, Worring M. и др., ACM SIGIR Forum 2014 Vol. 48 No. 2 P. 105-110
Статья содержит отчет по проведении 8-й Российской летней школы по информационному поиску (The 8th Russian Summer School in Information Retrieval (RuSSIR 2014)). ...
Добавлено: 22 августа 2015 г.
Кузнецов И. О., Научно-техническая информация. Серия 2: Информационные процессы и системы 2012 № 12
Представлен краткий обзор теоретических и практических моделей, используемых при решении задачи автоматической разметки семантических актантов.Рассматривается понятие семантической роли и место этого конструкта в общей языковой системе, проблема составления ролевых инвентарей, а также различные аспекты реализации автоматической разметки актантов с помощью алгоритмов машинного обучения. Также рассматривается ряд проблем, связанных сэтой областью, в частности, проблема «языкозависимости» современных ...
Добавлено: 23 декабря 2013 г.
В статье приведен отчет о проведении 9-ой Российской летней школы по информационному поиску 9th Russian Summer School in Information Retrieval (RuSSIR 2015). ...
Добавлено: 27 февраля 2017 г.
Малафеев А. Ю., Николаев К. И., , in : Analysis of Images, Social Networks and Texts. 8th International Conference, AIST 2019, Kazan, Russia, July 17–19, 2019, Revised Selected Papers. Communications in Computer and Information Science. Vol. 1086.: Springer, 2020. P. 154-159.
В статье проводится исследование методов глубокого обучения для решения новой задачи многоклассовой классификации текстов, а именно определения интересов пользователей с помощью текстовых сообщений. Мы использовали оригинальный набор данных из почти 90 тысяч текстовых сообщений с форумов, размеченных по десяти интересам. Мы экспериментировали с различными современными архитектурами нейронных сетей: рекуррентными и сверточными, а также с более простыми сетями с прямой связью. ...
Добавлено: 7 ноября 2019 г.
Sergey Smetanin, Mathematics 2022 Vol. 10 No. 16 Article 2947
Добавлено: 15 августа 2022 г.
Лаврова А. А., Вестник Воронежского государственного университета. Серия: Лингвистика и межкультурная коммуникация 2013 № 1 С. 134-139
В статье рассматриваются конструкции с обрывом синтаксического целого в предвыборных теледебатах. На основе сопоставительного анализа конструкций с обрывом и другими разновидностям разрыва синтаксического целого, реализуемых в предвыборных теледебатах и аффективной речи, выявляются корреляции между синтаксическими характеристиками речи и собственно эмоциональной и псевдоэмоциональной составляющими эмоционального компонента воздействующей политической речи. ...
Добавлено: 6 октября 2012 г.
Потсар А. Н., Медиаскоп 2012 № 1
Российское медиапространство продолжает обновляться как в технологическом, так и в речевом отношении. Под влиянием публичной политики, осуществляемой в значительной степени через масс-медиа, трансформируется жанр колонки. Для непрофессионального колумниста общественное положение оказывается важнее его речевых навыков и соответствия законам жанра. Проведенный в статье анализ показывает, что действующие политики используют колонку в СМИ в прагматических целях, и ...
Добавлено: 15 марта 2013 г.
Левченко Я. С., Новое литературное обозрение 2014 Т. 128 № 4 С. 125-143
В статье рассматриваются превращения, которые претерпевает теория русского формализма после его провозглашенной отмены в 1930 г., когда лидер движения Виктор Шкловский выступил с одиозной статьей "Памятник научной ошибке". Есть авторитетное мнение (от Ричарда Шелдона до Александра Галушкина), что статья была, скорее, отвлекающим маневром, позволившему формалистам не раскаиваться в своих прежних достижениях. Автор настоящей работы настаивает, ...
Добавлено: 6 мая 2014 г.
Найденова К., Игнатов Д. И., Hershey : IGI Global, 2012
The consideration of symbolic machine learning algorithms as an entire class will make it possible, in the future, to generate algorithms, with the aid of some parameters, depending on the initial users’ requirements and the quality of solving targeted problems in domain applications.
Diagnostic Test Approaches to Machine Learning and Commonsense Reasoning Systems surveys, analyzes, and ...
Добавлено: 3 декабря 2012 г.
Хотинская А. И., Вопросы филологических наук 2005 № 4 С. 62-68
Исследование проблемы «Дж. Ш. Ле Фаню и английский сенсационный роман» - с привлечением культурного контекста, в котором сформировался английский сенсационный роман, его восприятия викторианской критикой, а также материала по викторианским периодическим журналам, в которых публиковались сенсационные романы. ...
Добавлено: 16 декабря 2012 г.
Алиева О. В., Вестник Православного Свято-Тихоновского гуманитарного университета. Серия 3: Филология 2011 № 3 (25) С. 23-36
В статье уточняется термин «паренеза» (греч. παραίνεσις), служащий в последние годы предметом многочисленных дискуссий специалистов по библеистике и раннехристианской литературе на Западе. Опираясь на античную философскую и риторическую традицию практического морального наставления, автор выделяет формальные признаки паренезы. Особо рассматривается вопрос о трансформации паренетического канона, заданного Исократом и разработанного стоиками, под влиянием сакральных текстов (Пифагора у ...
Добавлено: 1 апреля 2013 г.