Статья
Российско-французский семинар «Текстометрия и корпусы русских текстов»
Дается обзор проектов, представленных на российско-французском семинаре «TXM и корпусы русских текстов», прошедшем в Лионе в июне 2015 г. Обсуждаются теоретические и прикладные проблемы создания информационных ресурсов в области истории, политологии и лингвистики на основе российских и французских исторических источников. Описаны возможности платформы TXM (TeXtoMetrie) для исследований в области цифровой гуманитаристики (digital humanities), среди которых инструменты анализа текстов, построение конкордансов, поиск мотивов, частотные словари, различные статистические функции, классификации, анализ совместной встречаемости
Статья является текстом часового пленарного доклада на открытии 18- международной конференции по автоматической обработке естественных языков (Франция, Университет Монпелье 2, 27 июня – 1 июля 2011 года).
The paper describes the structure and possible applications of the theory of K-representations (knowledge representations) in bioinformatics and in the development of a Semantic Web of a new generation. It is an original theory of designing semantic-syntactic analyzers of natural language (NL) texts with the broad use of formal means for representing input, intermediary, and output data. The current version of the theory is set forth in a monograph by V. Fomichov (Springer, 2010). The first part of the theory is a formal model describing a system consisting of ten operations on conceptual structures. This model defines a new class of formal languages – the class of SK-languages. The broad possibilities of constructing semantic representations of complex discourses pertaining to biology are shown. A new formal approach to developing multilingual algorithms of semantic-syntactic analysis of NL-texts is outlined. This approach is realized by means of a program in the language PYTHON.
Рассматриваются подходы к выделению ключевых слов, необходимых для автоматического извлечения информации о фрейме и его участниках. В частности, на примере фрейма «Ввод новый технологий» исследуется ситуация, когда один и тот же фрейм связан с разными лексическими единицами в разных областях знаний. В работе оценивается вклад общей и специфической лексики в представление фрейма в конкретной предметной области.
Охарактеризованы основные направления исследований в области искусственного интеллекта на материале докладов, представленных на XIII национальной конференции (с международным участием) по искусственному интеллекту.
Сборник включает 78 докладов международной конференции по компьютерной лингвистике и интеллектуальным технологиям «Диалог-2012», представляющих широкий спектр теоретических и прикладных исследований в области описания естественного языка, моделирования языковых процессов, создание практических применимых компьютерных лингвистических технологий.
Для специалистов в области теоретической и прикладной лингвистики и интеллектуальных технологий.
В учебном пособии рассматриваются базовые вопросы компьютерной лингвистики: от теории лингвистического и математического моделирования до вариантов технологических решений. Дается лингвистическая интерпретация основных лингвистических объектов и единиц анализа. Приведены сведения, необходимые для создания отдельных подсистем, отвечающих за анализ текстов на естественном языке. Рассматриваются вопросы построения систем классификации и кластеризации текстовых данных, основы фрактальной теории текстовой информации.
Предназначено для студентов и аспирантов высших учебных заведений, работающих в области обработки текстов на естественном языке.
В данной статье освящается тема создания вспомогательного информационного ресурса "Лексикатор" для педагогов и студентов, занимающихся обучением и изучением русского языка как иностранного. С этой целью реализован функционал для автоматического выделения сложных сиинтаксических и лексических структур, а так же система оценки сложности текста для чтения по ряду распространенных индексов и собственному индексу "Лексикатора". Ожидается, что разрабатываемый ресурс будет использован для подготовки, определения сложности и анализа учебных текстов в ходе подбора материалов для занятий
Статья посвящена обзору современных тематик и актуальных направлений компьютерной лингвистики на основе анализа материалов одной из конференции в этой области, а именно, 24-ой Международная конференция по компьютерной лингвистике Coling2012. В ней приводится анализ основных подходов и проблемных точек в таких традиционных областях автоматической обработки текста, как автоматический морфологический и синтаксический анализ, машинный перевод и др. Также подробно рассматриваются современные задачи автоматического извлечения информации из текста такие, как извлечение фактов, извлечения мнений, анализ контента на основе привлечения онтологических ресурсов Веба. Делается вывод о том, что для современного уровня развития компьютерной лингвистики характерно вовлечение все более сложных уровней лингвистического анализа в сферу автоматического анализа, применение гибридных подходов в решении задач компьютерной обработки текстов, совмещающих машинное обучение и алгоритмические методы. При этом уровни сложности современных задач обработки текстов, таких как извлечение временной референции в тексте, анализ структуры дискурса и многие другие, требуют активного привлечения экспертных лингвистических знаний.
Сборник включает 78 докладов международной конференции по компьютерной лингвистике и интеллектуальным технологиям «Диалог 2012», представляющих широкий спектр теоретических и прикладных исследований в области описания естественного языка, моделирования языковых процессов, создания практически применимых компьютерных лингвистических технологий.
Для специалистов в области теоретической и прикладной лингвистики и интеллектуальных технологий.
Анализ современного общества, пронизанного медиа, ведется с позиций этнометодологического подхода и представляет собой попытку ответа на кардинальный вопрос: что представляют собой наблюдаемые упорядоченности событий, транслируемых массовыми посредниками. Исследование ритуалов идет по двум основным направлениям: во-первых, в организационно-производственной системе медиа, ориентированной на постоянное воспроизводство, в основе которого лежит трансмиссионная модель и различение информация/неинформация и, во-вторых, в анализе восприятия этих сообщений аудиторией, представляющей собой реализацию ритуальной, или экспрессивной, модели, результатом которой является разделенный опыт. Это и означает ритуальный характер современных медиа.
В данной научной работе использованы результаты, полученные в ходе выполнения проекта № 10-01-0009 «Медиаритуалы», реализованного в рамках Программы «Научный фонд НИУ ВШЭ» в 2010-2012 гг.
Представлены результаты кросскультурного исследования взаимосвязи социального капитала и экономических представлений у русских (N=150) и китайцев (N=105). Выявлены различия в социальном капитале и экономических представлениях русских и китайцев. В обеих группах социальный капитал позитивно взаимосвязан с «продуктивными» экономическими представлениями и большинство взаимосвязей схожи по своей логике, однако существуют и культурная специфика.
В данной работе рассматривается пятое уравнение Пенлеве, которое имеет 4 комплексных параметра α, β, γ, δ. Методами степенной геометрии ищутся асимптотические разложения его решений при x → ∞. При α≠0 найдено 10 степенных разложений с двумя экспоненциальными добавками каждое. Шесть из них - по целым степеням x (они были известны), и четыре по полуцелым (они новые). При α=0 найдено 4 однопараметрических семейства экспоненциальных асимптотик y(x) и 3 однопараметрических семейства сложных разложений x=x(y). Все экспоненциальные добавки, экспоненциальные асимптотики и сложные разложения найдены впервые. Также уточнена техника вычисления экспоненциальных добавок.
Я выписываю точную формулу для (теоретико-множественной) системы результантов как набора коэффициентов одного результанта.