Глава
Применение методов компьютерной лингвистики для автоматического анализа образовательных стандартов
В книге
Статья является текстом часового пленарного доклада на открытии 18- международной конференции по автоматической обработке естественных языков (Франция, Университет Монпелье 2, 27 июня – 1 июля 2011 года).
The paper describes the structure and possible applications of the theory of K-representations (knowledge representations) in bioinformatics and in the development of a Semantic Web of a new generation. It is an original theory of designing semantic-syntactic analyzers of natural language (NL) texts with the broad use of formal means for representing input, intermediary, and output data. The current version of the theory is set forth in a monograph by V. Fomichov (Springer, 2010). The first part of the theory is a formal model describing a system consisting of ten operations on conceptual structures. This model defines a new class of formal languages – the class of SK-languages. The broad possibilities of constructing semantic representations of complex discourses pertaining to biology are shown. A new formal approach to developing multilingual algorithms of semantic-syntactic analysis of NL-texts is outlined. This approach is realized by means of a program in the language PYTHON.
Статья посвящена обзору современных тематик и актуальных направлений компьютерной лингвистики на основе анализа материалов одной из конференции в этой области, а именно, 24-ой Международная конференция по компьютерной лингвистике Coling2012. В ней приводится анализ основных подходов и проблемных точек в таких традиционных областях автоматической обработки текста, как автоматический морфологический и синтаксический анализ, машинный перевод и др. Также подробно рассматриваются современные задачи автоматического извлечения информации из текста такие, как извлечение фактов, извлечения мнений, анализ контента на основе привлечения онтологических ресурсов Веба. Делается вывод о том, что для современного уровня развития компьютерной лингвистики характерно вовлечение все более сложных уровней лингвистического анализа в сферу автоматического анализа, применение гибридных подходов в решении задач компьютерной обработки текстов, совмещающих машинное обучение и алгоритмические методы. При этом уровни сложности современных задач обработки текстов, таких как извлечение временной референции в тексте, анализ структуры дискурса и многие другие, требуют активного привлечения экспертных лингвистических знаний.
Расматривается применение функциональной парадигмы в задачах компьютерной лингвистики
Рассматриваются подходы к выделению ключевых слов, необходимых для автоматического извлечения информации о фрейме и его участниках. В частности, на примере фрейма «Ввод новый технологий» исследуется ситуация, когда один и тот же фрейм связан с разными лексическими единицами в разных областях знаний. В работе оценивается вклад общей и специфической лексики в представление фрейма в конкретной предметной области.
Охарактеризованы основные направления исследований в области искусственного интеллекта на материале докладов, представленных на XIII национальной конференции (с международным участием) по искусственному интеллекту.
Сборник включает 78 докладов международной конференции по компьютерной лингвистике и интеллектуальным технологиям «Диалог-2012», представляющих широкий спектр теоретических и прикладных исследований в области описания естественного языка, моделирования языковых процессов, создание практических применимых компьютерных лингвистических технологий.
Для специалистов в области теоретической и прикладной лингвистики и интеллектуальных технологий.
Сборник включает 78 докладов международной конференции по компьютерной лингвистике и интеллектуальным технологиям «Диалог 2012», представляющих широкий спектр теоретических и прикладных исследований в области описания естественного языка, моделирования языковых процессов, создания практически применимых компьютерных лингвистических технологий.
Для специалистов в области теоретической и прикладной лингвистики и интеллектуальных технологий.
В данной статье освящается тема создания вспомогательного информационного ресурса "Лексикатор" для педагогов и студентов, занимающихся обучением и изучением русского языка как иностранного. С этой целью реализован функционал для автоматического выделения сложных сиинтаксических и лексических структур, а так же система оценки сложности текста для чтения по ряду распространенных индексов и собственному индексу "Лексикатора". Ожидается, что разрабатываемый ресурс будет использован для подготовки, определения сложности и анализа учебных текстов в ходе подбора материалов для занятий
В учебном пособии рассматриваются базовые вопросы компьютерной лингвистики: от теории лингвистического и математического моделирования до вариантов технологических решений. Дается лингвистическая интерпретация основных лингвистических объектов и единиц анализа. Приведены сведения, необходимые для создания отдельных подсистем, отвечающих за анализ текстов на естественном языке. Рассматриваются вопросы построения систем классификации и кластеризации текстовых данных, основы фрактальной теории текстовой информации.
Предназначено для студентов и аспирантов высших учебных заведений, работающих в области обработки текстов на естественном языке.