• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Лингвистика, математика и крепкое здоровье

16 ноября на отделении деловой и политической журналистики факультета прикладной политологии ГУ-ВШЭ состоялся круглый стол «Чему и как учить компьютерных лингвистов?».

Тема круглого стола связана с подготовкой образовательного профиля по компьютерной лингвистике в рамках филологического бакалавриата, который откроется в Высшей школе экономики в 2011 году.

Технологии автоматического анализа текстовых данных развиваются со стремительной скоростью, специалисты в этой области очень востребованы. Но как «правильно» готовить специалистов по компьютерной лингвистике? Для ответа на этот вопрос организаторы круглого стола пригласили как преподавателей-филологов, так и представителей крупнейших российских компаний, занимающихся разработкой компьютерных лингвистических технологий.

Как отметил директор по лингвистическим исследованиям компании «ABBYY» Владимир Селегей, рынок в этой сфере сформировался недавно, его структура недостаточно ясна, а потому сказать определенно, кто в качестве компьютерного лингвиста лучше выполняет обязанности, нельзя. Очевидно, что такой специалист должен обладать и навыками программирования, и иметь хорошую лингвистическую подготовку. Илья Сегалович, директор по технологии и разработкам компании «Яндекс», рассказал, что в Яндексе позиции программистов и лингвистов разделены. Но существует и другая ситуация. Так, в компаниях «Авикомп» и «ABBYY» есть позиции компьютерных лингвистов, которые занимают люди с лингвистическим образованием. Тем не менее, хороший компьютерный лингвист «должен уметь формализовать языковые данные, построить работающий алгоритм, — лингвистическое ядро должно программироваться лингвистами».

Участники круглого стола обсудили и структуру фундаментального образования, которое требуется специалисту по компьютерной лингвистике. Присутствовавшие сошлись на том, что важно фундаментальное образование по теоретической лингвистике, с одной стороны, и по прикладной математике и программированию, с другой. Однако в отношении деталей того, каким должно быть это образование, мнения участников круглого стола разошлись. К примеру, член-корреспондент Российской академии естественных наук (РАЕН), научный консультант компании «Авикомп» Владимир Хорошевский использовал метафору четырех стульев, на которых должен сидеть будущий компьютерный лингвист: образование по лингвистике, образование по прикладной математике, образование по программированию, а также физическое здоровье и интеллект, которые воспитываются всю жизнь. Звучали и предложения по активной проектной деятельности в рамках образовательного процесса: вместо экзаменов — решение конкретных практических задач. Разные мнения были высказаны и относительно глубины подготовки по лингвистике и программированию. В Западных университетах компьютерная лингвистика является частью «computer science», и вполне достаточно для лингвистической составляющей образования нескольких курсов по лингвистике в дополнение к основному математическому образовательному базису. Но есть университеты, где курсы по автоматической обработке естественного языка читаются и в лингвистических департаментах.

Подводя итоги обсуждения, можно сказать, что это тот самый случай, когда отсутствие результата уже является важным результатом, требующим осмысления. Ни по одной позиции у участников круглого стола не было консолидированного мнения, кроме, пожалуй, общего согласия о рыночной и научной востребованности образования по компьютерной лингвистике. На сегодняшний день никто не понимает ни структуру рынка труда для компьютерных лингвистов, ни то, как их правильно готовить. И это неслучайно — область компьютерной лингвистики сегодня развивается исключительными темпами, и общество не успевает осмыслить требования новой эпохи. Именно поэтому подобные обсуждения должны стать регулярными, круг участников (в первую очередь работодателей) — расширен, а структура образования должна быть сформирована при непременном участии практикующих специалистов.

Анастасия Бонч-Осмоловская, специально для Новостной службы портала ГУ-ВШЭ

Вам также может быть интересно:

«Мы хотели показать, что изучение лингвистики — это актуально и нескучно»

Второй год подряд на конкурсе студенческих проектов факультета гуманитарных наук Вышки побеждает проект выпускников и студентов ВШЭ «Лингвоподкаст». Это серия аудиопрограмм о лингвистике и тех, кто ее изучает, в которых обсуждаются лингвистические исследования, карьерные перспективы, академическая деятельность студентов и выпускников Школы лингвистики. Новый сезон проекта готовится к запуску в ноябре 2023 года.

Разработанную при участии ВШЭ систему «Лингвотест» представили в Нижегородской области

Первую российскую систему сертификации по иностранному языку «Лингвотест» представили в Нижегородской области. Система разработана специалистами Высшей школы экономики совместно с Национальным аккредитационным агентством в сфере образования и Группой компаний «Просвещение», обеспечивающими сертификационную и издательскую поддержку проекта. Нижний Новгород станет первым городом после столицы, где можно будет получить сертификат «Лингвотеста».

Новый онлайн-курс ВШЭ представит язык как энергию

На Национальной платформе открытого образования стартовал новый курс Вышки «Лингвистические подходы к дискурсу». Сколько прилагательных на 1 тысячу слов мы используем в устной речи? Как ударение в слове «дискурс» поделило философов и лингвистов на два лагеря? На эти и другие вопросы отвечают авторы курса — доцент школы лингвистики Алексей Козлов и заведующая Лабораторией по формальным моделям в лингвистике Светлана Толдова.

«Мы еще не выяснили, как устроены языки, но уже утрачиваем 90% их разнообразия»

Почему бабушка и внук могут не понимать друг друга? Зачем лингвистам ехать в Дагестан? Можно ли спасти языки малых народов и русские диалекты? Руководитель Международной лаборатории языковой конвергенции Нина Добрушина ответила на вопросы новостной службы портала.

Как нас правят гаджеты: могут ли девайсы и глобальная сеть заменить справочник по грамматике

Для человека, который хочет изучать язык и его устройство, в сети доступно невероятное количество данных: самые разные тексты на всех возможных языках. Сейчас, например, мы можем не просто посмотреть, как люди употребляют новое слово, но и проследить, когда оно появилось в языке и как со временем меняется его значение. О том, как интернет изменил лингвистику, — в авторской колонке размышляет доцент Школы лингвистики НИУ ВШЭ, преподаватель Школы анализа данных «Яндекса», заведующий сектором теоретической семантики и ведущий научный сотрудник Института русского языка им. В. В. Виноградова РАН Борис Иомдин.

Тест: лихие или роковые

Золотые шестидесятые, лихие девяностые — за каждым десятилетием недавней российской истории закрепилась своя память и устойчивые эпитеты. Самые распространенные из них выделили лингвисты НИУ ВШЭ на выборке из Национального корпуса русского языка. IQ.HSE предлагает по эпитетам определить, о каком времени идет речь.

Нейролирика

В книжной серии журнала «Контекст» вышла первая книга стихов, созданных нейронной сетью. Сборник «Нейролирика» объединил тексты, написанные в стиле поэтов разных эпох, от античности в русском переводе до Серебряного века и современности. Автор эксперимента, доцент Школы лингвистики НИУ ВШЭ Борис Орехов, рассказал IQ.HSE, зачем нужна компьютерная поэзия, и как это работает.

Местные, дистантные и русский

Сто лет назад большинство жителей высокогорного Дагестана владели как минимум двумя языками. Более того, мужчины, помимо знания местных наречий, обычно могли изъясняться еще на трех-четырех иностранных языках. Сегодня же в качестве единственного лингва франка для общения за пределами семьи и родного села дагестанцы используют русский. Причины утраты многоязычия и языковое распределение между гендерами описаны в статье Gendered Multilingualism in highland Daghestan: story of a loss.

Песни на заказ

В 1937 году издательство газеты «Правда» выпустило сборник «Творчество народов СССР». Более чем наполовину он состоял из поэтических переводов с армянского, украинского, казахского и других языков на русский. Эта книга могла продемонстрировать культурное разнообразие СССР, но на практике оказалась примером колониальной гомогенизации. Тому, как это происходило, посвящена статья доцента Школы филологии ВШЭ Елены Земсковой Soviet Folklore as Translation Project.

Сюрреалистический бестиарий «Слова о полку Игореве»

Сравнение переводов одного и того же текста позволяет увидеть то, что сложно транслировать из одной культуры в другую. Доцент Школы лингвистики НИУ ВШЭ Борис Орехов, собравший для своего сайта большинство существующих переводов «Слова о полку Игореве», рассказал IQ.HSE об одной из самых необычных версий «Слова» и о том, как интерпретация образов животных в нем выявляет различия культурных кодов.