• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Глава

Илья Сегалович и развитие идей компьютерной лингвистики в Яндексе

Зеленков Ю., Зобнин А.И., Маслов М., Титов В.

В статье рассматриваются наиболее важные и интересные лингвистические проекты, в которых участвовал и которыми руководил Илья Сегалович (1964–2013), один из создателей поисковой системы Яндекс. Среди этих проектов: разработка морфологического анализа и синтеза русских слов, позволяющего обрабатывать «новые» слова, не включенные в словарь; снятие морфологической омонимии для русского языка с помощью нормализующих подстановок; практическая транскрипция иностранной собственной и нарицательной лексики; автоматическая расстановка ударений и анализ поэтических текстов; создание эффективных методов распознавания нечетких дубликатов для текстовых документов; разработка информационно-справочной системы «Национальный корпус русского языка» и др. Описываются ключевые идеи и подходы, связанные с поиском решений сложных лингвистических задач и рассказывается о роли Ильи в изобретении этих подходов и их дальнейшем развитии. Приводятся примеры нетривиальных лингвистических алгоритмов, созданных Ильей вместе с коллегами.