?
Обработка слов с частотными орфографическими ошибками (исследование на базе учебного корпуса английского языка)
Статья посвящена экспериментальному исследованию влияния частотности орфографических ошибок в слове на качество его репрезентации в ментальном лексиконе. Гипотеза о том, что слова, в которых часто совершаются ошибки правописания, затрудняют восприятие при чтении, даже если написаны правильно, ранее была подтверждена для носителей русского и английского языков. Данная работа нацелена на проверку гипотезы на материале учебного корпуса REALEC (Russian Error-Annotated Learner English Corpus), включающего тексты русскоязычных студентов, изучающих английский язык. Из корпуса были отобраны слова, наиболее часто написанные неверно, которые стали материалом для эксперимента на распознавание верных и неверных написаний. При интерпретации результатов оценивалось влияние на успешность распознавания таких факторов, как частотность ошибок, частотность слова в учебном корпусе, энтропия (мера, отражающая количество усилий, затрачиваемых на выбор между вариантами написания) и тип ошибки. Согласно полученным данным, значимыми оказались факторы энтропии и частотности слова в корпусе, что соответствует результатам предыдущих исследований. Значимость показал и конкретный тип ошибки - замена буквы. Особая роль данного типа проявляется в затруднениях, которые ошибки замены вызвали у респондентов при восприятии, и соответствует результатам предшествующих исследований производства письменной речи изучающих английский язык, согласно которым данный тип неверных написаний является самым частотным. Меньшая значимость фактора частотности неверного написания по сравнению с исследованиями на базе родного языка может объясняться различиями в языковой среде: так, изучающие язык реже сталкиваются с неверными написаниями.