?
Одни ошибки вреднее других: роль типа и частотности орфографических ошибок в обработке слов
В последние годы в сети Интернет многократно возросло количество текстов, не подвергающихся
редактуре и корректуре. Это записи в социальных сетях, чатах, форумах, статьи ряда электронных
СМИ. В них часто попадаются слова с орфографическими ошибками. Соответственно, общее количество ошибочных написаний, с которыми нам приходится сталкиваться, также возрастает.
Как показывают многочисленные исследования, орфографические нормы осваиваются и закрепляются в процессе чтения (например, Andrews, Hersch, 2010; Hersch, Andrews, 2012). Следовательно, часто встречающиеся ошибки оказывают непосредственное влияние на репрезентацию
слов в ментальном лексиконе носителя языка. Ошибочные написания фиксируются в памяти и
1
Компьютерная лингвистика и интеллектуальные технологии:
по материалам международной конференции «Диалог 2022»
Москва, 15–18 июня 2022 г.
получают подкрепление каждый раз, когда мы сталкиваемся с ними снова, доля встретившихся
нам верных написаний при этом снижается, и неправильный вариант закрепляется в ментальном
лексиконе наряду с верным (Perfetti, Hart, 2002).
В соответствии с моделями дискриминативного научения (Baayen et al., 2011; Ramscar et al.,
2010; Ramscar et al., 2013; Rescorla, Wagner, 1972), связь между сигналом и его значением ослабевает, если на то же значение указывает также и другой сигнал. Это в свою очередь снижает так
называемое лексическое качество слова (Perfetti, 1985; 2007; Nelson et al., 2016; Perfetti, Hart,
2001). Таким образом гипотеза лексического качества объясняет, как неправильные варианты
написания слова могут существенно повлиять на его репрезентацию в ментальном лексиконе,
даже если они заметно менее частотны, чем правильное.
Эта гипотеза изначально использовалась для того, чтобы объяснить, в каких словах мы чаще
допускаем орфографические ошибки. Однако С. Рахманьян и В. Куперман предположили, что
более низкое лексическое качество будет влиять и на обработку (Rahmanian, Kuperman, 2019).
Они показали на материале английского языка, что слова, в которых часто встречаются ошибки,
при прочих равных читаются медленнее, чем слова, в которых ошибки редки (в исследовании все
слова фигурировали в правильном написании). Аналогичные результаты были затем получены
на материале языков с различными типами орфографии: греческого, финского, иврита, китайского (Kuperman et al. 2021). В отдельном исследовании эта гипотеза была подтверждена на материале русского языка (Чернова и др., 2020).
В этой статье также было показано, что частотность неправильных написаний влияет на скорость и точность в задании на определение орфографической правильности (где половина слов
предъявляется в неправильном написании). Этот результат можно считать более ожидаемым, чем
выводы экспериментов о скорости прочтения слов в правильном написании, но он окажется важным для дальнейшей дискуссии. Кроме того, Чернова с коллегами показали интересные корреляции между результатами экспериментов, использующих разные методики.
Однако в этих работах не ставился вопрос о том, влияет ли на эти процессы тип орфограммы.
Русский язык оптимально подходит для исследования этой проблемы, так как носители русского
регулярно допускают ошибки разных типов: выбирают не ту гласную в безударном слоге, сомневаются, писать одну согласную или две и так далее. Можно ли утверждать, что все эти ошибки
одинаково легко — или одинаково трудно — заметить, и важна только относительная частотность
неправильных написаний, исследованная в статье (Чернова и др., 2020)? Или же тип орфограммы — отдельный фактор, возможно, даже более сильный, чем частотность? Ответу на этот
вопрос посвящен наш первый эксперимент, в котором мы анализировали скорость и точность в
задании на определение орфографической правильности. Во втором эксперименте исследовалось, влияет ли тип ошибки на скорость чтения слов в правильном написании