Глава
Двусложные сравнительные союзы в русской поэзии
В статье анализируется употребление двусложных сравнительных союзов будто, словно и точно у 15 русских поэтов в тех позициях, где эти слова метрически взаимозаменяемы. Показано, что частота этих союзов возрастает после окончания золотого века русской поэзии (1-я треть XIX века). Если в начале XIX века на роль основного двусложного союза претендует союз будто, то в последу- ющие эпохи он отходит на второй план, уступая место союзам точно и словно, чья употребительность варьирует в зависимости от стили- стических предпочтений конкретного автора.
В книге
Представленный ниже материал продолжает ряд статей автора, посвященных исследованию вопроса о тенденциях эволюции языковых единиц на различных сегментных уровнях современного английского языка. Однако же в то время как предыдущие исследования автора фокусировались на изменениях, происходящих на морфематическом и фразематическом (денотативном) уровнях языка, представленные ниже данные касаются вопроса преобразований языковых форм на уровне пропозем (уровне предложений), продолжая линию исследований перестройки синтаксического строя.
В статье обсуждается использование Национального корпуса русского языка для социолингвистических исследований. Предлагается использовать имеющуюся в Устном корпусе разметку по полу говорящего в качестве основы для статистического анализа различий между речью мужчин и женщин. Подробно обсуждаются результаты одного направления анализа — сравнительная длина высказываний (реплик) мужчин и женщин, измеренная в количестве словоформ. Обнаружена статистическая значимость различий по этому параметру между мужчинами и женщинами в публичной коммуникации — мужчины говорят больше женщин — при отсутствии статистически значимых различий в частной коммуникации. Также значимым оказывается пол адресата, причем корреляция снова носит существенно разный характер в подкорпусе публичной и частной речи. В частной коммуникации реплики говорящего оказываются несколько длиннее в разговоре с человеком того же пола; в публичной коммуникации реплики говорящего оказываются существенно длиннее при обращении к женщине, чем к мужчине, вне зависимости от пола говорящего. Эти выводы хорошо согласуются с результатами гендерных исследований в западной социолингвистике: различия между мужской и женской речью не абсолютны, но зависят от ситуации общения; публичный дискурс является ареной языкового соревнования, в котором преимущество остается за мужчинами, в то время как в частной коммуникации соревновательность исчезает.
Представлены четыре электронных корпуса, созданные в 2011 г. в рамках Программы фундаментальных исследований РАН «Корпусная лингвистика»: албанский, калмыцкий, лезгинский и осетинский. Даётся описание интерфейса и функциональности этих корпусов, освещаются технические вопросы, которые пришлось решать при их создании, обсуждаются перспективы их развития. Особое внимание уделяется вопросам составления грамматических словарей и автоматической грамматической разметки корпусов.
В данной работе рассматриваются сравнительные конструкции типа Вася толстый, как шар или Вася продолжал стоять на месте, как будто ничего не случилось (в первом случае по некоторому признаку сравниваются предметы, а во втором – ситуации). Для более глубокого анализа семантики подобных конструкций в русском языке в статье используются данные французского языка, в частности описываются конструкции с comme и comme si. В результате сравнения оказалось, что семантически русские и французские сравнительные конструкции весьма близки. Однако их синтаксические свойства вовсе не тождественны.
В работе дается оценка алгоритма лемматизации несловарных словоформ (единиц текста, которые словарно-ориентированный морфологический анализатор не может вывести из данных исходного словаря). Представленный алгоритм устанавливает парадигматические отношения внутри массива словоформ, подбирая оптимальное членение словоформы на псевдооснову и псевдоокончание. Показано, что соединение методов простой и сложной кластеризации эффективно для морфологического пост–процессинга больших объемов текста.
Сборник трудов XII Казанской школы-семинара TEL'2012 «Корпусы национальных языков: модели и технологии», прошедшей 25-28 января 2012 г. в Казани.
Данная статья посвящена использованию корпусных данных в исследовании дискурсивных характеристик наименования человека в английском языке. На примере анализа конкретной группы английских синонимов, указывающих на человека human being, man, person, personality, individual, раскрываются некоторые возможности, предоставляемые лексикографическими корпусами для дискурсивных исследований