?
Тематическая разметка антропологического корпуса: методика классификации шахтерских нарративов
В статье излагается методика создания антропологического корпуса текстов, объединенных
принадлежностью к шахтерской профессии. Содержание работы коррелирует с тремя исследовательскими
задачами: разработкой тематической классификации, введением условных обозначений для выделения нарратива в тексте, определением принципов организации корпуса по тематике нарративов. Тематическая классификация нарративов стала результатом анализа нескольких «контрольных» текстов. Она представляет собой ступенчатую систематизацию культурно-профессиональной тематики, поскольку, помимо основных (базовых) тем, может быть проведена их внутренняя детализация, что приводит к появлению микротем. Количество таких микротем может быть различным и определяется спецификой самой темы, т. е. возможностью характеризовать соответствующее явление действительности с различных сторон. Фрагменты текста, в которых реализуется та или иная тема или подтема, выделяются квадратными скобками, по обе стороны от которых указываются цифровые обозначения соответствующей темы/подтемы из приведенной ранее тематической классификации. При тематической разметке выдерживаются принципы соответствия нарратива основной теме корпуса, незавершенности тематической классификации, цельности нарратива, нежесткой разметки, учета «нулевых» тем. В статье описываются частные проблемы разметки, когда та или иная тема не разворачивается информантом, притом что контекст допускает различную трактовку темы нарратива. В подобных ситуациях в ходе процесса разметки отделяется целенаправленно репрезентируемая информантом тематика от фактов, которые могут иметь лишь косвенное отношение к какой-либо теме, но могут и не иметь такового. Таким образом, описанная методика представляет собой первый подход к разработке стандарта метаразметки. Применяемый тип разметки по специфике предметной информации можно назвать экстралингвистическим, по способу выявления – аналитическим, по объекту – нарративным, по глубине классификации – многоуровневым, по способу присвоения меток – ручным, по соотношению с определенной теорией – нейтральным.