?
Подходы к тематическому аннотированию звукозаписей повседневного бытового общения в корпусе "Один речевой день"
Рассматриваются подходы к тематическому аннотированию эпизодов речевой коммуникации корпуса "Один речевой день" (ОРД), который содержит большую коллекцию звукозаписей повседневного бытового общения на русском языке, выполненных в естественных условиях. Тематическое аннотирование материалов корпуса ОРД позволит осуществлять поиск речевого контента по новым параметрам, а также исследовать тематическое разнообразие повседневного речевого общения. Важным требованием к тематическому аннотированию, выдвигаемому при работе с мультимедийным контентом, является сегментация аудиофайлов на фрагменты, относительно однородные по теме разговора. Ставится задача разработки расширенного шаблона многоуровневого аннотирования речевого материала, включающего в себя дополнительные уровни, характеризующие тематику разговоров и эмоциональную окраску речи.