• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • A
  • A
  • A
  • A
  • A
Обычная версия сайта
  • RU
  • EN
  • Национальный исследовательский университет «Высшая школа экономики»
  • Публикации ВШЭ
  • Статьи
  • Positional skipgrams for Bambara: a resource for corpus-based studies
  • RU
  • EN
Расширенный поиск
Высшая школа экономики
Национальный исследовательский университет
Приоритетные направления
  • бизнес-информатика
  • государственное и муниципальное управление
  • гуманитарные науки
  • инженерные науки
  • компьютерно-математическое
  • математика
  • менеджмент
  • право
  • социология
  • экономика
по году
  • 2027
  • 2026
  • 2025
  • 2024
  • 2023
  • 2022
  • 2021
  • 2020
  • 2019
  • 2018
  • 2017
  • 2016
  • 2015
  • 2014
  • 2013
  • 2012
  • 2011
  • 2010
  • 2009
  • 2008
  • 2007
  • 2006
  • 2005
  • 2004
  • 2003
  • 2002
  • 2001
  • 2000
  • 1999
  • 1998
  • 1997
  • 1996
  • 1995
  • 1994
  • 1993
  • 1992
  • 1991
  • 1990
  • 1989
  • 1988
  • 1987
  • 1986
  • 1985
  • 1984
  • 1983
  • 1982
  • 1981
  • 1980
  • 1979
  • 1978
  • 1977
  • 1976
  • 1975
  • 1974
  • 1973
  • 1972
  • 1971
  • 1970
  • 1969
  • 1968
  • 1967
  • 1966
  • 1965
  • 1964
  • 1963
  • 1958
  • еще
Тематика
Новости
19 мая 2026 г.
Физики НИУ ВШЭ выяснили, что происходит внутри устойчивого вихря
В атмосфере и в океане часто наблюдаются крупные вихри с характерными спиральными рукавами. Физики из НИУ ВШЭ объяснили, как они формируются и почему сохраняют свою структуру. Оказалось, что скорости в точках, расположенных вдоль одной дуги вихря, остаются связанными даже на больших расстояниях. При этом в направлении от центра вихря эта связь быстро ослабевает. Такие различия помогают объяснить образование рукавов и могут улучшить модели атмосферных и океанических течений. Результаты опубликованы в Physical Review Fluids.
18 мая 2026 г.
В Вышке прошла XXX юбилейная научно-техническая конференция имени Е.В. Арменского
Организатором научного события выступает Московский институт электроники и математики им. А.Н. Тихонова ВШЭ. В этом году главный инженерный студенческий форум проходил 30-й раз и собрал рекордное число участников. Студенты, аспиранты и молодые специалисты из 50 вузов и организаций России представили научно-исследовательские доклады в ИТ-области. Отдельная секция была посвящена научно-исследовательским работам школьников.
15 мая 2026 г.
В НИУ ВШЭ разрабатывают нейросеть для сферы науки и инноваций
Исследователи НИУ ВШЭ учат большие языковые модели понимать русскоязычную научную терминологию, увеличивая при этом их энергоэффективность. Адаптированная модель работает в 2,7 раза быстрее и требует на 73% меньше памяти, чем исходная открытая модель, что позволяет запускать ее на более доступном оборудовании. Программа прошла государственную регистрацию.

 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!

Публикации
  • Книги
  • Статьи
  • Главы в книгах
  • Препринты
  • Верификация публикаций
  • Расширенный поиск
  • Правила использования материалов
  • Наука в ВШЭ

?

Positional skipgrams for Bambara: a resource for corpus-based studies

Mandenkan. 2019. No. 62. P. 165–183.
Маслинский К. А.

В статье представлен новый доступный онлайн набор данных: корпус н‑грамм слов на основе подкорпуса со снятой омонимией Справочного корпуса бамана. В наборе данных представлены частотные списки позиционных скип-грамм, в которых отражена информация о совместной встречаемости лексем с грамматическими категориями на различных относительных позициях в тексте. Данный тип н‑грамм разработан для того, чтобы более полно отразить лингвистическую информацию, содержащуюся в морфологически аннотированном корпусе бамана. В статье обсуждается методология подготовки корпуса н‑грамм для бамана и представлено несколько кратких иллюстративных примеров использования данных о частотности позиционных скип-грамм в корпусных лингвистических исследованиях.

Научное направление: Филология и лингвистика
Язык: английский
Полный текст
DOI
Текст на другом сайте
Ключевые слова: open datacorpusоткрытые данныевеб-корпусбаманаBambara
Похожие публикации
КОГНИТИВНО-АССОЦИАТИВНОЕ ПОЛЕ ОНИМОВ САНКТ-ПЕТЕРБУРГА И ВЕНЫ
Зелинская Ю. Ю., Когнитивные исследования языка 2025 № 4(65) С. 180–186
Статья посвящена исследованию онима как когнитивного стимула, способствующего декодированию языка городского пространства двух этносов. Основу исследования составляет анализ результатов ономастического ассоциативного эксперимента, целью которого было выявление доминирующих типов ассоциативных реакций на антропонимы, ойкодонимы, годонимы и ресторонимы Санкт-Петербурга и Вены. Выявленные реакции отображают сформированный ментальный ономастикон респондентов. ...
Добавлено: 16 мая 2026 г.
Лично-числовая асимметрия: согласование пассивных миративов в казымском диалекте хантыйского языка
Старченко А. М., Толдова С. Ю., Типология морфосинтаксических параметров 2023 Т. 6 № 1 С. 130–148
Работа рассматривает ранее не засвидетельствованную модель расщеплённого согласования в парадигме миратива в казымском диалекте хантыйского языка. Расщеплённое согласование выявляется при сравнении активной и пассивной миративных конструкций, а также в ограниченном наборе употреблений нефинитных форм и выражается в том, что в пассивном залоге, в отличие от активного, 3 лицо немаркировано — наблюдается согласование только по числу. ...
Добавлено: 14 мая 2026 г.
Глаголы перемещения веществ в славянских языках
Федоров Д. Г., Jezikoslovni Zapiski 2026 № 32(1) С. 23–52
В статье описываются глаголы перемещения жидких и сухих веществ в славянских языках. В ходе работы рассматривается, как славянские языки лексикализуют различные ситуации в рамках семантического поля перемещения веществ, и выделяются параметры которые определяют эту лексикализацию (напр., тип вещества, интенсивность и квантованность потока, каузация). Смежные грамматические явления, такие как мена диатезы и лабильность, также играют роль ...
Добавлено: 13 мая 2026 г.
Образ женщины сквозь года: диахронический анализ репрезентации женщин в российской агитационной рекламе
Габриелова Е. В., Максименко О. И., Социальные и гуманитарные науки на Дальнем Востоке 2026 Т. 23 № 1 С. 241–249
В статье представлен диахронический анализ репрезентации женщины в российской рекламе на материале агитационных плакатов 1917 - 1990 годов и социальных и мотивационных рекламных материалов 2000 - 2020 годов. Целью исследования является выявление эволюции вербальных и визуальных стратегий конструирования женского образа в контексте изменений социально-политической и культурной среды, в основу которых легла память поколений. В теоретической ...
Добавлено: 13 мая 2026 г.
Proceedings of the 9th Student Research Workshop associated with the International Conference Recent Advances in Natural Language Processing
Velichkov B., Nikolova-Koleva I., Slavcheva M., Shumen: INCOMA Ltd, 2025.
Добавлено: 12 мая 2026 г.
«Плоский мир» Т. Пратчетта глазами русскоязычного фандома
Кульков А. Н., Цветкова М. В., Вестник Томского государственного университета. Филология 2026 № 100 С. 158–173
Впервые делается попытка рассмотреть особенности фанфикшн как акта продуктивной рецепции, возникшего на основе цикла романов Терри Пратчетта о Плоском мире в России. Проведенный анализ показывает, что прежде всего авторы фанфиков стремятся передать стилистику и комическое начало оригинального цикла Пратчетта, вне зависимости от жанра и формата создаваемых ими произведений. Фикрайтеры наиболее часто обращаются к таким форматам, ...
Добавлено: 10 мая 2026 г.
Вселенная Достоевского
Першкина А. Н., М.: Альпина нон-фикшн, 2026.
Филолог Анастасия Першкина рассказывает о том, как писатель создавал свой мир, кем его населил, какие законы установил и почему этот мир так ярко действует на нас. Кроме того, вы узнаете, кто помогал Федору Михайловичу работать, как писатель связывал между собой произведения, что думали о его текстах современники и что же такое достоевщина. ...
Добавлено: 6 мая 2026 г.
The hypothesis of dependence of the lexical nature of mixed languages on the patterns of their emergence
Гриднева Е. М., Vestnik Tomskogo Gosudarstvennogo Universiteta, Filologiya 2026 No. 100 P. 38–52
Добавлено: 6 мая 2026 г.
Арест писателя Гюнтера Хофе на франкфуртской книжной ярмарке в 1963 г.: конкурирующие образы в медийном пространстве ГДР и ФРГ
Керимов Р. Э., Новое прошлое 2026 № 1 С. 148–162
Арест восточногерманского писателя и директора издательства Гюнтера Хофе на Франкфуртской книжной ярмарке 1963 г. стал уникальным эпизодом идеологической конфронтации между ГДР и ФРГ. Гюнтер Хофе в первую очередь известен своей документально-художественной трилогией про Вторую мировую войну, в которой он принимал активное участие как солдат вермахта. Анализ ареста писателя проводится на основе газетных материалов ГДР и ФРГ, а ...
Добавлено: 5 мая 2026 г.
Семантический ореол сакрального в четырехстопном амфибрахии: механизмы культурной памяти в поэзии Ольги Седаковой
Максимов И. В., Новый филологический вестник 2025 Т. 73 № 2 С. 187–196
Большинство исследований, посвященных метрической составляющей поэзии Ольги Седаковой, сосредоточены на формальных аспектах стихосложения и редко затрагивают содержательные возможности выбранных метров. Настоящая работа восполняет этот пробел, предлагая анализ единого сюжета четырехстопного амфибрахия, который прослеживается в русской поэзии от В.А. Жуковского до О.А. Седаковой. В центре исследования – филологический труд Седаковой «Четырехстопный амфибрахий или “Чудо” Пастернака в ...
Добавлено: 5 мая 2026 г.
Кубанская стела (Musée des Beaux Arts Grenoble, Collection égyptienne, inv. 1937, 1969, 3565)
Крол А. А., Кузнецов Д. А., Ладынин И. А., Восток. Афро-азиатские общества: история и современность 2026 Т. 1 С. 244–261
В публикации представлены новый перевод и комментарий текста Кубанской стелы Рамсеса II (Musée des beaux arts Grenoble, Collection égyptienne, inv. 1937, 1969, 3565). Данный памятник относится к началу его царствования (ок. 1287 г. до н.э.), был найден у развалин крепости Баки рядом с нубийским селением Кубан (отсюда название) и связан с организацией в этом районе добычи золота. ...
Добавлено: 5 мая 2026 г.
Царь Рамсес и Бактрия. Об одном мотиве позднеегипетского историописания
Ладынин И. А., Вестник древней истории 2024 Т. 84 № 1 С. 5–26
В статье рассматривается комплекс сообщений античной традиции, в которых идет речь о завоевании или о попытке завоевания египтянами Бактрии (Diod. I. 46–47; Tac. Ann. II. 60. 3; Strabo XVII. 1. 46), сообщение Манефона Севеннитского о широких завоеваниях царя Сетоса-Рамессеса (I) (Manetho. Frg. 50 = Ios. C.Ap. I. 15. § 98–102), а также текст иероглифической «Стелы ...
Добавлено: 5 мая 2026 г.
Big Data как актив: задачи правового обеспечения оборота данных средствами публичного права
Лескина Э. И., Законодательство 2026 № 2 С. 22–29
Одним из признаков больших данных является ценность, что вытекает из сущности современного этапа развития общества, значения информации и данных. Однако без правового обеспечения экономической сущности данных становится невозможным реализация заложенного в данных потенциала. В настоящее время можно говорить о несовершенстве имеющихся правовых средств для использования такого актива в обороте. Исходя из комплексности феномена больших данных, ...
Добавлено: 13 апреля 2026 г.
Сложное слово и словосочетание: корпусный подход (случай «bad blood»)
Филатов А. С., Когнитивные исследования языка 2025 Т. 1-2 № 25 С. 302–305
В статье демонстрируется продуктивность корпусного лингвистического анализа при решении проблемы различения словосочетаний и сложных слов. Объект исследования: “bad blood” в американском варианте английского языка. Морфологический статус исследуемого элемента рассматривается в тесной связи с его функционированием в реальной речи и структурой полисемии каждого из его конституентов. ...
Добавлено: 24 ноября 2025 г.
От вина до самогона: топика пьянства в студенческих песнях
Воробьев В. А., В кн.: Толока: сборник статей к 60-летию А.Б. Мороза.: М.: РГГУ, 2025. С. 127–152.
Топика пьянства значима в студенческих песнях и выражается через определенную лексику, прежде всего наименования алкоголя. В статье рассмотрена группа из свыше 400 вхождений в трех корпусах (более 500 текстов) в сопоставлении с социальным и историко-культурным контекстом бытования песен. Анализируется сочетаемость номинаций напитков в песне со статистическими данными, их связь с другими группами лексических единиц, а также типологические сходства топики пьянства ...
Добавлено: 9 октября 2025 г.
Правовой режим персональных данных в социальных сетях: проблемы квалификации и практические аспекты обработки
Ковалева Н. Н., Жирнова Н. А., Закон 2025 № 9 С. 61–68
Исследование посвящено комплексному анализу правовых коллизий, возникающих при обработке персональных данных в социальных сетях. На основе системного изучения российского законодательства и эволюции судебной практики выявлены ключевые проблемы квалификации статуса таких данных. Доказана ошибочность отождествления понятий «общедоступные источники персональных данных» и «общедоступные персональные данные». Особое внимание уделено противоречиям, связанным с автоматизированным сбором информации (парсингом) и правовыми ...
Добавлено: 1 октября 2025 г.
Правовое регулирование оборота данных в цифровом виде в Индии: изменения последних лет и тенденции развития
Лескина Э. И., Солдаткина О. Л., Закон 2025 № 8 С. 66–76
Статья анализирует законодательство Индии в области обеспечения оборота цифровых данных с фокусом на защите персональных данных. Авторы исследуют развитие правового регулирования в этой сфере, начиная с 2016 года, когда началась цифровая трансформация различных процессов и общественных отношений в Индии, и до принятия Закона о защите цифровых персональных данных в августе 2023 года. В статье подчеркивается ...
Добавлено: 24 августа 2025 г.
Тексты судебных приговоров как источник данных для эмпирических исследований права в России
Жучкова С. В., Девятников В. Ю., Казун А. П. и др., Мониторинг общественного мнения: Экономические и социальные перемены 2025 № 2 С. 170–192
Развитие эмпирических исследований права в России во многом сдерживается дефицитом доступных источников данных о правоприменении. Один из таких источников, до сих пор недостаточно используемый в российских исследованиях, — публикуемые в открытом доступе тексты судебных решений, в частности судебных приговоров. Цель статьи — предложить подход к использованию текстов судебных приговоров как источника данных, который может быть ...
Добавлено: 8 мая 2025 г.
Standard Dargwa Corpus
Толдова С. Ю., Сокур Е. О., , in: Современная лингвистика: от теории к практике: III Казанский международный лингвистический саммит: (Казань, 14–19 ноября 2022 г.): тр. и матер.: в 3 т.Т. 1.: Каз.: Издательство Казанского университета, 2023.
Добавлено: 12 марта 2025 г.
Теоретическая семантика и идеографическая лексикография: Словарь. Дискурс. Корпус: тезисы докладов Всероссийской науч. конф. с международным участием. 17-18 октября 2024, Екатеринбург
Екатеринбург: Кабинетный ученый, 2024.
В сборнике представлены тезисы докладов разных научных школ, обединенные проблемами семантики и лексикографии. ...
Добавлено: 21 октября 2024 г.
Лескина Э.И. Правовые и организационные задачи аналитики и управления Big Data в государственном управлении // Хозяйство и право, 2022, №3. С. 81-87
Лескина Э. И., Хозяйство и право 2022 № 3 С. 81–87
Данные признаются ключевым фактором развития экономики, новой нефтью, их сбор и генерирование по всему миру увеличивается с каждым годом. В таких условиях перед государством в новых условиях стоят важные задачи в виде развития инноваций ,экономики, ачества предоставления социальных услуг, с одной стороны, и обеспечение конфиденциальности и информационной безопасности, с другой стороны. С помощью технологий Big Data ...
Добавлено: 2 октября 2024 г.
Creating an information security policy in a bank: Linguistic aspects
Olivier Mozard T. Kamou, English Text Construction 2023 Vol. 16 No. 1 P. 59–81
Добавлено: 13 мая 2024 г.
Язык Л. Н. Толстого: корпусный подход и интроспекция
Орехов Б. В., Труды института русского языка им. В.В. Виноградова 2024 № 1(39) С. 67–73
В середине XX в. внимательный читатель и ценитель русской литературы Александр Биск, находившийся в тот момент в эмиграции, публикует статью в журнале, специализирующемся на проблемах преподавания русского языка для иностранцев. В этой статье он делится результатами медленного чтения произведений Л. Н. Толстого, прежде всего, романа «Война и мир». Опираясь на собственные представления о языковой норме ...
Добавлено: 23 апреля 2024 г.
Исследовательский потенциал корпуса советских песен: эмоциональная тональность и география песенных текстов через призму компьютерных технологий
Колмогорова А. В., Зарембо В. С., Ткачева Е. С. и др., В кн.: Лингвистическая семантика в пространственном измерении: Словарь. Дискурс. Корпус.: Екатеринбург: Кабинетный ученый, 2024. Гл. 10 С. 423–445.
Цель данного исследования – описать характеристики текста популярной советской песни как лингвоидеологического феномена. В качестве материала используется корпус советской песни, собранный исследовательской группой. В фокусе данной публикации – две характеристики: изменения эмоциональной тональности популярных песен, выпускавшихся на граммпластинках фирмой «Мелодия» в разные периоды советской эпохи, и города, упоминавшиеся в песнях с 1950 по 2000 гг. ...
Добавлено: 10 декабря 2023 г.
  • О ВЫШКЕ
  • Цифры и факты
  • Руководство и структура
  • Устойчивое развитие в НИУ ВШЭ
  • Преподаватели и сотрудники
  • Корпуса и общежития
  • Закупки
  • Обращения граждан в НИУ ВШЭ
  • Фонд целевого капитала
  • Противодействие коррупции
  • Сведения о доходах, расходах, об имуществе и обязательствах имущественного характера
  • Сведения об образовательной организации
  • Людям с ограниченными возможностями здоровья
  • Единая платежная страница
  • Работа в Вышке
  • ОБРАЗОВАНИЕ
  • Лицей
  • Довузовская подготовка
  • Олимпиады
  • Прием в бакалавриат
  • Вышка+
  • Прием в магистратуру
  • Аспирантура
  • Дополнительное образование
  • Центр развития карьеры
  • Бизнес-инкубатор ВШЭ
  • Образовательные партнерства
  • Обратная связь и взаимодействие с получателями услуг
  • НАУКА
  • Научные подразделения
  • Исследовательские проекты
  • Мониторинги
  • Диссертационные советы
  • Защиты диссертаций
  • Академическое развитие
  • Конкурсы и гранты
  • Внешние научно-информационные ресурсы
  • РЕСУРСЫ
  • Библиотека
  • Издательский дом ВШЭ
  • Книжный магазин «БукВышка»
  • Типография
  • Медиацентр
  • Журналы ВШЭ
  • Публикации
  • http://www.minobrnauki.gov.ru/
    Министерство науки и высшего образования РФ
  • https://edu.gov.ru/
    Министерство просвещения РФ
  • http://www.edu.ru
    Федеральный портал «Российское образование»
  • https://elearning.hse.ru/mooc
    Массовые открытые онлайн-курсы
  • НИУ ВШЭ1993–2026
  • Адреса и контакты
  • Условия использования материалов
  • Политика конфиденциальности
  • Правила применения рекомендательных технологий в НИУ ВШЭ
  • Карта сайта
Редактору