?
Positional skipgrams for Bambara: a resource for corpus-based studies
Mandenkan. 2019. No. 62. P. 165-183.
Маслинский К. А.
В статье представлен новый доступный онлайн набор данных: корпус н‑грамм слов на основе подкорпуса со снятой омонимией Справочного корпуса бамана. В наборе данных представлены частотные списки позиционных скип-грамм, в которых отражена информация о совместной встречаемости лексем с грамматическими категориями на различных относительных позициях в тексте. Данный тип н‑грамм разработан для того, чтобы более полно отразить лингвистическую информацию, содержащуюся в морфологически аннотированном корпусе бамана. В статье обсуждается методология подготовки корпуса н‑грамм для бамана и представлено несколько кратких иллюстративных примеров использования данных о частотности позиционных скип-грамм в корпусных лингвистических исследованиях.
Научное направление:
Филология и лингвистика
Язык:
английский
Linnik A., Bastiaanse R., Khudyakova Mariya, Stem-, Spraak- en Taalpathologie 2015 Vol. 20 P. 107-110
Добавлено: 23 сентября 2015 г.
Стырин Е. М., / ИГиМУ НИУ ВШЭ. Серия Серия WP8 "Государственное и муниципальное управление". 2013.
В работе рассматривается международный опыт использования инструментов и механиз- мов открытости в государственном управлении. Проанализированы нормативно-правовые, ин- ституциональные и организационные аспекты в создании инфраструктуры открытости и транс- формации системы государственного управления на основе принципов открытости: доступа к информации, вовлечения граждан, прозрачности и подотчетности системы государственного управления. ...
Добавлено: 25 февраля 2014 г.
Zayakin V.S., Lyadova L.N., Rabchevskiy E. A., Proceedings of the Institute for System Programming of the RAS 2022 Vol. 34 No. 2 P. 43-56
Аннотация. Разработка и эксплуатация систем, основанных на знаниях, осложняется рядом проблем обеспечениях жизнеспособности, которые неизбежно возникают в областях с интенсивным использованием данных таких, например, как, анализ социальных сетей и медиа (Social Network Analysis, SNA). Во многом это связано со свойствами слабоструктурированных объектов и процессов, которые подвергаются анализу специалистами с привлечением методов автоматизированной обработки данных (data ...
Добавлено: 23 июля 2022 г.
В данной работе проведено исследование влияния раскрытия машиночитаемых данных на развитие общественного транспорта г. Москвы. Выбор сферы общественного транспорта среди всех сфер жизни города обусловлен тем, что открытые данные этого направления уже достаточно давно публикуются за рубежом, появились приложения на их основе и появилась возможность судить о потенциальном эффекте от этих данных в России. Задачи ...
Добавлено: 15 июля 2015 г.
Широканова А. А., Вестник Санкт-Петербургского университета. Серия 12: Социология 2020 № 1 С. 4-24
Статья посвящена обзору и анализу опросов о субъективном благополучии в России – одном из ключевых неэкономических показателей общественного развития. Сравниваются два основных показателя, уровень счастья и общая удовлетворенность жизнью, по данным восьми международных и российских исследовательских проектов за 1998-2018 гг. (European Social Survey, European Values Study, World Values Survey, РМЭЗ НИУ ВШЭ, «Евробарометр в России»; опросы ВЦИОМ, Левада-центра и ФОМ).
Показано, ...
Добавлено: 28 декабря 2019 г.
В статье обсуждается природа ошибок в текстах носителей особого варианта русского языка: детей эмигрантов, выросших в иноязычной среде и унаследовавших свой русский от родителей. В англоязычной традиции такой вариант родного языка называется heritage language (в нашем случае heritage Russian), т.е. унаследованный (эритажный) язык. Материалом послужил корпус текстов детей американских эмигрантов Russian Learner Corpus. Показано, что ...
Добавлено: 24 февраля 2014 г.
Дмитриева Н. Е., Стырин Е. М., Ястребова Е. В., Вопросы государственного и муниципального управления 2017 № 2 С. 27-56
Одним из наиболее востребованных в международной практике механизмов государственного управления становится независимая оценка качества предоставляемых гражданам услуг. В статье описана методология и представлены результаты проведенного авторами комплексного исследования предмета и главного субъекта независимой оценки – получателей социальных услуг. На основе вторичного анализа массивов социологических исследований и микроданных Росстата, а также анализа мнений пользователей, размещенных в ...
Добавлено: 21 июня 2017 г.
Максименкова О. В., Подбельский В. В., Образование и наука 2016 Т. 139 № 10 С. 107-121
Цель работы – показать возможности использования от- крытых данных в преподавании курсов программирования.
Методы и методики. Результаты внедрения представленной в публикации методики в процесс обучения программированию на первом курсе специальности «Программная инженерия» получены путем сравнительного исследования и проанализированы методами описательной статистики.
Результаты и научная новизна. Предложена методика использования открытых наборов данных при разработке тренировочных и контрольных заданий ...
Добавлено: 6 января 2017 г.
Цифровой архив литературного журнала с дореформенной орфографией «Отечественные Записки» (1839-1884)
Заковоротная Е. М., Клышинский Э. С., Волошина Е. Ю. и др., Компьютерная лингвистика и интеллектуальные технологии 2021 Т. дополнительный № 20 С. 1239-1244
В данной статье представлена начальная версия цифрового архива литературного журнала с дореформенной орфографией «Отечественные Записки». Корпус содержит десять томов, размеченных в формате XML, и насчитывает более 2 млн слов. Для доступа к архиву разработан веб-интерфейс, с помощью которого пользователи смогут проводить поиск по корпусу, скачивать тома «Отечественных Записок» в машиночитаемом формате и редактировать выпуски журнала ...
Добавлено: 6 июня 2022 г.
Блинова О. В., Lecture Notes in Computer Science 2019 Vol. 11551 P. 51-60
Добавлено: 1 ноября 2020 г.
Боголепова С. В., Вопросы психолингвистики 2012 № 16 С. 192-197
В статье представлен психолингвистический анализ соматизма «руки», осуществлена попытка выявить образы, с которыми данная часть тела ассоциируется в языковом сознании носителей русского и английского языков. С этой целью привлекается обширный материал: национальные корпуса, корпус чатов, результаты ассоциативного эксперимента. Описывается методология анализа и его качественные и количественные результаты. Сравниваются результаты анализа различных источников. ...
Добавлено: 23 октября 2013 г.
Skrynnikova I., Пермякова Т. М., Поздеева Е. В., Journal of Intercultural Communication Research 2022 Vol. 51 No. 4 P. 343-360
Добавлено: 27 августа 2021 г.
Максименкова О. В., Radchenko I., , in : Proceedings of the 12th Central and Eastern European Software Engineering Conference in Russia. : NY : ACM, 2016.
Добавлено: 12 января 2017 г.
Чураков В. Д., Гришина Д. А., Российский юридический журнал 2021 № 6(141) С. 164-175
Опубликование открытых данных в России началось в 2012 г. Спустя почти десять лет качество и количество таких данных существенно возросли. Для облегчения работы с открытыми данными созданы как частные, так и государственные информационные системы. Основной государственной системой в настоящий момент является национальная система управления данными (НСУД). В статье приведен анализ процесса разработки НСУД, выявлены текущие ...
Добавлено: 24 октября 2022 г.
Стырин Е. М., Дмитриева Н. Е., International Journal of Electronic Government Research 2017 Vol. 13 No. 4 P. 1-14
Добавлено: 23 января 2018 г.
Обсуждаются проблемы интеграции информации в областях с интенсивным использованием данных. Проанализированы существующие подходы к интеграции. Предложен новый подход к интеграции, основанный на онтологической и продукционной моделях знаний, а также формальная теоретико-множественная модель, лежащая в его основе. Практические преимущества подхода продемонстрированы на примере концептуализации задачи выявления ключевых мостов из области анализа социальных сетей. ...
Добавлено: 22 октября 2022 г.
Рахилина Е. В., Выренкова А. С., / НИУ ВШЭ. Series WP BRP "Linguistics". 2014. No. 11.
Добавлено: 23 октября 2014 г.
Рахилина Е. В., 154430030, Acta Linguistica Petropolitana. Труды института лингвистических исследований 2015 Т. XI № 1 С. 621-639
В статье рассматриваются особенности построения трех видов конструкций - условных, сравнительных и предложных - в речи эртажных носителей русского языка и изучающих русский как иностранный. В качестве материала использованы тексты Russian Learner Corpus. ...
Добавлено: 25 июля 2015 г.
Северина Е. М., Бонч-Осмоловская А. А., Бец Ю. В. и др., Гуманитарные и социальные науки 2021 Т. 88 № 5 С. 121-129
Рассматриваются междисциплинарные «цифровые практики» в гуманитарной сфере, ис - пользующие компьютерные модели и цифровые технологии в качестве научного инструментария и реализуе - мые в виде цифровых проектов. Описана работа междисциплинарных коллективов, реализующих цифровые проекты, в контексте основного принципа Digital Humanities – принципа открытых исследовательских данных (Open data), целью которого является не только размещение информации в ...
Добавлено: 23 декабря 2021 г.
Рахилина Е. В., Acta Linguistica Petropolitana. Труды института лингвистических исследований 2014
Понятие носитель языка (например, русского) ассоциируется с человеком, который может свободно выразить любую мысль, и при этом не делает ошибок. Этот упрощенный стереотип предполагает, что носители всегда придерживаются в своей речи какого-то единого стандарта и следуют стандартным правилам. В реальности, однако, далеко не все, кого мы называем носителями языка, говорят одинаково: как известно, есть «особенная» ...
Добавлено: 24 февраля 2014 г.
Богданова Т. К., Жукова Л. В., В кн. : Системное моделирование социально-экономических процессов: труды 43-ей международной научной школы-семинара. : Воронеж : Истоки, 2020. Гл. 9. С. 481-488.
В работе предлагается подход к построению универсального комплексного индикатора для оценки состояния банка, отличного от удовлетворительного, включающего как однородные структурированные данные о финансовом состоянии банка, так и неструктурированные, из «открытых» источников информации. Для построения компонент универсального комплексного индикатора предлагается использовать методы кластерного и регрессионного анализа, применяемые к количественным и качественным данным об объектах управления. ...
Добавлено: 16 февраля 2021 г.
Акинина Ю. С., Бергельсон М. Б., Худякова М. В. и др., Stem-, Spraak- en Taalpathologie 2015 Vol. 20 No. 1 P. 21-23
Добавлено: 21 сентября 2015 г.
Дмитриева Н. Е., Стырин Е. М., Public Administration Issues 2014 No. 5 P. 57-75
Добавлено: 26 марта 2015 г.
Околёснова О. А., Государственный аудит. Право. Экономика 2017 № 2 С. 64-67
Повышение открытости деятельности государственных органов, а также их подконтрольность институтам гражданского общества является одним из направлений модернизации публичного управления и ключевым показателем его эффективности. Механизм раскрытия информации в форме открытых данных это еще один шаг в сторону открытости. Исследование особенностей регулирования данного института проведено с целью обозначить проблемные зоны регулирования, которые тормозят развитие эффективного механизма ...
Добавлено: 18 октября 2017 г.