Discover Shadow Groups from the Dark Web

D. Hladky; Ehrlich C.; I. Efimenko; Vorobyov V.

?

Discover Shadow Groups from the Dark Web

P. 67–81.

Хладки Д., Ehrlich C., Ефименко И. В., Vorobyov V.

Due to the lack of multilingual and multimedia extremist collections and advanced analytical methodologies, our empirical understanding of the Internet or dark web is still very limited. Content mining and intelligence inside the Internet becomes more and more a challenge to different bodies from security, financial organizations (e.g. financial intelligence units “FIU”) and law enforcement agencies. Tracking of large digital information from various sources like public Internet, dark web, long tail web or blogs and other social networks creates new challenges to the research community. A first test is to create intelligent crawlers that can identify any link in the web and extract the digital footprint from the web page. Some of the key challenge that we face are in the area of automatic multilingual text analysis, the harmonization of extracted knowledge and the unique identity resolution. Taxonomies and thesauruses do not offer a complete solution for the automatic discovery of hidden relations or newly defined expressions for named entities. In order to understand shadow groups we need to apply advanced technologies from artificial intelligence and computation linguistics. In this paper we will share our experience which we developed from various projects in Europe, Russia and Central Asia. We will discuss how an ontology-driven information extraction approach from large multilingual document collections can help to create an understanding and therefore valuable knowledge. We will further demonstrate how to solve the merging of various ontologies used for different domains and languages using the concept of upper ontology and conclude the discussion by sharing insights on how to create rules for automatic identity resolution for specific named entities.

Язык: английский

Ключевые слова: мультимедиа multimedia анализ текста text analysis многоязычный информационный контент Уникальный идентификатор Multilingual Shadow Groups Dark Web extract knowledge unique identity теневые группы невидимый веб экстракт знания

В книге

Web Intelligence and Security

Vol. 27. , IOS Press, 2010.

Анализ культурных референций в творчестве А. Вознесенского: цифровое исследование имен персоналий

Тюрякова-Матвеева Д. В., Цифровые гуманитарные исследования 2026 № 1 С. 4–26

Статья исследует культурные референции в творчестве Андрея Вознесенского путем анализа упоминаемых им персоналий. Обработано 1678 произведений, включая поэзию, прозу и ранние неопубликованные стихотворения. Методы NER, основанные на инструментах Natasha, spaCy и LLM Grok, позволили изучить частоту упоминания известных лиц и их связь с жанром произведения. Определены ключевые авторы Вознесенского (Пастернак, Пушкин, Маяковский), выявлены особенности жанра ...

Добавлено: 31 мая 2026 г.

Перспективы медиа-мониторинга в исследованиях общественного мнения (на примере доверия президенту)

Анкудинов И. А., Социология: методология, методы, математическое моделирование 2025 № 61 С. 165–203

Изменчивые политические настроения россиян — постоянный предмет интереса социологических фондов. С развитием интернета привычные анкетные исследования стали дополняться онлайн-опросами и, несмотря на некоторый скепсис, «майнингом» социальных сетей. В настоящей статье предпринимается попытка скорректировать стихийную интернет-выборку так, чтобы приблизить ее оценки к репрезентативным омнибусам. Мы используем показатели доверия Президенту РФ в сети и в опросах с ...

Добавлено: 22 апреля 2026 г.

Алгоритм анализа новостной информации для принятия экономических решений

Чудинова О. С., Первицкая Л. А., Раменская А. В., Индустриальная экономика 2026 № 1 С. 65–78

Статья посвящена разработке алгоритма анализа новостной информации методами машинного обучения, реализованными в библиотеках Python. Обоснование выбора инструментов, применяемых на каждом этапе алгоритма, осуществляется с помощью расчета метрик качества решения соответствующих задач машинного обучения. Результаты работы алгоритма представлены классификацией региональных новостей, собранных за период с августа 2024 года по июнь 2025 года, по отраслям экономики и ...

Добавлено: 20 апреля 2026 г.

Слушаем турецкие новости

Грачева Д. Д., Издательский дом ВКН, 2026.

Данное учебное пособие предназначено для студентов старших курсов, изучающих турецкий язык, и направлено на развитие навыков аудирования и понимания новостных материалов на слух. Пособие содержит аутентичные видеосюжеты и включает задания на заполнение пропусков в тексте, анализ и обсуждение содержания, перевод и творческие упражнения. Выполнение данных упражнений способствует расширению словарного запаса, развитию навыков деления ключевой информации и ...

Добавлено: 13 апреля 2026 г.

Юсуф-Ходжа и его братья: О родстве Афанасия Никитина

Лифшиц А. Л., Slovĕne 2025 Т. 14 № 1 С. 300–312

В статье рассматриваются те эпизоды из записок Афанасия Никитина, которые позволяют усомниться в его купеческом статусе. На основании анализа грамматики, лексики и прагматики сообщений Афанасия делаются выводы, что по Волге и далее он путешествовал как глава небольшого сообщества людей и что он отличался от своих спутников по рангу. Подтверждаются предположения А. Г. Боброва, что Афанасий ...

Добавлено: 3 сентября 2025 г.

Британское поэтическое возрождение и поэзия Д. Боуи: точки соприкосновения

Тюлин Д. А., Вестник Нижегородского государственного лингвистического университета им. Н.А. Добролюбова 2022 № 57 С. 109–121

Данная статья посвящена анализу и сопоставлению двух феноменов британской контр-культурной поэзии — творчеству Дэвида Боуи и наследию «Британского поэтического возрождения» (The British Poetry Revival). Дэвид Боуи приобрёл культовый статус как музыкант и исполнитель, объединяющий в своём творчестве различные жанры и виды искусства, такие как театр, поэзия и живопись. Поэзию Боуи предлагается рассматривать как экспериментальную и ...

Добавлено: 10 марта 2025 г.

Semantic Text Analysis Using Artificial Neural Networks Based on Neural-Like Elements with Temporal Signal Summation

Kharlamov Alexander, Eugeny S., Kuznetsov D. и др., Problems of Artificial Intelligence 2023 No. 3(30) P. 4–27

Текст как изображение анализируется в зрительном анализаторе человека. При этом изображение сканируется по точкам наибольшей информативности, которые являются перегибами контуров эквитекстурных областей, на которые грубо разбивается изображение. В случае анализа текста таким образом анализируются отдельные символы алфавита. Далее текст анализируется как повторяющиеся элементы языка различной сложности. Формируются словари уровнеобразующих элементов различной сложности, вершиной которых является ...

Добавлено: 20 октября 2024 г.

Повышение качества перевода при использовании методов изменения порядка слов при предобработке текстов для систем машинного перевода

Мыльникова А. В., Чернышева П. А., Научно-техническая информация. Серия 1. Организация и методика информационной работы 2024 № 2 С. 26–35

Рассматривается проблема, связанная с потерей смысла и связности изложения при машинном переводе между естественными языками. Цель исследования - изучение возможностей применения соответствий пар скелетных структур текста для повышения качества перевода. Показаны методы изменения порядка слов в системах машинного перевода, использующих нейронные сети и статистические методы. Выполнен сравнительный анализ качества получаемого перевода, сделаны выводы о формах ...

Добавлено: 3 апреля 2024 г.

Use of Text Skeleton Structures for the Development of Semantic Search Methods

A. V. Mylnikova, V. A. Trusov, L. A. Mylnikov, Automatic Documentation and Mathematical Linguistics 2023 Vol. 57 No. 5 P. 301–307

This paper considers the problem of the generation of descriptors to reduce data volumes, text data resources, and search times through the use of the new factors of authorship, region, emotive meaning, and popularity, as well as a text category without special marks that can be used to generate descriptors. This approach allows the use ...

Добавлено: 29 февраля 2024 г.

Investor sentiment and the NFT hype index: to buy or not to buy?

Бакланова В. С., Куркин А. В., Теплова Т. В., China Finance Review International 2024 Vol. 14 No. 3 P. 522–548

Добавлено: 10 декабря 2023 г.

Использование скелетных структур текстов для развития методов семантического поиска

Мыльникова А. В., Трусов В. А., Мыльников Л. А., Научно-техническая информация. Серия 2: Информационные процессы и системы 2023 № 10 С. 16–23

Рассматривается проблема формирования дескрипторов для сокращения объе ма выдачи данных, сокращения времени поиска в текстовых источниках информа ции с помощью таких новых факторов, как авторство, регион, эмоциональный окрас, популярность, категория текста без соответствующих меток, которые могут формировать дескрипторы. Предлагаемый подход позволяет использовать уникальные лексико-грамматические дистрибутивные закономерности, имеющиеся в текстах. Результаты исследования могут быть применены для определения ав торства и типа текста. ...

Добавлено: 31 октября 2023 г.

Language as a Source of Conflict in Mono- and Multilingual Situations

Кронгауз М. А., Сомин А., , in: Language Politics, Language Situations and Conflicts in Multilingual Societies. Case Studies from Contemporary Russia, Ukraine and Belarus.: Harrassowitz Verlag, 2022. P. 39–58.

Добавлено: 27 октября 2023 г.

Конвергенция политических телевизионных шоу в России и ее влияние на расширение аудитории

Попова В. В., Коммуникации. Медиа. Дизайн, Россия 2023 Т. 8 № 2 С. 111–131

За последний год в связи с событиями внутри страны и на международной арене возросла важность общественно-политического контента на всех площадках. Несмотря на увеличение эфирного времени, политические передачи на телевидении тем не менее испытывают сложности с привлечением к экрану новой молодой аудитории. Автор данного исследования ставит перед собой цель выявить и проанализировать механизмы конвергенции политических программ ...

Добавлено: 4 июля 2023 г.

Вопросы дистрибутивно-смыслового анализа скелетных структур текстов в задачах автоматизированной обработки языковых данных

Мыльникова А. В., Мыльников Л. А., Научно-техническая информация. Серия 2: Информационные процессы и системы 2023 № 5 С. 21–30

Предложен подход к построению скелетных структур текстов на основе дистрибутивного анализа предложений, который состоит в структурировании и формализации языковых единиц и позволяет выявлять уникальные лексико-грамматические дистрибутивные закономерности. Представлена система обозначений и способ формализации данных для обучения модели анализа текста. ...

Добавлено: 19 июня 2023 г.

К вопросу о применении гуманитарно-научных методов в процессе анализа историко-правовых источников

Зорилэ Д. В., Тенденции развития науки и образования 2021 Т. 75 № 3 С. 37–42

В статье рассматривается вопрос применения в историко-правовых исследованиях методологии, получившей развитие в смежных гуманитарных дисциплинах - в молодой области - юрислингвистике, развивающей комплекс сравнительных методов и подходов.Анализируются особенности применения соответствующего методологического инструментария в процессе интерпреатции текстов историко-правовой направленности, в частности, проблемы адекватного перевода зарубежных источников, в первую очередь - правовой терминологии. В статье использованы как ...

Добавлено: 4 декабря 2022 г.

Оценка восприятия образовательного контента на различных уровнях мультимедиа

Залата О. А., Еременко Ю. А., Интеграция образования 2020 Т. 31 № 1 С. 678–691

Развитие информационных технологий и инноваций в образовании тесно связано с необходимостью объективного оценивания их влияния на когнитивные процессы, психологические и физиологические реакции обучающихся. В статье исследуются физиологическая и психологическая реакции студентов при восприятии образовательного контента в среде линейного мультимедиа, гипермедиа и виртуальной реальности. Цель работы - оценка влияния уровня мультимедиа на эффективность обучения, а также ...

Добавлено: 28 октября 2022 г.

SmartTips: Online Products Recommendations System Based on Analyzing Customers Reviews

Ali N., Alshahrani A., Alghamdi A. и др., Applied Sciences (Switzerland) 2022 Vol. 12 No. 17 Article 8823

Добавлено: 4 октября 2022 г.

Толкование и применение соглашений об избежании двойного налогообложения в условиях действия Многосторонней конвенции (язык договоров и право)

Хаванова И. А., М.: Прометей, 2022.

С 1 января 2021 года в отношении 34 соглашений России об избежании двойного налогообложения доходов применяется многосторонняя Конвенция по выполнению мер, относящихся к налоговым соглашениям, в целях противодействия размыванию налоговой базы и выводу прибыли из-под налогообложения. Всего же Россия распространила действие Конвенции на 71 соглашение. В монографии рассмотрены особенности анализа «трехслойного» содержания современных налоговых правил: ...

Добавлено: 4 марта 2022 г.