Глава
The Topics Dynamics in Knowledge Management Research
В книге
Исследуются высокоцитируемые научные статьи (highly cited papers), написанные отечественными авторами. Дается определение высокоцитируемой статьи в трактовке базы данных Essential Science Indicators, анализируется число высокоцитируемых российских публикаций на фоне мировых показателей, изучается их дисциплинарное распределение. Показано, что во всех областях науки доля российских статей, которые становятся высокоцитируемыми, ниже среднемирового уровня. Проанализировано влияние соавторства с зарубежными учеными на возможность создания высокоцитируемой статьи, сделан вывод о ключевой роли международного сотрудничества в этом процессе.
Приведен обзор современного состояния интернет сервисов, предоставляющих доступ к базам данных научных публикаций, статей научных журналов и патентных агентств. На примере семейства технологий экранов (ЭЛТ, LCD и PDP) показано развитие и сменяемость технических тенденций на основе временных рядов, полученных статистической обработкой информации из баз данных патентных агентств.
В статье анализируется влияние языка публикации на международную заметность российских научных публикаций в базе данных Web of Science. Подобно другим «догоняющим» странам, Россия вынуждена «интернационализировать» свою науку, что предполагает прежде всего переход на английский язык в качестве основного средства научной коммуникации. Но в какой степени переход на английский язык улучшает «импакт» исследований? В этом отношении случай России представляет особый интерес по причине наличия различных комбинаций языка и страны журналов, в которых появляются публикации российских авторов (российские журналы на русском языке, переводные журналы, зарубежные журналы на английском языке). Это позволяет провести что-то вроде естественно-научного эксперимента с целью протестировать влияние языка и страны публикации на международную заметность научных статей, а также проанализировать цитационные практики российских авторов.
The goal of the conference is to help build cross-disciplinary networks of analysts, software specialists, and researchers to advance the use of textual information in multiple science, technology, and business development fields. Within this context, conference themes will include, but are not limited to:
Data
Sourcing, preparing, and interpreting data sources including patents, publications, webscraping, and other novel data sourcesText-mining tools and methods
Best practices in software-based topic modeling, clumping, association rules, term manipulation, text manipulation, etc. VisualizationApplied research
Future-Oriented Technology Analysis (FTA) Intelligence gathering to support decision-making in the private sector (e.g., Management of Technology)В современном контексте глобализованной науки качество исследований часто ассоциируется с уровнем интернационализации и оценивается при помощи публикаций в ведущих «международных» (то есть англоязычных) журналах. В статье рассматривается случай российской экономической науки с целью показать, что стратегии интернационализации национальных дисциплинарных полей обусловлены, прежде всего, параметрами самого глобального поля экономикс. Анализ российских публикаций по экономике в Web of Science позволяет сделать вывод, что репертуар доступных международных публикационных стратегий российских авторов объективно ограничен в силу особенностей международной системы научной коммуникации в сфере экономической науки. Экономические статьи, написанные авторами из периферийных стран, предназначены в основном для региональных (area studies) периодических изданий. Публикация в ведущих журналах по экономике требует специфической «международной» компетенции, которая приобретается, как правило, в процессе обучения по программам PhD западных университетов, и часто предполагает делокализацию исследовательских предметов и вопросов.
An important text mining problem is to find, in a large collection of texts, documents related to specic topics and then discern further structure among the found texts. This problem is especially important for social sciences, where the purpose is to nd the most representative documents for subsequent qualitative interpretation. To solve this problem, we propose an interval semi-supervised LDA approach, in which certain predened sets of keywords (that dene the topics researchers are interested in) are restricted to specic intervals of topic assignments. We present a case study on a Russian LiveJournal dataset aimed at ethnicity discourse analysis.
An important text mining problem is to find, in a large collection of texts, documents related to specific topics and then discern further structure among the found texts. This problem is especially important for social sciences, where the purpose is to find the most representative documents for subsequent qualitative interpretation. To solve this problem, we propose an interval semi-supervised LDA approach, in which certain predefined sets of keywords (that define the topics researchers are interested in) are restricted to specific intervals of topic assignments.