?
Term Weighting in Expert Sеаrch Task: Analyzing Communication Patterns
Большинство техник машинного обучения ориентированы на обработку структурированных данных, в то время как большая часть доступных данных, как правило, представлена в неструктурированном, в том числе текстовом, виде. Обнаружение концептов - это область извлечения знаний, использующая антропоцентрические методы, ориентированные на выявление глубинной концептуальной структуры данных и активно вовлекающие эксперта в процесс исследований. Семинар был посвящен методам обработки неструктурированной информации и, в первую очередь, превращения ее в структурированную или полуструктурированную. Он затронул самые различные области, такие как извлечение данных из текстов, из сети (в том числе блогов, форумов и социальных сетей), способы обработки неполных данных и самые разнообразные методы - графы, в том числе концептуальные графы, кластеризацию, онтологии. Семинар проходил совместно с конференцией ICFCA 2012, посвященной практическому применению и дополнениям метода FCA (formal concept analysis, формальный анализ концептов) и помимо упомянутого включавшей в себя два семинара - CUBIST (Combining and Uniting Business Intelligence with Semantic Technologies, объединение бизнес-аналитики с семантическими технологиями) и EEML (Experimental Economics and Machine Learning, экспериментальная экономика и машинное обучение), затрагивающими темы использования методов data mining в экономике и бизнес-моделях. Основным направлением проекта БР5 является создание кросс-платформенных систем обработки неструктурированной информации для повышения эффективности управления инновационной деятельностью предприятия, что полностью совпадает с тематикой семинаров. Информация о сотрудниках и оргструктуре компании, коммуникации между сотрудниками компании часто представлена в неструктурированном виде, поэтому важно компенсировать это более совершенными методами обработки.