?
Разработка модуля извлечения информации из промышленных стандартов
Стандарты представляют собой часть корпоративных знаний о бизнес-процессах компании, в них содержится информация о технологических достижениях и инновациях в предметной области. Однако, постоянный растущий объем документов значительно затруднил процесс поиска необходимой информации за достаточно непродолжительное время. По данным Ассоциации индустрии технологических услуг неэффективная практика обмена знаниями обходится компаниям в $31,5 млрд. ежегодно, работники тратят 30% времени на поиск или воссоздание уже существующей информации, 74% опрошенных компаний считают, что система управления знаниями повысит их производительность в среднем на 10-40% [1]. В процессе решения данной проблемы появилось целое направление «Information Extraction», суть которого заключается в извлечении структурированных данных из слабоструктурированных или неструктурированных документов, что облегчает их последующую обработку и анализ. Необходимость создания системы семантического поиска и визуализации контента промышленных стандартов была описана в работе [2], в данной же работе представлен процесс разработки модуля извлечения информации системы интеллектуального поиска в промышленных стандартах.