Термин "Система управления знаниями" (Knowledge Management System, KMS) применяют к самым разным методологическим, программным и организационным решениям. KMS как ИТ-система может представлять собой корпоративный портал на SharePoint, инструмент информационной поддержки внутренних или внешних пользователей, встроенный в систему управления задачами, или даже набор ресурсов для самообучения. Такие решения пригодны для решения нишевых задач, таких как организация работы службы поддержки или клиентского сервиса, для обучения сотрудников выполнению типовых бизнес-процессов, но не эффективны для обеспечения доступности сложно формализуемых, разнородных и разнообразных знаний, необходимых сотрудникам среднего и высшего звена. Как правило, в классических KMS полностью отсутствует функционал работы со структурированными данными (часть этого функционала предоставляют BI-системы). Еще одной проблемой большинства KMS является необходимость ручного структурирования размещаемой в них информации.

Как можно преодолеть эти ограничения классических KMS? Каждая организация накапливает в процессе работы огромный объем данных. Данные могут быть структурированными – в этом случае они содержатся в базах данных корпоративных систем, или не структурированными – если они представлены в виде документов. Решения, которые стремятся объединить информацию из структурированных и неструктурированных источников в единое связное представление, называют Корпоративным графом знаний (Enterprise Knowledge Graph, EKG). Развитый EKG с хорошими инструментами поиска информации способен выполнять функции Системы управления знаниями, предназначенной для решения не типовых задач и поддержки принятия решений. Важно, что в процессе конструирования EKG приоритет отдается автоматизированному извлечению знаний из накопленных данных, вместо ручного ввода или структурирования информации.

Мы сравним процесс построения классической KMS с этапами создания Корпоративного графа знаний с технологической точки зрения, чтобы проиллюстрировать различия подходов и получаемых результатов.

Система управления знаниями (KMS)Корпоративный граф знаний (EKG)
Структурирование знаний

В большинстве KMS верхним уровнем структуры знаний является привычная всем пользователям ПК иерархия "папок" и документов, поэтому моделирование структуры знаний начинается с построения единой иерархии для навигации по ним. На практике структура знаний практически любой компании настолько сложна, что не укладывается в одну иерархию. Смешивание в одном дереве разных оснований классификации знаний приводит к потере его логической структуры и усложняет навигацию.

Чтобы обойти это ограничение, элементы знаний начинают помечать тегами – произвольно выбираемыми словами, каждое из которых может означать один из основных бизнес-объектов или термин из бизнес-глоссария. Тегирование может быть автоматизировано с помощью алгоритмов машинного обучения. Сами теги обычно никак не структурируются и образуют простой список.

Для построения EKG сначала создается онтологическая модель предметной области, которая описывает типы бизнес-объектов, их возможных связей и свойств. Для одних отраслей (например, банковской) такие модели существуют в готовом виде, для других их необходимо разработать в ходе выполнения проекта.

Частью модели также может стать бизнес-глоссарий (например, построенный в соответствии с моделью SKOS), в котором представлены термины, которыми обозначаются бизнес-объекты, свойства и связи.

Затем строятся каталоги основных бизнес-объектов, с которыми могут быть связаны элементы знаний – это могут быть активы, клиенты, сотрудники и др. Если в компании уже внедрена MDM-система, она может стать источником наполнения таких каталогов.

В модели можно создать множество иерархических фасетов для классификации элементов знаний.

Наполнение информацией

Наполнение информацией классической KMS чаще всего происходит вручную. Эксперту необходимо найти в организации источники знаний по каждому вопросу, обработать их, извлечь необходимую информацию, поместить ее в соответствующий раздел KMS и снабдить метаданными для поиска, включая теги.

Для организации процесса наполнения часто применяются сложные проектные практики: организация рабочих групп и комитетов, проведение интервью и опросов, согласование вносимой в KMS информации. Все это отнимает дорогостоящее рабочее время самых компетентных сотрудников организации.

Для наполнения EKG прежде всего используются структурированные и неструктурированные данные, существующие в организации. Вручную вносится только та информация, которая ранее не существовала в электронном виде. Для извлечения структурированных данных создаются адаптеры, которые извлекают информацию из корпоративных систем с помощью веб-сервисов или путем обращения к копиям их БД. Для работы адаптеров в онтологической модели создаются правила, описывающие соответствие элементов модели элементам структуры данных в источниках (парадигма OBDA, Ontology-based data access). Извлеченные данные могут быть материализованы в хранилище EKG или извлекаться из источника по запросу.

Для индексирования документов создается краулер, обходящий все файловые хранилища. Наряду с обычным полнотекстовым индексом он определяет бизнес-объекты, упоминаемые в каждом документе, и связывает их.

Таким образом в EKG образуется виртуальное представление каждого бизнес-объекта, обогащенное всей доступной информацией о нем. Такое представление можно рассматривать как своего рода  цифровую тень  (digital shadow) бизнес-объекта.

Достоверность информации

Неверные или неактуальные данные, содержащиеся в KMS, могут причинить существенный ущерб, если будут использованы при принятии решений. В подавляющем большинстве классических KMS-систем нет никаких инструментов контроля актуальности и верификации данных – эти задачи полностью возлагаются на людей-экспертов. При быстром изменении бизнес-среды контролировать актуальность всей информации в KMS крайне сложно.

Нельзя исключать и "человеческий фактор" как источник ошибок при внесении сведений в KMS.

Онтологии позволяют записывать в машинно-читаемом виде правила валидации информации и правила получения логических выводов на основании имеющихся фактов. Такие правила, конструируемые аналитиком, позволяют автоматизировать очистку и обогащение содержимого EKG.

Любая информация, попадающая в EKG, сохраняет связь со своим источником. При просмотре любых фактов в EKG всегда можно точно установить, когда и откуда они получены. Использование структурированных данных, индексация документов-первоисточников позволяет снизить вероятность попадания в EKG неверной информации. Все это позволяет повысить степень доверия к сведениям, содержащимся в EKG.

Способ использования

Чтобы найти нужную информацию в классической KMS, пользователь использует навигацию по дереву содержимого, поиск по тегам, полнотекстовый поиск. Используются также гиперссылки между элементами содержания и виджеты типа "Похожие статьи", содержимое которых может строиться с помощью алгоритмов машинного обучения.

Найденный элемент знаний, как правило, представляет собой текстовую статью, в которой содержится заранее подготовленный ответ на конкретный вопрос или описание определенной ситуации.

Пользователь может строить сложные запросы к EKG, включающие несколько взаимосвязанных условий, например: "В каких факторинговых сделках с клиентами отрасли N на сумму более X млн.$ применялась оценка рисков по методике M?" Важно, что EKG дает точные ответы на подобные вопросы, опираясь на данные, а не просто подбирает документы, в которых встречаются соответствующие слова. Можно использовать результаты одних запросов как набор входных параметров для других.

Найденный элемент знаний представляет собой объект, обладающий множеством свойств и связей с другими объектами. Просмотр объектов и навигация по ним осуществляется в wiki-подобном интерфейсе. Может быть визуализирован и сам граф связей – это дает возможность быстро оценить полную картину информации, доступной по каждому объекту.

Вспомогательными функциями EKG являются поиск связей между объектами, поиск похожих объектов.

Поддержка

Процесс поддержки KMS мало отличается от процесса ее первоначального наполнения и сводится к добавлению новых материалов, коррекции существующих и удалению неактуальных. На поддержку затрачиваются значительные трудовые ресурсы экспертов.

EKG автоматически собирает актуальную информацию из систем-источников и документов, исключает устаревшие данные. Поддержка заключается в расширении модели по мере включения новых доменов знаний в периметр EKG или изменения бизнес-процессов.

EKG может быстро реагировать на изменения требований, процессов и структур данных источников, поскольку для их отражения в системе нужно вносить изменения только в модель, а не в программный код.

Инновации и развитие

Инновационные функции KMS чаще всего сводятся к попыткам применения нейросетей для улучшения практики поиска контента. В целом для этого сегмента характерно достаточно медленное развитие как парадигмы в целом, так и функциональных возможностей конкретных продуктов.

Перспективы EKG сразу по нескольким направлениям связаны с развитием технологий распознавания смысла текста на естественном языке (NLU, Natural Language Understanding). Они могут использоваться для обогащения содержания EKG за счет фактов, извлеченных из текста, повышая тем самым доступность информации из неструктурированных источников. Улучшат они и пользовательский опыт взаимодействия с системой: возможность задать вопрос на обычном языке, а не конструировать запрос в форме поиска, ускорит поиск информации. Чат-бот или диалоговый помощник, использующий информацию из EKG, позволит непосредственно получать ответы на важные для пользователя вопросы, а не разбираться в массиве результатов запроса.

Сразу несколько западных вендоров предлагают решения для создания систем управления знаниями на основе EKG и онтологий. Германская компания Coreon фокусируется на разработке многоязычной системы управления знаниями, призванной сократить разрыв между данными и языком, на котором общаются бизнес-эксперты. Это особенно важно в технологически сложных предметных областях. Среди клиентов Coreon – компания Liebherr.

Широкое применение EKG находит в медицине и фармацевтической отрасли, где структура знаний также очень сложна. Компания Metaphactory рассказывает о нескольких внедрениях EKG в этой сфере. В одной из статей сотрудники компании подробно рассказывают о том, как в компаниях различных отраслей EKG используется для поиска данных, обнаружения сложных связей между объектами.

Европейская компания Ontotext описывает процесс насыщения корпоративного графа структурированной и неструктурированной информацией на примере создания системы управления знаниями фармацевтической компании. Австрийская The Semantic Web Company (PoolParty) описывает кейс внедрения EKG для консолидации знаний инжиниринговой/строительной корпорации. В описании практически всех этих проектов подчеркивается, что по результатам проекта заказчик повышает эффективность своих бизнес-процессов за счет лучшей доступности знаний для персонала.

Чтобы получить качественное решение для управления знаниями с помощью EKG, не обязательно прибегать к услугам зарубежных вендоров. Специалисты казахстанской компании DataVera обладают практическим опытом успешного создания систем управления знаниями на основе EKG, реализующих все перечисленные преимущества, в том числе в крупной нефтегазовой компании и инжиниринговом институте. Мы предлагаем нашим клиентам извлечь максимальную пользу из накопленной информации, превратить данные в непосредственно монетизируемый актив за счет широкого использования в бизнес-процессах, включая поддержку принятия решений. Мы готовы поделиться историями успехов клиентов, внедривших подобные инструменты, и рассказать о конкретных путях повышения операционной эффективности компаний при помощи знаний.

Свяжитесь с нами