Введение

Дэйв МакКомб (президент и соучредитель Semantic Arts, США) заявляет, что в последние десятилетия цифровая индустрия выбирала подход, ориентированный на приложения, в качестве основного направления. Это означает, что любая новая бизнес-идея или требование обычно связаны с реализацией нового приложения (большинство из которых имеют собственную новую базу данных и используют объектно-ориентированную архитектуру MVC). Это увеличивает сложность корпоративной ИТ-архитектуры из-за разнообразия приложений, использующих различные модели данных и имеющих жестко закодированную бизнес-логику. Управление этой сложностью является одной из основных проблем в цифровизации. Дэйв МакКомб предлагает альтернативный способ проектирования и реализации бизнес-требований в индустрии программного обеспечения: подход, ориентированный на данные. Подход, ориентированный на данные, предполагает, что приложения менее важны, чем данные, обрабатываемые приложениями. В результате такого взгляда модели данных предметной области и (во многих случаях) бизнес-логика, которая с ними работает, могут быть перемещены из приложений в центральный корпоративный репозиторий. Подход, ориентированный на данные, основан на моделировании данных, которое требует формальной, выразительной, универсальной и надежной технологии. Поэтому графовые технологии и онтологии в частности становятся очень привлекательными решениями на основе моделей для представления знаний предметной области, спроецированных на структуру данных и логику обработки в различных областях бизнеса и отраслях. Онтологии позволяют поддерживать выразительность моделей данных и их логику обработки централизованным и управляемым способом. Они становятся доступными не только для разработчиков, но и для бизнес-/системных аналитиков, архитекторов и других лиц, принимающих решения по проектированию. Эта работа включает в себя обзор высокого уровня некоторых научных статей, исследований и других источников, касающихся использования онтологий в областях моделирования данных, робототехники, биомедицины, промышленности 4.0, финансового сектора и LLM. Выбранный список источников и их интерпретация не претендуют на научную обоснованность, вместо этого автор полагает, что он иллюстрирует разнообразные приложения и перспективы онтологий в современном мире.

Подходы к моделированию данных

Реляционные базы данных и онтологии

В течение десятилетий реляционные модели данных и реляционные базы данных считались методами по умолчанию при моделировании сущностей, отношений и атрибутов предметной области. Реляционные базы данных предоставляют хорошо известные возможности для создания и хранения данных таблично-ориентированным способом. С другой стороны, онтологии как альтернативный подход к моделированию предметной области заслуживают пристального внимания. Ниже перечислены важные аспекты сравнения реляционных баз данных и онтологий:

  1. С точки зрения проектирования реляционные базы данных почти всегда создаются с нуля для конкретных вариантов использования, которые описывают модель данных как набор таблиц, столбцов и отношений между ними. Онтологии обычно повторно используют базовые классы, свойства и отношения онтологий верхнего уровня. Для конкретных вариантов использования подклассы и свойства, специфичные для предметной области, могут быть унаследованы от соответствующих классов и свойств онтологии верхнего уровня [1].
  2. Онтологии могут добавлять к моделям гораздо больше семантики, чем базы данных. База данных фокусируется на целостности, ограничениях, структуре данных, хранении и запросе данных. Онтологии в основном концентрируются на значении и знаниях, которые могут быть извлечены из модели. Выразительность онтологий позволяет охватить сложность реального мира, не теряя при этом наблюдаемости и управляемости. Они предназначены для моделирования знаний предметной области, когда использование сложных объектов со многими свойствами и отношениями невозможно избежать. [2]
  3. Производительность баз данных и онтологий различается в случаях заполнения и запроса данных. В [1] авторы получили экспериментальные результаты, показывающие, что онтологии работают более чем в три раза лучше при запросе сложных данных, чем базы данных. Это объясняется тем, что при создании экземпляра в онтологии все логические правила выполняются в этот момент, и все выведенные отношения вычисляются. Это ускоряет извлечение информации по сравнению с медленной операцией объединения больших таблиц в реляционных базах данных. С другой стороны, экспериментальное заключение в [1] показывает, что базы данных превосходят онтологии в операциях заполнения данных (создание экземпляров/вставка записей), что также разумно из-за упомянутого выше факта: выполнение правил и установление отношений в графе могут быть довольно дорогими операциями.

Исследователи подчеркивают в [1], что онтологии и базы данных не являются исключающими альтернативами, а могут дополнять друг друга. При выборе между обеими технологиями предлагается использовать следующие критерии:

  • Реляционные базы данных являются лучшим вариантом, когда операции записи выполняются гораздо чаще, чем запросы (чтение) информации, или скорость записи данных имеет решающее значение.
  • Онтологии являются лучшим выбором, когда сложность модели данных предметной области выражается сотнями или тысячами типов сущностей и отношений.
  • Онтологии предпочтительны, когда автоматизированное рассуждение и извлечение неявных отношений очень важны для конкретного варианта использования.
  • Реляционные базы данных предпочтительны, когда модель данных предметной области описывается несколькими сущностями и атрибутами, а отношения между ними просты.

Объектно-ориентированные модели и онтологии

Объектно-ориентированное моделирование в разработке программного обеспечения стало стандартным подходом для выражения и управления сложностью во многих областях. Хотя объектно-ориентированное моделирование начинается с представления модели предметной области целевого домена, в конечном итоге на более позднем этапе моделирования оно смещается в основном к деталям, связанным со структурой кода (или структурой объектов во время выполнения), а не с моделью предметной области. Этот сдвиг приводит к ситуации, когда модель предметной области в значительной степени жестко закодирована на уровне кода. Это означает, что понимание того, как работает приложение, является прерогативой разработчиков. В настоящее время мы наблюдаем преимущества и недостатки такого подхода. Ключевые моменты сравнения между подходом проектирования объектно-ориентированной модели данных приложения и онтологиями выделены ниже:

  1. UML является основным инструментом, представляющим объектно-ориентированные модели. Существует множество инструментов, которые позволяют материализовать модель UML в код. Перевод диаграммы классов UML в онтологию добавляет новые преимущества, такие как возможность находить логические несоответствия, автоматизировать вывод, выводить аксиомы и ограничения из кода на уровень модели.
  2. Свойства в онтологиях являются независимыми сущностями и наследуются многими классами, в то время как в реляционных моделях данных каждый атрибут всегда принадлежит только одной таблице. В частности, свойства объектов в онтологиях представляют отношения между классами и/или объектами. Онтологии позволяют добавлять атрибуты к определениям свойств, такие как симметрия, транзитивность и инверсия, которые используются в рассуждениях, в то время как в объектно-ориентированных моделях выражение подобной логики невозможно [3].
  3. В то время как онтологии допускают множественное наследование для классов и свойств, объектно-ориентированное моделирование обычно допускает только одиночное наследование. [3].
  4. Стоимость изменений в объектно-ориентированном приложении на основе модели часто довольно высока из-за необходимости вносить изменения непосредственно в код и структуру базы данных, что может быть трудоемким и требовать привлечения нескольких специалистов и проведения дополнительных мероприятий, таких как регрессионное и модульное тестирование. Онтологии значительно упрощают процесс управления изменениями. Операции по добавлению новых сущностей и свойств могут выполняться системными аналитиками с минимальным риском. Это требует от них понимания структуры модели данных, что может быть достигнуто с помощью графической визуализации структуры онтологии, продвигающей естественный способ представления и понимания сложности знаний предметной области.

Онтологии в робототехнике

Следующие аспекты предметной области робототехники могут быть смоделированы с помощью онтологий, что доказано на практике:

  • Структура робота и основные концепции;
  • Процессы, задачи и планирование миссий в робототехнике;
  • Представление знаний;
  • Взаимодействие с окружающей средой.

Структура робота и основные концепции. Существует несколько онтологий предметной области, созданных для области робототехники и особенно для основной структуры и основных сущностей:

  • CORA (основная онтология для robotics and automation) была разработана IEEE Robotics and Automation Society и позиционируется как онтология верхнего уровня для многих других популярных онтологий и фреймворков. CORA охватывает основные аспекты моделирования роботов — датчики, приводы, контроллеры, пространственные и временные аспекты, процессы и задачи, интеграцию и совместимость.
  • ROA (онтология архитектуры автономных роботов) наследует онтологии SUMO/CORA. Основная цель ROA — предоставить концептуальную структуру таким образом, чтобы люди (инженеры, архитекторы, которые проектируют и разрабатывают роботов) и роботы могли обмениваться информацией об архитектуре роботов [4]. ROA предоставляет словарь с определением таких важных метатерминов, как поведение, функция, цель, структура и задачи. На рисунке 1 (см. следующую страницу) показана часть таксономии ROA и связи с SUMO, CORA [4]. На рисунке 2 показана таксономия движения робота в ROA [4]. Структурные аспекты детализированы подклассами конкретного класса. Например, Sensor имеет следующие подклассы: OpticalSensor, ThermalSensor, AcousticSensor и ProximitySensor.

Процессы, задачи и планирование миссий в робототехнике. В робототехнике реализация процесса планирования миссий или задач считается важнейшей проблемой, требующей применения единого подхода. Очевидно, что заранее запрограммированная логика для определения того, какая следующая задача должна быть выполнена, не является гибкой. Известная базовая онтология для робототехники и автоматизации (CORA) включает концепции планирования задач и процессов, но она описывает эти концепции на высоком уровне. Несколько перспективных подходов к планированию задач в области робототехники:

  • ORPP (Open Robot Planning and Programming)
  • RTPO (Robot Task Planning Ontology)
  • CRAM

Онтология приложений ORPP [5] основана на онтологиях SUMO и CORA. ORPP включает дополнительные концепции, связанные с планированием задач и выполнением процессов. На рисунке 3 описаны основные концепции ORPP и их взаимосвязи с верхними и доменными онтологиями.

RTPO [6] — менее популярная онтология для моделирования планирования и выполнения задач в робототехнике. Несмотря на это, RTPO предоставляет возможности динамической адаптации к изменениям в среде и соответствия поведения и планирования задач в соответствии с этими изменениями. RTPO также поддерживает интерпретацию сложных взаимосвязей между действиями, доступными ресурсами и состояниями среды. На рисунке 4 представлен снимок иерархии концепций в RTPO [6].

CRAM (Cognitive Robot Abstract Machine) [7] — это программный набор инструментов для проектирования, внедрения и управления автономными роботами, включая планирование и выполнение ежедневных сервисных действий. На рисунке 5 показана архитектура CRAM. KnowRob как часть архитектуры CRAM может быть расширена конкретными доменными и прикладными онтологиями. CRAM — широко используемый инструмент в робототехнической отрасли в различных вариантах использования, включая планирование задач.

Представление знаний. Представление знаний в робототехнике является важной задачей. Особенно в случаях, когда роботы сталкиваются с неопределенностью среды действия и взаимодействием с неизвестными объектами или неизвестной ситуацией. В таких случаях человек применяет здравый смысл, способность идентифицировать ситуацию или неопределенный объект, находя похожие модели поведения, или способность классифицировать/категоризировать объект, руководствуясь фундаментальными знаниями и способностями к рассуждению. Эта проблема лежит в основе исследовательской области когнитивной робототехники, где методы представления знаний и рассуждения используются для поддержки «автономных роботов в динамичном и не полностью известном мире» [https://www.frontiersin.org/journals/robotics-and-ai/articles/10.3389/frobt.2024.1328934/full]. Более того, эта проблема считается одним из основных факторов, которые замедляют широкое использование роботов, например, в домашних хозяйствах и других сценариях сервисной робототехники. Онтологии частично могут охватывать эту сложность в вариантах использования, где необходимо представлять знания как набор связанных концепций, особенно в графовой модели, которая представляет объекты и отношения с использованием ребер и вершин. В настоящее время KnowRob является одной из самых популярных систем обработки знаний, которая объединяет методы представления и рассуждения знаний с методами получения знаний и для обоснования знаний в физической системе. Она может служить общей семантической структурой для интеграции информации из разных источников. KnowRob объединяет статические энциклопедические знания, знание здравого смысла, описания задач, модели окружающей среды, информацию об объектах и ​​информацию о наблюдаемых действиях, которая была получена из разных источников (вручную аксиоматизирована, получена из наблюдений или импортирована из Интернета) [https://www.knowrob.org/knowrob]. На рисунке 6 представлена ​​концептуальная модель системы KnowRob.

Взаимодействие с окружающей средой. Навигация является одним из основных аспектов взаимодействия робота с окружающей средой. Методы лидарной одометрии и картографирования (LOAM) и одновременной локализации и картографирования (SLAM) позволяют роботам строить внутреннюю модель окружающей среды в виде карты. LOAM пока что имеет ограниченное использование онтологий. LOAM в первую очередь фокусируется на геометрических и топологических методах для одометрии, картографирования и построения 3D-моделей окружающей среды, что достигается с помощью точных алгоритмов обработки облаков точек. В SLAM онтологии используются более широко. SLAM описывает широкую подобласть, которая характеризует информацию карты, семантическую оценку окружающих объектов, местоположения роботов, характеристики робота и состояния, связанные с его местоположением. Алгоритмы SLAM помогают роботам оптимизировать свою локализацию и ориентацию в неопределенных средах. Например, в [9] авторы представляют преимущестes онтологии OntoSLAM, которая охватывает следующие соответствующие подкатегории знаний: Информация о роботе (физические и структурные возможности), Картографирование среды (отличие объектов от объектов их окружения или идентификация информации о форме объектов), Информация о времени (обработка собственного движения или движения других объектов относительно определенного периода времени), Информация о рабочем пространстве (определяет общие свойства и категорию пространства, в котором действует робот). OntoSLAM объединяет различные знания, связанные со структурой робота, возможностями, местоположением и отображением, и приносит не только информацию о формах и размерах идентифицированных объектов, но и добавляет семантическую информацию об окружающих объектах и ​​среде. Это помогает роботам понимать контекст действия, конкретные роли, функциональное назначение и многие другие концептуальные свойства наблюдаемых объектов и сред. Эти знания значительно увеличивают сложность и варианты использования взаимодействия роботов с реальной средой. OntoSLAM основан на следующих онтологиях верхнего уровня:

  • ISRO [10], разработанная для сферы сервисной робототехники, с главной целью улучшения взаимодействия человека и робота;
  • FR2013 [11], созданная для управления процессом смешивания карт в сценариях, когда несколько роботов строят карты одного и того же пространства;
  • KnowROB [8].

Рисунок 1 – Таксономия ROA и связь с CORA, SUMO. Синие поля — концепции из SUMO. Оранжевые поля — концепции из CORA. Желтые поля — концепции из онтологии ROA. Почти все отношения импортируются из SUMO/CORA, за исключением структуры и ассоциации.

Рисунок 2 – Таксономия движения робота

Рисунок 3 – Концепции и отношения ORPP с SUMO, CORA

Рисунок 4 – Снимок иерархии RTPO

Рисунок 5 – Архитектура CRAM

Рисунок 6 – Концептуальная модель KnowRob

Биомедицина и биология

Из-за сложной природы биологии и биомедицины онтологии стали лучшим выбором для моделирования знаний. Таблица 1 из исследования [12] представляет основные особенности онтологий в биологии и биомедицине.

Таблица 1. Особенности онтологий, имеющие отношение к биомедицине и биологии

Особенность онтологииПолезность в исследовании
Классы и отношенияИспользование стандартных идентификаторов для классов и отношений в онтологиях позволяет интегрировать данные в нескольких базах данных, поскольку одни и те же идентификаторы могут использоваться в нескольких, несвязанных базах данных, файлах или веб-сайтах.
Словарь предметной областиС помощью меток, связанных с классами и отношениями, онтологии предоставляют словарь предметной области, который можно использовать для таких приложений, как обработка естественного языка, создание пользовательских интерфейсов и т. д.
Метаданные и описанияТекстовые определения, описания, примеры и другие метаданные, связанные с классами в онтологиях, позволяют экспертам в предметной области понимать точное значение класса в онтологии. Определения и связанные метаданные должны обеспечивать единообразное понимание значения классов в онтологиях.
Аксиомы и формальные определенияФормальные определения и аксиомы обеспечивают автоматизированный и вычислительный доступ к (некоторым частям) значения класса или отношения.

Открытые биологические и биомедицинские онтологии (OBO) — это унифицированный набор онтологий с едиными концепциями дизайна и функциональной совместимости. Ниже перечислены несколько популярных онтологий от OBO:

  • Онтология генов (GO);
  • Онтология клеток (CL);
  • Онтология заболеваний (DO);
  • Фундаментальная модель онтологии анатомии (FMA).

Онтология генов. Структура молекулярной биологии определяет работу с огромным количеством данных. Эти данные описывают продукты генов, их биологические роли и клеточное расположение, в котором они действуют [13]. Онтология генов основана на онтологии, которая раскрывает комплекс сложных знаний о генах на высокоструктурированном и организованном уровне. Она позволяет организовать знания в машиночитаемой и машиноинтерпретируемой форме. С другой стороны, онтология генов также является контролируемым словарем, который используется для аннотирования генов. Аннотации готовятся обученными специалистами в предметной области, которые анализируют огромное количество публикаций и их экспериментальные результаты. В результате результаты переводятся в термины Gene Ontology [13]. Gene Ontology охватывает три области:

  • Молекулярная функция — описывает основные действия, выполняемые продуктами генов;
  • Биологический процесс — описывает события и процессы, в которых участвуют гены;
  • Клеточный компонент — указывает на местоположение в клетке.

Онтология клеток. Онтология клеток — это структурированный контролируемый словарь для типов клеток в многоклеточных организмах. Онтология клеток разработана как структурированный контролируемый словарь для типов клеток. Эта онтология была создана для использования в моделях организмов и других базах данных биоинформатики, где требуется контролируемый словарь типов клеток. Эта онтология не является специфичной для организма. Она охватывает типы клеток от прокариот до млекопитающих. Однако он исключает типы растительных клеток, которые охватываются PO [14].

Онтология заболеваний. Стандартизированные описания заболеваний человека. Как показано на рисунке 7, заболевания классифицируются по агенту, цели, происхождению и синдрому [15]. Онтология заболеваний семантически интегрирует словари заболеваний и медицины посредством обширного перекрестного сопоставления терминов DO с MeSH, ICD, тезаурусом NCI, SNOMED и OMIM [15].

Фундаментальная модель онтологии анатомии (FMA). FMA описывает структуру тела человека. Рисунок 8 отображает иерархическую структуру FMA [16]. В [17] авторы проиллюстрировали сложность этой онтологии. Одним из приложений FMA после его обогащения другими онтологиями или определяемыми пользователем сущностями может быть рассуждение с использованием транзитивных отношений. Например, структура сердца частично представлена ​​в FMA следующей иерархией:

Сердце

-Левая сторона сердца

--Левое предсердие

---Стенка левого предсердия

----Собственная стенка левого предсердия

-----Стенка выводной части левого предсердия

------Гребневидная мышца левого предсердия

Все перечисленные компоненты связаны между собой отношением partOf, в направлении снизу вверх. Следовательно, Гребневидная мышца левого предсердия является частью Стенки выводной части левого предсердия является частью Собственной стенки левого предсердия и так далее. Отношение PartOf имеет транзитивную природу, которая выражается утверждением: «если A связано с B и B связано с C, то A связано с C». Например: «Если a≤b и b≤c, то a≤c». Используя транзитивность отношения PartOf, автоматизированное рассуждение дает ответы на такие вопросы, как «Является ли гребенчатая мышца левого предсердия частью стенки собственно левого предсердия?» Это очевидно для знаний эксперта в предметной области, но неявно для компьютерной программы и потребовало бы добавления нескольких строк кода, если бы не использовались онтологии. Напротив, онтологии предоставляют мощные автоматизированные механизмы вывода без добавления новых операторов «если-то» в программный код. Онтологический рассуждатель может автоматически вывести тот факт, что гребенчатая мышца левого предсердия является частью стенки собственно левого предсердия, обрабатывая отношения partOf.

Рисунок 7 – Базовая структура DO

Рисунок 8 – Структура онтологии FMA

Онтологии и Индустрия 4.0

В связи с быстрым развитием цифровых технологий в рамках перехода к Индустрии 4.0 обрабатывающая промышленность, коммуникационные технологии (ИКТ) и Интернет вещей становятся все более взаимосвязанными[18]. Преимущества цифровизации приводят к росту эффективности и производительности во многих производственных областях. Однако увеличение объема, разнообразия и доступности данных в результате увеличения числа взаимосвязанных физических объектов и информационных систем становится проблемой при разработке надежных и сертифицируемых методологий перехода от традиционной производственной системы к интеллектуальной системе [19]. Данные во все более сложных производственных системах становятся гораздо более фрагментированными, изолированными и разрозненными. Поскольку системы ERP, PLM (Управление жизненным циклом продукта), MES (Системы управления производством) имеют свои собственные модели данных и различные интерфейсы или протоколы, общие производственные данные не могут быть легко переданы между различными системами. Эту проблему необходимо решать с использованием сильной общей методологии [18]. Моделирование онтологий может частично играть эту роль для перепроектирования и централизации моделей данных. Идея, предложенная в исследовании [18], показанная на рисунке 9, заключается в использовании онтологии InPro, предназначенной для упрощения процесса и хранения всех производственных данных, связанных с несколькими аспектами производственного рабочего процесса, в единой графовой базе данных. Рисунок 10 иллюстрирует основную онтологическую модель InPro [18]. Вот несколько других применяемых на практике онтологий и инструментов:

  • Онтологии SSN и SOSA;
  • MASON;
  • PSL;
  • RAMI 4.0.

Онтологии SSN и SOSA. Ощущение, выборка и приведение в действие считаются фундаментальными функциями в IoT и Industry 4.0. Для выполнения более сложных действий на основе данных датчиков требуется семантическая интерпретация наблюдаемых простых значений данных датчиков. Это помогает искать, повторно использовать, интегрировать и интерпретировать наблюдаемые данные в огромном количестве различных контекстов и вариантов использования. Онтологии семантической сенсорной сети (SSN) и датчика, наблюдения, выборки и привода (SOSA) обеспечивают гибкость и согласованность для представления сущностей, отношений и действий, связанных с восприятием, выборкой и приведением в действие. SOSA предоставляет легкое ядро ​​для SSN и минимальный уровень взаимодействия. На рисунке 11 представлен обзор концептуальных модулей онтологий SOSA/SSN. На следующих рисунках 12–17 показаны структуры онтологии наблюдения, выборки и приведения в действие действий [20].

MASON. Управление жизненным циклом продукта требует единого способа описания производственных процессов. Универсальным производителям необходимо динамически корректировать свои производственные мощности в координации с поставщиками, клиентами и другими подразделениями внутри компании [22]. В статье [21] авторы утверждают, что область производства представляет собой сумму концепций продукта, процесса и ресурса. Область производства определяет отношения между этими концепциями, управляемыми следующими основными элементами: информационными системами, правилами и общим словарем [22]. Онтология семантики производства предлагается в качестве онтологии верхнего уровня в области производства [22]. На рисунке 18 показаны основные классы и свойства объектов онтологии MASON [22]. Онтология MASON применяется в практической реализации в производственных вариантах использования в качестве оценки стоимости и многоагентных систем [22]. Для оценки стоимости вся необходимая информация (ресурсы и детали процесса сборки) и правила могут быть собраны из инстанцированной онтологии MASON [22]. Для многоагентных систем, где различные агенты должны взаимодействовать друг с другом, онтология MASON предоставляет когнитивную модель агентов, которая обеспечивает базу знаний и возможности рассуждения [22].

PSL. Производственный процесс представляет собой последовательность действий, которые составляют сборку и преобразование сырья в конечный продукт. Язык спецификации процессов (PSL) является популярным формальным представлением (частично онтологическим) производственных процессов [23]. Такие области моделирования производственных процессов, как планирование, планирование процессов, имитация, рабочий процесс, управление проектами, охватываются PSL. Онтология PSL была разработана Национальным институтом стандартов и технологий (NIST) [23]. Одна из причин изобретения PSL была связана с проблемой того, что существующие подходы к моделированию процессов не содержат единой спецификации семантики терминологии процесса [24]. Когда в разных проектах терминология процесса и спецификации процесса не согласованы, то анализ, повторное использование и обмен знаниями затрудняются. Рисунок 19 иллюстрирует различия в терминологии процесса между двумя процессами [24]. PSL по сути использует и расширяет формат обмена знаниями (KIF) в качестве стандарта для обмена информацией о производственных процессах [20]. Рисунок 20 иллюстрирует, что ядро ​​PSL основано на фундаментальных теориях, а именно на теории множеств и исчислении ситуаций [24]. Дефиниционное расширение — это расширение, новые языковые элементы которого могут быть полностью определены в терминах фундаментальной теории и ядра PSL [24]. Недефиниционные расширения, конечно, являются расширениями, которые включают по крайней мере одно понятие, которое не может быть определено в терминах ядра PSL и выбранной фундаментальной теории [24]. Рисунок 21 представляет собой другой вариант перспективы для структуры PSL, где овалы представляют расширения за пределами ядра PSL, скругленные прямоугольники представляют часть ядра PSL, включая основные концепции – Действия, Вхождения Действия, Временные Точки и Объекты [23].

RAMI 4.0. Модель эталонной архитектуры Industry 4.0 (RAMI 4.0) – это инструмент, который обеспечивает подход к классификации производственных активов в виртуальном мире [25]. В рамках RAMI 4.0 актив может быть контекстуализирован на протяжении всего его жизненного цикла путем указания его данных, информации, протоколов связи и бизнес-функций [25]. RAMI 4.0 разработан как интеграция [26]:

  • жизненный цикл и поток создания ценности IEC 62890;
  • иерархические уровни IEC 62264 и IEC 61512;
  • дополнительные слои в качестве третьего измерения – уровень активов, уровень интеграции, уровень связи, уровень информации, функциональный уровень, бизнес-уровень.

На рисунке 9 представлены слои RAMI 4.0 [26]. Слои RAMI 4.0 являются моделью для проектирования внедрения систем Industry 4.0, но они не являются частью графа знаний [26]. Уровни RAMI 4.0 предоставляют абстрактную справочную модель для разделения функций и ответственности через группы, представленные в виде слоев. Однако обмен данными между слоями может быть реализован в отношении процессов хранения и рассуждений в онтологически-ориентированном стиле.

Рисунок 9 – Концептуальная архитектура онтологии InPro

Рисунок 10 – Основная онтологическая модель InPro

Рисунок 11 – Обзор модулей онтологии SOSA/SSN

Рисунок 12 - Обзор классов и свойств SOSA (перспектива наблюдения)

Рисунок 13 - Обзор классов и свойств SSN (перспектива наблюдения)

Рисунок 14 - Обзор классов и свойств SOSA (перспектива приведения в действие)

Рисунок 15 - Обзор классов и свойств SSN (перспектива срабатывания)

Рисунок 16 - Обзор классов и свойств SOSA (перспектива выборки)

Рисунок 17 - Обзор классов и свойств SSN (перспектива выборки)

Рисунок 18 – Онтология MASON, основные классы и свойства объектов

Рисунок 19 – Пример терминологического разнообразия в двух процессах

Рисунок 20 - Семантическая архитектура PSL

Рисунок 21 – Расширенная перспектива семантической архитектуры PSL

Рисунок 22 – Слои RAMI 4.0

Онтологии в финансовой сфере

Самой известной онтологией в финансовой сфере является Financial Industry Business Ontology (FIBO). FIBO стандартизирована и спонсируется Object Management Group (OMG) и Enterprise Data Management Council (EDMC) [27]. На рисунке 23 показан фрагмент иерархии классов FIBO с общими сущностями предметной области – учетными записями и типами клиентов. Основными целями онтологии FIBO являются совместное использование и повторное использование базовой модели данных финансовой сферы – в унифицированной, повторно используемой, машиночитаемой, независимой от приложения форме. Стандартная модель данных FIBO имеет потенциал в сокращении избыточного количества моделей данных (одних и тех же сущностей предметной области), связанных с конкретной архитектурой приложения. Использование унифицированной модели данных в этой сфере позволяет сократить затраты на разработку, обслуживание общих служб и упростить процесс обмена финансовыми данными между финансовыми учреждениями по всему миру. Модель FIB DM (Financial Industry Business Data Model), описанная в [28], предоставляет инструменты для преобразования онтологии FIBO в традиционное представление модели данных, которое может быть доступно в хорошо известном программном обеспечении и форматах. Другая известная онтология в финансовой сфере — это онтология регулирования финансовой сферы (FIRO). FIRO была разработана в ответ на возросшие проблемы, с которыми сталкивается финансовая сфера в плане управления, риска и соответствия. FIRO предложила методологию и структуру для частичной автоматизации и оптимизации процессов, связанных с AML и другими видами регулирующей деятельности [29]. В таблице 2 перечислены модули онтологии FIRO [29]. Объединяя онтологии (такие как FIBO, FIRO и другие) с установленными стандартами, такими как ISO 2022, XBRL создает значительные возможности. Эта синергия может способствовать решению одной из самых сложных проблем в финансовой сфере, связанной с борьбой с мошенничеством и AML: обнаружение подозрительных транзакций/операций путем вычисления сложной цепочки отношений между активами транзакций, получателями и отправителями или обнаружения аффилированных лиц. В статье [31] представлена ​​онтология обнаружения и сдерживания финансового мошенничества (FFD), которая позволяет идентифицировать подозрительные транзакции на основе действий банковских клиентов. В работе [32] представлен пример использования машинного обучения на основе графов для своевременного реагирования при выявлении операций по отмыванию денег.

Рисунок 23 – Фрагмент структуры онтологии FIBO

Таблица 2 – Модули FIRO

Название модуля FIROОписание модуля FIRO
FIRO-HЭта онтология описывает высокоуровневые концепции и их взаимосвязи на основе регулирующих инициатив финансовой отрасли. Сюда входят такие концепции, как Обязательство, Запрет, Освобождение или Санкция.
FIRO-SЭта онтология моделирует общую структуру парламентского, законодательного и судебного документа. Для этой цели в качестве основного источника для определения этой онтологии используется стандарт Акома Нтосо [30]
FIRO-[Домен]Эта онтология описывает концепции и их отношения для доменно-зависимых правил. В настоящее время FIROAML для регулирования борьбы с отмыванием денег находится в стадии разработки.
FIROOp[Цель]Эта онтология объединяет все три предыдущие, чтобы поддержать определенную цель и задачу в процессе управления нормативными изменениями.

LLM и онтологии

В последнее время LLM стал передовой технологией в области ИИ. Широкомасштабное использование LLM во многих областях порождает новые проблемы. Обучение моделей LLM на реальных или локальных корпоративных данных является одной из самых сложных проблем, с которыми сталкивается отрасль ИИ. В качестве решения этой проблемы во многих случаях успешно применяется подход Retrieval Augmented Generation (RAG). RAG предполагает, что перед отправкой пользовательского запроса LLM контекст создается с помощью соответствующего информационного поиска в определенной базе знаний или базе данных. Если поиск успешен, его результат добавляется в пользовательский запрос, предоставляя дополнительную контекстную информацию из пользовательской базы знаний или базы данных. База знаний или база данных должна быть разделена на набор фрагментов, каждый из которых представляет небольшой набор фактов. Ввод этих фактов в запрос позволяет предоставить LLM необходимую информацию, которая не была известна во время обучения. Подход RAG часто работает с частными данными, извлеченными из баз данных, такими как баланс счета. Работа [33] иллюстрирует существенные преимущества использования GraphRAG по сравнению с базовым RAG. GraphRAG использует LLM для создания графа знаний на основе частной базы данных, этот граф затем используется вместе с графовым машинным обучением для выполнения дополнения подсказки во время запроса [33]. Несмотря на то, что граф, созданный LLM, не нормализован (и, вероятно, не оптимален), сам факт использования онтологического моделирования предполагает очень многообещающее будущее для графовых технологий. В другой статье [34] исследователи обосновали, что GraphRAG является сильным методом для реферирования, ориентированного на запросы. В работе [36] показан пример использования GraphRAG для упрощения выполнения задач по манипулированию кодом для LLM.

Обсуждение

Несмотря на многообещающий потенциал онтологий, существует ряд трудностей и ограничений для их масштабирования во всех областях, упомянутых в этой работе:

  1. По сравнению с традиционным подходом, ориентированным на приложения, онтологии требуют гораздо больших усилий на этапах проектирования архитектуры и моделей данных. Это окупается на этапах внедрения и, особенно, на этапах производства и обслуживания.
  2. Онтология имеет свой собственный стек языка и представления моделей, программные решения, методологию моделирования, которые все еще не очень хорошо известны широкому кругу ИТ-специалистов.
  3. Отсутствие специалистов по моделированию онтологий.
  4. Отсутствие продвижения онтологий со стороны ТОП-компаний и технологических гигантов.
  5. Отсутствие поставщиков и интеграторов решений на основе онтологий.

Как мы показали ниже, многие варианты использования в передовых отраслях (которые способствуют развитию технологического прогресса) уже используют онтологии как лучшую форму цифрового представления знаний о предметных областях реального мира. Онтологии как формализм представления знаний основаны на научных теориях, в частности на математической логике. Этот факт позволяет проектировать и разрабатывать унифицированные, ориентированные на данные, независимые от приложений, многократно используемые, масштабируемые, совместимые, логически проверяемые и стандартизированные решения. Решения на основе онтологии в их текущем виде могут оптимизировать затраты на разработку и обслуживание за счет сокращения количества приложений и интеграционных взаимодействий, а также упрощения управления изменениями. Gartner делает следующий окончательный вывод относительно графов знаний и онтологий [35]:

«...Но одним из выдающихся моментов в цикле ажиотажа этого года является центральное положение графов знаний. Расположенные на «склоне просвещения», графы знаний все больше понимаются с точки зрения их преимуществ для предприятий, что приводит к большему количеству пилотных проектов. Они признаны критически важными факторами для эффективного применения генеративного ИИ в корпоративных средах».

Ссылки

  1. Comparing ontologies and databases: a critical review of lifecycle engineering models in manufacturing, Borja Ramis Ferrer, Wael M. Mohammed Mussawar Ahmad, Sergii Iarovyi, Jiayi Zhang, Robert Harrison, Jose Luis, Martinez Lastra.
  2. Ontologies versus relational databases: are they so different? A comparison. Carmen Martinez-Cruz · Ignacio J. Blanco · M. Amparo Vila.
  3. Ontologies and Object models in Object Oriented Software Engineering, Dr. Waralak V. Siricharoen.
  4. Ontology for Autonomous Robotics. Joanna Isabelle Olszewska, Joel Luis Carbonera, Alberto Olivares-Alarcos, Sandro Rama Fiorini, Maki Habib,Signe Redfield, Alaa Khamis, Julita Bermejo-Alonso, Paulo Goncalves, S. Veera Ragavan, Abdelghani Chibani, Edson Prestes, Edison Pignaton de Freitas, Marcos Barreto, Ricardo Sanz, Bruce Spencer, and Howard Li.
  5. ORPP—An Ontology for Skill-Based Robotic Process Planning in Agile Manufacturing. Congyu Zhang Sprenger, Juan Antonio Corrales Ramón and Norman Urs Baier.
  6. RTPO: A Domain Knowledge Base for Robot Task Planning. Xiaolei Sun, Yu Zhang * and Jing Chen.
  7. The CRAM Cognitive Architecture for Robot Manipulation in Everyday Activities, M. Beetz, Gayane Kazhoyan, D. Vernon.
  8. https://www.knowrob.org/knowrob
  9. OntoSLAM: An Ontology for Representing Location and Simultaneous Mapping Information for Autonomous Robots.
  10. Chang, D.S.; Cho, G.H.; Choi, Y.S. Ontology-based knowledge model for human-robot interactive services. In Proceedings of the 35th Annual ACM Symposium on Applied Computing, Brno, Czech Republic, 30 March–3 April 2020; pp. 2029–2038.
  11. Fortes, V. A Positioning Ontology for C-SLAM; Monograph; UFRGS—Curso de Bacharelado em Ciencia da Computacao:Rio Grande do Sul, Brazil 2013; pp. 23–33.
  12. The role of ontologies in biological and biomedical research: a functional perspective. Robert Hoehndorf, Paul N. Schofield and Georgios V. Gkoutos.
  13. The Gene Ontology Handbook. Christophe Dessimoz, Nives Škunca Editors.
  14. https://bioportal.bioontology.org/ontologies/CL
  15. https://disease-ontology.org/do/
  16. https://bioportal.bioontology.org/ontologies/FMA?p=classes&conceptid=root
  17. A reference ontology for biomedical informatics: the Foundational Model of Anatomy. Cornelius Rosse* and Jose L. V. Mejino Jr.
  18. Ontology-based knowledge representation of industrial production workflow. Chao Yang , Yuan Zheng, Xinyi Tu, Riku Ala-Laurinaho, Juuso Autiosalo, Olli Seppanen , Kari Tammi.
  19. Intelligent Manufacturing in the Context of Industry 4.0: A Review. Ray Y. Zhong , Xun Xu, Eberhard Klotz , Stephen T. Newman.
  20. https://www.w3.org/TR/vocab-ssn/#overview-of-classes-and-properties
  21. P. Martin and A. D'Acunto. Design of a production system: an application of integration product-process. Int. J. Computer Integrated Manufacturing, 16(7-8):509–516, 2003.
  22. MASON: A Proposal For An Ontology Of Manufacturing Domain. Severin Lemaignan, Ali Siadat, Jean-Yves Dantan, Anatoli Semenenko. LGIPM - Ecole Nationale Superieure d'Arts et Metiers.
  23. Ontologies for Manufacturing Process Modeling: A Survey. Qiushi Cao[0000-0002-5858-0680 ], Cecilia Zanni-Merk[0000-0002-5189-9154] and Christophe Reich[0000-0001-9831-2181].
  24. The Process Specification Language (PSL) Overview and Version 1.0 Specification. Craig Schlenoff Josh Lubeil, Michael Gruninger, Florence Tissot, John Valois, Jintae Lee.
  25. Towards an ontology-based dictionary for production planning and control in the domain of injection molding as a basis for standardized asset administration shells. Patrick Sapel, Christian Hopmann
  26. Ontologies in Industry 4.0: Standards, Applications, and Methodologies. Master Thesis. Roman Korecky.
  27. https://edmcouncil.org/financial-industry-business-ontology/
  28. https://fib-dm.com/
  29. Ontology-Driven Financial Regulatory Change Management: An Iterative Development Process. Angelina Espinoza, Elie Abi-Lahoud, Tom Butler.
  30. Akoma Ntoso 3.0: XML for parliamentary, legislative and judiciary documents., United Nations Department of Economic and Social Affairs (UNDESA) Std., 2014.
  31. A semantic rule based digital fraud detection. Mansoor Ahmed, Kainat Ansar, Cal B. Muckley, Abid Khan, Adeel Anjum, Muhammad Talha.
  32. Intelligent Anti-Money Laundering Fraud Control Using Graph-Based Machine Learning Model for the Financial Domain. Atif Usman, Department of Computer Science and Information Technology, Virtual University of Pakistan, Pakistan.
  33. https://www.microsoft.com/en-us/research/blog/graphrag-unlocking-llm-discovery-on-narrative-private-data/
  34. From Local to Global: A Graph RAG Approach to Query-Focused Summarization. Darren Edge, Ha Trinh, Newman Cheng, Joshua Bradley, Alex Chao, Apurva Mody, Steven Truitt, Jonathan Larso.
  35. https://www.linkedin.com/pulse/gartner-hype-cycle-ai-why-knowledge-graphs-essential-enterprises-ykr6e/
  36. Xiangyan Liu et al. CODEXGRAPH: Bridging Large Language Models and Code Repositories via Code Graph Databases. https://arxiv.org/pdf/2408.03910v2

Свяжитесь с нами