На фоне роста объема данных все больше организаций, вне зависимости от географии и сферы деятельности, приходят к решению сделать свои IT-ландшафты дата-центричными.

Принцип и преимущества дата-центричности

Дейв Маккомб (Dave McComb), основатель компании Semantic Arts и автор концепции дата-центричной архитектуры (ДЦА), в своей книге "The Data-Centric Revolution: Restoring Sanity to Enterprise Information Systems" (2019) дает следующее определение: "Дата-центричной является архитектура, в которой данные принимаются за основной и постоянный актив, а приложения приходят и уходят. В архитектуре, ориентированной на данные, модель данных предшествует реализации любого приложения и будет существовать и действовать еще долго после того, как оно исчезнет".

Проще говоря, идея ДЦА состоит в том, чтобы избавиться от базы данных внутри каждого приложения. Вместо этого любое приложение должно работать с единым корпоративным облаком данных, в котором каждый бизнес-объект имеет только одно, достоверное и полное представление. Представьте себе MDM, который хранит абсолютно все корпоративные данные, и не синхронизирует их между приложениями, а лишь предоставляет через API. Плюсы этого подхода очевидны: исчезает необходимость в интеграции и решается множество проблем управления данными.

В настоящее время ряд IT-компаний предлагают частному бизнесу и государственным организациям решения для перехода к дата-центричной модели. Однако эти предложения не всегда принимаются, так как трансформация может показаться сложной и дорогой.

"Если вы проведете анализ первопричин, вы в конечном итоге получите сложность как основной фактор отсутствия гибкости бизнеса. Наши системы стали очень сложными и сильно взаимозависимыми (что является лишь дополнительным измерением сложности), так что даже самые простые изменения становятся экономически неоправданными. У нас есть много клиентов, для которых добавление нескольких полей в базу данных может быть проектом стоимостью в сотни тысяч долларов, из-за чего многие изменения не предпринимаются. Вместо этого бизнес-пользователи полагаются на локальные меры, что дает им краткосрочное решение, но продолжает усложнять систему", сообщил Дейв Маккомб в основополагающем интервью для издания Business Rules Community (2018).

Существуют варианты постепенного перехода к ДЦА. Например, первым шагом может стать связывание всех данных в Корпоративный граф знаний (Enterprise Knowledge Graph). При этом, если ранее данные об объектах каждого типа были рассеяны между разными хранилищами, в EKG они консолидируются в цельное представление. Структура информации в EKG единой онтологической моделью данных. Это позволяет объединить разнородные данные в связное представление, с которым смогут работать аналитики и программисты, решая свои прикладные задачи. В том числе EKG может стать единственным источником информации для новых бизнес-приложений, которые уже не будут иметь своей СУБД. Постепенный рост числа таких приложений позволит плавно двигаться по пути полного перехода к дата-центричной архитектуре.

 Мы создали онтологию для Департамента транспорта штата Вашингтон. В корпоративной модели были такие понятия, как геопространственные точки, дороги, контактная информация, организации, физические вещества (гравий, бетон и пр.) и то, что они называли  дорожными объектами  […] – ограждения, знаки, деревья и пр.) , – рассказал Дейв Маккомб в интервью.

Структурированный массив данных существует в самостоятельном хранилище, что предоставляет множество преимуществ:

  • Снижается зависимость от конкретных бизнес-приложений. Так как данные не содержатся в хранилищах приложений, обновление ПО становится менее трудоёмким, упрощается замена устаревших приложений на новые.
  • Структура данных и правила их обработки могут быть изменены в любой момент.
  • Если информация содержится в нескольких базах данных, это становится причиной её дублирования. В ДЦА ненужные дубликаты не создаются, а значит, не требуется дополнительных ресурсов для их хранения.
  • Упрощается процесс получения аналитических представлений.
  • Сокращается стоимость владения IT-инфраструктурой предприятия.

Почему переход к ДЦА необходим?

IT-ландшафт многих компаний сформирован таким образом, что его центром являются бизнес-приложения. В сочетании с ростом объема данных, обрабатываемых приложениями, и динамически изменяющимися требованиями к их обработке это становится проблемой. Поддержка, доработка и интеграция таких приложений являются сложной и дорогой задачей, поскольку любое изменение структуры данных влечет необходимость вмешательства в программный код ПО.

Разрозненное хранение данных приводит к множеству нежелательных эффектов:

  • Сотрудникам приходится искать информацию в нескольких информационных системах и/или хранилищах.
  • Так как сведения об одних и тех же объектах существует в разных базах, требуются дополнительные затраты на хранение, по сути, ненужных дубликатов. При этом часто нельзя понять, какой из экземпляров объекта является наиболее актуальным.
  • Информацию об одних и тех же объектах в разных базах данных нужно синхронизировать между собой.
  • Усложняется обновление программного обеспечения.

 Если вы все еще придерживаетесь подхода 40-летней давности и ориентируетесь на приложения, вскоре станет нереально конкурировать с современными компаниями, ориентированными на данные... Вместо того, чтобы тратиться на точечные улучшения, пришло время принять полное изменение парадигмы. Перестав решать вопрос интеграции приложений, вы мгновенно освободите 50% своих IT-ресурсов для любого проекта; у вас появится ресурс, необходимый для внедрения инноваций , – утверждает CEO и соучредитель компании Cinchy Дэн ДеМерс (Dan DeMers) в статье  The Shift from an App-Centric to Data-Centric Architecture  (2021).

Конечно, существуют и другие причины перехода к ДЦА, такие как безопасность данных. Тем не менее, растущий объем информации и усложнение ее структуры имеют ключевое значение. Данные могут как приносить пользу организации, так и быть для нее обузой. Современным организациям, если они желают продуктивно расходовать свой ИТ-бюджет и монетизировать свои данные, стоит двигаться в сторону дата-центричности.

DataVera предлагает казахстанским компаниям, столкнувшимся с проблемами резкого роста объема и сложности структуры данных, использовать возможности, которые предоставляют современные информационные технологии для радикального снижения затрат на интеграцию данных, повышения скорости вывода на рынок цифровых продуктов, трансформации бизнеса с помощью использования данных.

Свяжитесь с нами