На любом крупном предприятии работает множество автоматизированных систем. Часто одни и те же наборы данных обрабатываются в нескольких приложениях в рамках автоматизации близких бизнес-процессов. Например, в банках за автоматизацию расчетных операций отвечает система АБС, но работа по привлечению новых клиентов и планированию маркетинговых коммуникаций происходит в CRM-системе, обработка заявок на кредиты - в специализированном ПО, а за работу интернет-банкинга отвечает отдельный программный комплекс.
Все эти системы работают с одними и теми же данными: о клиентах, расчетных счетах и банковских продуктах, договорах. Каждое из приложений может изменять эти данные, а все остальные должны быстро узнать об изменениях. Возникает потребность в создании ещё одной системы, которая будет вести эталонные данные и распространять их в бизнес-приложения. Такие системы называются MDM (Master Data Management, управление мастер-данными).
Любая MDM-система должна выполнять следующие функции:
- Управление составом и структурой мастер-данных: поскольку требования к ним меняются в зависимости от потребностей бизнеса, нужна возможность добавлять в набор эталонных данных новые типы объектов и их свойства.
- Управление объектами данных: иногда нужно редактировать мастер-данных прямо из MDM-системы. Часто для этого нужно проводить согласование изменений в соответствии с шаблоном бизнес-процесса.
- Отслеживание изменений в данных бизнес-приложений и их автоматическая загрузка в MDM с преобразованием структуры.
- Нормализация, или очистка данных: полученную от приложений информацию нужно очистить от ошибок ввода, привести значения некоторых свойств к стандартному формату. Нормализация должна выполняться с помощью правил, настраиваемых аналитиком, а не с помощью запрограммированных процедур.
- Валидация, или форматно-логический контроль: система должна позволять настроить набор правил, на соответствие которым проверяются все загруженные данные. Правила могут быть информационными или блокирующими: значения свойств объектов, не отвечающие блокирующим правилам, не должны попадать в эталонные объекты.
- Дедупликация и связывание объектов данных, описывающих один и тот же бизнес-объект: например, карточки одного клиента могут быть получены из разных систем, а в некоторых конкретных системах могут существовать дубли карточек
- Формирование эталонных записей: система должна позволять настроить правила формирования эталонных объектов данных. Такие объекты должны консолидировать самую свежую, достоверную, проверенную информацию о каждом бизнес-объекте
- Распространение эталонных данных в системы-источники: MDM-система должна обладать развитым API, чтобы с ней легко было интегрировать бизнес-приложения, которым необходимо получить эталонные данные синхронным или асинхронным (по подписке) способом. Этот же блок функций должен позволять формировать витрины эталонных данных
- Анализ данных: включает различные виды статистического анализа, а также просмотр отчетов о применений правил проверки данных. Дата-стюарды должны иметь возможность просматривать объекты данных, не прошедшие форматно-логический контроль, и корректировать их непосредственно в MDM или со стороны систем-источников.
Часто MDM-системы делят по назначению в зависимости от того, какие именно данные в них обрабатываются.
- PIM (Product Information Management) - системы для обработки данных о продукции, номенклатуре выпускаемых или используемых изделий. Имеют развитую функциональность в части хранения значений свойств изделий, присвоения им позиционных кодов, в которых каждая группа символов означает определенные характеристики. Может быть реализовано управление единицами измерения физических величин и преобразование значений свойств из одних единиц в другие.
- CDI (Customer Data Integration) - самый распространенный вид MDM-систем, предназначенный для обработки данных о клиентах. Может развиваться в сторону систем класса Customer 360, которые хранят не только основные, редко изменяющиеся данные о клиентах, но и консолидируют все сведения о взаимодействиях с ними. Системы CDI содержат функции интеграции с государственными источниками данных о физических и юридических лицах, правила очистки контактной информации.
Другой способ классификации MDM-систем - по назначению в бизнес-процессах: выделяют операционные MDM, ориентированные на распространение данных между приложениями в реальном времени, и аналитические, которые только аккумулируют данные из всех бизнес-приложений с целью анализа.
Мы в DataVera считаем обе классификации устаревшими: современное MDM-решение должно обрабатывать любые данные независимо от предметной области, и выполнять как аналитические, так и операционные функции. Наш продукт DataVera EKG Platform работает именно так.
Внедрение MDM создает следующие преимущества для бизнеса:
- Снижение потерь из-за возможных ошибок в данных. Так, из-за не обновленных своевременно данных о клиенте менеджер может принять неверное решение при работе с клиентом, которое обернется прямыми потерями или недополученной прибылью. На уровне всего предприятия анализ очищенных, эталонных данных позволит принимать обоснованные управленческие решения.
- Замена множества интеграций "точка-точка" между автоматизированными системами на централизованный обмен данными через MDM позволит сделать бизнес-процессы более надежными и быстрыми, а также сократить операционные расходы на поддержку интеграций и более рационально распорядиться ИТ-бюджетом.
- Возможность управлять структурой основных корпоративных данных из одной точки ускорит настройку и доработку бизнес-приложений в соответствии с требованиями бизнеса. Это позволит быстрее внедрять инновации и проводить цифровую трансформацию компании.
- Наличие готового набора эталонных данных ускорит внедрение новых бизнес-приложений и снизит стоимость таких проектов. Это даст возможность бизнесу быстрее применять самые современные и эффективные ИТ-решения, чтобы обогнать конкурентов.
DataVera EKG Platform соответствует всем перечисленным функциональным требованиям и позволяет реализовать указанные преимущества.
Так, в DataVera EKG Platform реализованы следующие правила валидации и очистки данных:
- Приведение ФИО и других строковых значений к единому регистру: верхний, нижний, CamelCase
- Удаление лишних, повторяющихся и специальных символов (пробелов, дефисов и др.)
- Исправление ошибок раскладки клавиатуры при вводе - например, замена английских букв "а", "о", "с" и др. на соответствующие символы кириллицы, и наоборот
- Нормализация и проверка казахстанских номеров мобильных и городских телефонов, проверка телефонных кодов
- Контроль повторяющихся символов в номерах телефонов, документов, ИИН и других кодах: значение таких полей не может состоять только из 0, 1 или других символов
- Проверка соответствия ИИН полу и дате рождения
- Парсинг и проверка дат: рождения, выдачи документов и др.
- Парсинг почтовых адресов, составление канонического адреса, определение кода КАТО или проверка соответствия кода КАТО адресу (эта функция доступна на нашем сайте как отдельный сервис)
- Определение дубликатов объектов данных по различным критериям: клиентов - по ИИН или номеру телефона, документов - по типу и номеру, и др.
Аналитик без вмешательства в программный код может настроить в системе любые другие правила очистки, валидации и дедупликации данных. Правила могут включать условия - например, в зависимости от наличия значений одних свойств объекта становятся обязательными для заполнения другие свойства.
Наш продукт, созданный казахстанским вендором, успешно внедряется в крупных финансовых организациях. Наша команда имеет обширный опыт внедрения MDM и в промышленности, на предприяиях разных отраслей.
Предлагаем ознакомиться с более подробной информацией о нашем MDM-решении, услугах по внедрению MDM, и связаться с нами, чтобы обсудить Ваши задачи.