Нормативно-справочная информация (НСИ) – это основа и фундамент любой информационной системы управления предприятием. В состав НСИ (в западной терминологии – мастер-данные) входят словари, информационно-технические справочники, каталоги и классификаторы, т.е. все не транзакционные данные, которые не претерпевает существенных изменений в процессе повседневной деятельности компании.
НСИ используются в прикладных информационных системах управления организацией при формировании необходимый отчетности, планировании и анализе финансовой деятельности. Качество управленческих решений напрямую зависит от качества мастер-данных. Ошибки в НСИ, связанные с неактуальной и недостоверной информацией, приводят к серьезными финансовым потерям на предприятии.
Если при формировании баз данных НСИ не использовались единые стандарты, положения и локальные нормативные акты организации, то необходим этап нормализации, который позволит сделать корпоративные мастер-данных качественными и структурированными.
Проблемы и потребности компаний к системе управления НСИ
В каждой компании используется не одна, а несколько информационных систем, поддерживающих различные бизнес-процессы, в которых независимо друг от друга ведутся одни и те же базы данных НСИ. Типичная ситуация для большинства компаний – это низкое качество корпоративных мастер-данных:
Перечисленные проблемы не позволяют однозначно идентифицировать номенклатурные позиции в базе данных НСИ, что приводит к уменьшению и дроблению объема заказов, к образованию складских неликвидов и повышению трудоемкости процесса формирования консолидированной отчетности.
Процесс нормализации записей справочников включает в себя следующие этапы:
Инструменты нормализации
Весь процесс нормализации, в том числе формирование каталожных описаний, реализуется с помощью специализированной подсистемы разбора неструктурированных данных, которая позволяет контролировать качества исходной информации и производить нормализацию больших объемов неструктурированной НСИ. На этапе ввода информации контролируется: типизация атрибутов, опции обязательности и уникальности значений атрибутов, соответствие маске, списки допустимых значений атрибутов.
В состав подсистемы входит модуль разбора строк, который позволяет автоматизировать процесс нормализации данных. Исходная строка, содержащая наименование номенклатурного объекта, разбивается на атрибуты в зависимости от его принадлежности к определённому классу объектов НСИ.
Алгоритмы нечеткого поиска на основе методов N-грамм и Левенштейна, позволяют осуществлять поиск дублей, назначать выявленные дубликаты аналогами эталонных объектов НСИ или производить слияние их атрибутивного состава.
Функционал подсистемы разбора неструктурированных мастер-данных:
Компания SDI Solution предлагает полный комплекс услуг в области управления качеством НСИ от аудита до внедрения специализированных систем, основанных на передовых методиках корректного ведения нормализованных мастер-данных.