03-01-img-uslugi

Нормализация нормативно-​справочной информации

Нормативно-​справочная информация (НСИ) – это основа и фундамент любой информационной системы управления предприятием. В состав НСИ (в западной терминологии – мастер-​данные) входят словари, информационно-​технические справочники, каталоги и классификаторы, т.е. все не транзакционные данные, которые не претерпевает существенных изменений в процессе повседневной деятельности компании.

НСИ используются в прикладных информационных системах управления организацией при формировании необходимый отчетности, планировании и анализе финансовой деятельности. Качество управленческих решений напрямую зависит от качества мастер-​данных. Ошибки в НСИ, связанные с неактуальной и недостоверной информацией, приводят к серьезными финансовым потерям на предприятии.

Если при формировании баз данных НСИ не использовались единые стандарты, положения и локальные нормативные акты организации, то необходим этап нормализации, который позволит сделать корпоративные мастер-​данных качественными и структурированными.

Проблемы и потребности компаний к системе управления НСИ

В каждой компании используется не одна, а несколько информационных систем, поддерживающих различные бизнес-​процессы, в которых независимо друг от друга ведутся одни и те же базы данных НСИ. Типичная ситуация для большинства компаний – это низкое качество корпоративных мастер-​данных:

  • ошибки в наименованиях, описаниях и параметрах номенклатурных объектов;
  • неполнота атрибутивного состава номенклатурных объектов;
  • проблемы с разнесением объектов МТР по иерархии классификации;
  • наличие дублирующих записей;
  • устаревшие наименования и обозначения.

Перечисленные проблемы не позволяют однозначно идентифицировать номенклатурные позиции в базе данных НСИ, что приводит к уменьшению и дроблению объема заказов, к образованию складских неликвидов и повышению трудоемкости процесса формирования консолидированной отчетности.

Процесс нормализации записей справочников включает в себя следующие этапы:

  1. Аудит нормативно-​справочных данных с целью оценки их качества:
    • позволяет получить «взгляд со стороны» на проблемные участки в ведении НСИ и принять необходимые решения по составу и охвату требуемых изменений. Этап предусматривает разработку методик по нормализации данных, определение и согласование уровней классификации и моделей данных НСИ.
  1. Разработка и согласование методик по нормализации НСИ:
    • согласовываются правила и стандарты нормализации данных, которые в дальнейшем будет основой управления НСИ в компании;
    • определяется и согласовывается уровень нормализации (выделение классов, структурирование, обогащение, создание параметрической модели и т.д.)
  1. Формирование шаблонов описания позиций:
    • определяется онтологическая потребность (создание шаблонов описания объектов номенклатуры).
  1. Разработка регламентов по ведению справочников НСИ:
    • разрабатываются инструкции по взаимодействию пользователей и экспертов НСИ;
    • разрабатывается описание процессов создания и редактирования объектов НСИ.
  1. Формирование справочников, нормализация и наследование контента:
    • нормализация мастер-​данных;
    • стандартизация значений атрибутов номенклатурных объектов;
    • определение потенциальных дубликатов.
  1. Сопровождение справочников:
    • уровень сопровождения согласовывается персонально для каждого Заказчика.

Инструменты нормализации

Весь процесс нормализации, в том числе формирование каталожных описаний, реализуется с помощью специализированной подсистемы разбора неструктурированных данных, которая позволяет контролировать качества исходной информации и производить нормализацию больших объемов неструктурированной НСИ. На этапе ввода информации контролируется: типизация атрибутов, опции обязательности и уникальности значений атрибутов, соответствие маске, списки допустимых значений атрибутов.

В состав подсистемы входит модуль разбора строк, который позволяет автоматизировать процесс нормализации данных. Исходная строка, содержащая наименование номенклатурного объекта, разбивается на атрибуты в зависимости от его принадлежности к определённому классу объектов НСИ.

Алгоритмы нечеткого поиска на основе методов N-​грамм и Левенштейна, позволяют осуществлять поиск дублей, назначать выявленные дубликаты аналогами эталонных объектов НСИ или производить слияние их атрибутивного состава.

Функционал подсистемы разбора неструктурированных мастер-​данных:

  • наследование мастер-​данных в прикладные информационные системы Заказчика в требуемом формате;
  • выявление ошибок и отклонений в описании номенклатурных позиций;
  • автоматический разбор результатов импорта исходных данных, включая поиск дубликатов;
  • экспертный анализ результатов, включая работу с дубликатами и выявление эталонных записей;
  • упрощенный бизнес-​процесс по контролю качества мастер-​данных;
  • генерация описания на основе методики нормализации мастер-​данных по номенклатуре.

Компания SDI Solu­tion предлагает полный комплекс услуг в области управления качеством НСИ от аудита до внедрения специализированных систем, основанных на передовых методиках корректного ведения нормализованных мастер-​данных.