Этапы проведения бизнес анализа электронных данных

Этапы проведения бизнес анализа электронных данных

Любое внедрение информационной технологии в бизнес-аналитику можно разделить на три этапа. Вначале данные, по которым в дальнейшем будет проведен бизнес-анализ, поступают в BI-систему по каналам сообщения из разных внешних источников: CRM и ERP систем, приложений для биллинга. Лучше всего заранее посмотреть crm рейтинг, чтобы выбрать наиболее подходящую на основе отзывов. Кроме того, могут использоваться неструктурированные данные, хранящиеся в электронных таблицах, в текстовых файлах. В таких форматах данные хранятся в виде записей, разделенных определенными символами-разделителями. Также обмен данными может выполняться посредством web-сервисов. Например, так происходит рассылка биржевых данных от Bloomberg. Все данные накапливаются в хранилище данных – DWH (Data Warehouse).

Для того чтобы этими данными, представленными в разных форматах и поступающими из различных источников, можно было оперировать и сопоставлять их между собой, необходимо выполнить над ними некоторые преобразования. Для начала данные извлекают из внешних систем (выполняют Extract), после чего выполняют операцию Transform, то есть приводят данные к единому виду, затем первично обработанные данные загружают в хранилище данных (команда Load). Эти три команды объединяются в один класс процессов, работающих по ETL-алгоритмам, данные процессы явятся очень важной и неотъемлемой частью BI-системы. Таким образом, происходит построение хранилища.

Трудности объединения электронных данных

Иногда трудно собрать данные воедино, поскольку:

— данные тяжело изъять из приложений;

— в разных системах данные представлены в разных форматах;

— данные часто хранятся в записях сотрудников, а не на компьютере в электронном виде.

В основном для проведения бизнес анализа нужны не детальные данные по каждой операции, а агрегированные данные (это могут быть суммарные продажи по регионам или по категориям). С целью ускорения процессов обращения к хранилищам данных строятся витрины данных (Datamarts) и OLAP-кубы. Эти надстройки хранят данные, уже обработанные по определенным показателям и в заданном разрезе. Витрины данных построены таким образом, чтобы охватывать заданную область данных (например, персонал магазинов или продажи обуви и т.п.)

При выполнении запроса пользователя происходит выборка самого подходящего OLAP-куба, это позволяет значительно поднять скорость обработки запроса, поскольку данные в этом кубе уже сгруппированы в соответствии с пользовательским запросом. После выборки происходит построение отчетов, необходимых компании. Этот этап обычно носит название «построение отчетности».

Иллюстрация к статье: Яндекс.Картинки

Читайте также

Оставить комментарий

Вы можете использовать HTML тэги: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>