vchilka.in.ua 1

Інформаційно-аналітичні системи

обробки даних




УДК 681.3


А. В. Бойченко, В. Р. Сенченко

Інститут проблем реєстрації інформації НАН України

вул. М. Шпака, 2, 03113 Київ, Україна

e-mail: boy@cki.ipri.kiev.ua

Засоби аналізу макроекономічних показників



Розглянуто підхід до створення системи моніторингу макроекономічних показників та запропоновано комплекс технологічних рішень, здатних забезпечити аналіз та візуалізацію даних для цієї предметної області. Представлено характеристики засобів візуального аналізу статистичних даних та логічну модель даних, які реалізовані у рамках системи моніторингу.

Ключові слова: інформаційно-аналітична система, макроекономічні показники, база даних, моніторинг.


З розвитком інформаційного суспільства розширюється коло громадських та міжнародних організацій, які використовують у рамках своєї професійної діяльності макроекономічну інформацію. Постійне зростання обсягів інформації, необхідної для прийняття збалансованих рішень, примушують розробників інформа-ційно-аналітичних систем вдосконалювати процеси та технології завантаження, структуризації й аналізу різноманітних даних. Як правило, наявність у складі сучасних СУБД OLAP-засобів лише створюють умови для забезпечення швидкого доступу до агрегованих даних, але самі по собі не вирішують основних завдань аналітичної системи. Одним із шляхів вирішення проблеми є розробка гнучких програмно-інструментальних засобів, які б враховували бізнес-логіку досліджуваної предметної області. Стаття присвячена питанням побудови програмних за-стосувань для інформаційно-аналітичних систем, які використовують сховища ін-формації у сполученні з технологією аналізу даних макроекономічних показників.

Індикаторами економічного та соціального становища будь-якої країни є макроекономічні показники. Аналіз динаміки і прогнозування зміни макроекономічних показників надзвичайно важливі при розробці стратегії розвитку та прийняття рішень як на рівні країни, так і в межах її регіонів. Формування інформаційних ресурсів для дослідження макропоказників — це окрема наукова задача [8].


Нині існують спеціалізовані аналітичні програмні додатки, які призначені для застосування в різних предметних областях. Вони постачаються як крупними компаніями виробниками СУБД (Oracle, Hewlett-Packard, IBM, Microsoft), так і


© А. В. Бойченко, В. Р. Сенченко

невеликими компаніями (third-partycompany) [1, 5–7]. Для виконання інформаційно-аналітичних функцій у системах використовуються різні продукти, що приводить до ускладненої архітектури системи, необхідності інтегрувати різнорідні інструментальні середовища, додатковим витратам на придбання ліцензійних програмних засобів та їх адміністрування, проблемам узгодження даних і метаданих на різних серверах. Світовий і вітчизняний досвід побудови спеціалізованих додатків для OLAP-систем [3, 4] показує, що більша частина спеціалізованих додатків або створюється зусиллями фахівців підприємства, або силами сторонніх організацій за технічним завданням цього підприємства. Випадки використання готових програмних додатків, які налаштовуються для потреб організації є винятковими у порівнянні з практикою створення спеціальних програмних додатків. Спеціальні додатки часто модифікуються, їх життєвий цикл обмежений, тому важливо, щоби технологія їх створення припускала швидку розробку (наприклад, на основі об’єктного підходу) і внесення змін при виникненні такої необхідності. Важливо, щоб технологія дозволяла будувати розподілені системи обробки інформації, які використовують можливості транспортної сучасної корпоративної мережі.

Система моніторингу макропоказників має цілком визначену мету, алгоритми функціонування, принципи побудови, критерії оцінки, методи та технології [9]. Програмні засоби системи моніторингу макропоказників повинні включати комплекс технічних процедур, які виконують функції:

— перегляду різноманітних джерел з метою виявлення статистичної, фінан-сово-економічної, макроекономічної та соціальної інформації;

— здобуття та систематизації нових знань у відповідності з темами моніто-рингу;


— підтримки в актуальному стані проблемно-орієнтованих баз даних;

— відображення макропоказників у зручному вигляді та побудови порівняль-них діаграм за різними критеріями;

— аналізу макропоказників економічного та соціального розвитку країни;

— формування звітності.

З погляду на інформаційні технології аналітичне ядро системи моніторингу являє собою предметно-орієнтовану OLAP-систему, що підтримує функціонування інтегрованих OLAP-додатків, головними об’єктами яких є первинні документи про соціально-економічний стан країни. На головній сторінці розміщені рубрикатори, які відображають основні напрямки досліджень макропоказників. Основна інформація щодо макропоказників надається у табличному вигляді (рис. 1). Таблиця показників репрезентує показники економічного та соціального розвитку країни і налічує понад 100 макропоказників, які за змістовим принципом згруповані до різних рубрик:


  1. Валовий внутрішній продукт

  1. Індекси цін

  1. Державний бюджет України

  1. Місцевий бюджет України

  1. Зведений бюджет України

  1. Дебіторська та кредиторська заборгованість

  1. Податкова статистика

  1. Державний борг України

  1. Сектори економіки

  1. Фінансові результати діяльності підприємств

  1. Банківська діяльність


  1. Зовнішньоекономічна діяльність

  1. Рівень життя населення








Рис. 1. Головна сторінка системи моніторингу макропоказників


Структура рубрикатора є багаторівневою і дозволяє змінювати або розширювати перелік показників без суттєвої переробки структури бази даних. Архітектура БД на основі OLAP-технології є основою для створення спеціалізованих аналітичних звітів та зрізів кубів, завдяки чому обраний показник може бути переглянутий за роками, кварталами, місяцями.

Складнощі, що виникають у процесі якісного дослідження макропоказників, пов’язані не лише з пошуком необхідної інформації, але й з приведенням її до порівняльного виду. Часто таблиці з однаковою структурою, але отримані з різних джерел, містять дані, що відрізняються за ступенем актуальності та методологією розрахунку. Крім цього, виникає проблема групування декількох взаємозалежних показників у єдину таблицю.

Більшість сучасних аналітичних систем [5–7] приділяють значну увагу засобам візуального аналізу. Засоби візуального аналізу макропоказників представлені двома блоками <діаграми динаміки> і <порівняльні діаграми динаміки>. Як відомо з ергономіки [2], для сприйняття та аналізу даних графік приблизно вдвічі ефективніший табличної організації даних і значно ефективніший формули. Графіки частіше використовують при значних обсягах даних, коли потрібна якісна багатофакторна оцінка даних (ситуації). Користувач може обрати ту форму, яка найбільш відповідає цілі аналізу — динамічному, структурному, трендовому. Якщо необхідно підкреслити різницю між величинами, то віддають перевагу горизонтальній або круговій діаграмі перед вертикальною; якщо відмінності не такі наявні, навпаки, вертикальна діаграма більш ефективна. Стовпчикові діаграми дозволяють відображати співвідношення частин, які складають одне ціле. Інтеграція засобів візуалізації з OLAP-кубами дозволяє відображати у графічному вигляді будь-яки показники зі зведеної таблиці за роками, кварталами або місяцями. На рис. 2 наведені приклади відображення кругових та стовпчикових діаграм.





Рис. 2. Приклади відображення, обраних з OLAP-кубу показників,

у вигляді кругової та стовпчикової діаграми за роками


Засоби візуального відображення, які присутні у системі, суттєво змінюють уявлення експерта про методику аналізу даних. Так, експерт на основі особистого досвіду може у складних випадках, коли алгоритми автоматичного аналізу дають некоректний результат, або у простих випадках, коли інтерпретація здійснюється швидко «на погляд», використовувати не лише класичні аналітичні методи, але й звертатися до візуального аналізу. Методи візуального аналізу дають переваги при вирішенні задач:


  • експрес-аналізу фінансового, економічного та соціального стану країни: індекси цін, державного та місцевих бюджетів, боргових зобов’язань, фінансових результатів діяльності різних галузей, підприємств тощо;

  • побудови порівняльних діаграм та відображення на їхньому тлі інших діаграм динаміки;

  • визначення кореляції між показниками, які віддзеркалюють різні боки економічних та соціальних процесів;

  • побудови прогнозу — оцінки часу досягнення показниками критичних значень;

  • порівняння значення показників економічного та соціального стану країни з нормативами показниками в окремих галузях.

При проведенні таких досліджень як встановлення кореляції між різними показниками, або побудова порівняльних діаграм, аналітик має можливість вибрати для аналізу три будь-яких показника з бази даних і представити їх на одному графіку у вигляді діаграм динаміки. При відображенні на одному графіку різних показників система виконує автоматичне масштабування шкали та супроводжує графік відповідними значеннями та поясненнями. За аналогією з графічним відображенням, порівняльні діаграми динаміки будуються на даних зрізів кубів за роками, кварталами або місяцями (рис. 3).







Рис. 3. Приклади побудови порівняльних діаграм динаміки за різними критеріями


Картографічні форми відображення даних в аналітичних додатках стають все більш популярні [8, 10]. Використання картограм у системі моніторингу забезпечує наочність при дослідженні територіального розподілу обраних макропоказників (рис. 4). Засоби картографування містять ряд додаткових функцій, що дозволяють більш заглиблено вивчати статистичні дані в регіональному розрізі. При переміщенні курсору над об’єктами території видається назва відповідного об’єкта і точне значення показника, за яким побудована картограма. Можна здійснювати пошук об’єктів території на карті шляхом вибору їхніх назв зі списку. Модуль відображення даних на карті реалізований на основі технології створення Web-додатків з активним використанням інтерактивної графіки.






Рис. 4. Візуалізація макропоказників у формі картограми


У процесі складання аналітичних довідок та підготовці рішень у досвідченого експерта виникає необхідність звертання не лише до структурованих даних, представлених у вигляді OLAP-кубів, але й до баз знань, щоб остаточно переконатися у правильності показаних системою таблиць і графіків. З цих міркувань до складу системи включений блок <джерела інформування>, який безпосередньо зв’язаний з документальною базою даних, де зберігаються «першоджерела» (рис. 5). Користувачеві надаються різні способи отримання необхідного документа: або звертаючись до багаторівневого рубрикатора, або через запит на пошук документа за певними значеннями лінгвістичних ознак.




Рис. 5. Відображення документа при звертанні до блоку джерела інформування


У рамках проекту розроблене автоматизоване робоче місце з інтерфейсом завантаження та адміністрування баз даних (рис. 6). На вхід АРМ подається сукупність файлів статистичних даних з виділеною метаінформацією й очищеною структурою таблиць, що є результатом обробки першоджерел. Джерелами інформації є органи державної влади, комерційні та державні спеціалізовані структури (інформаційні центри, бібліотеки, сховища тощо), ЗМІ, громадські організації, міжнародні фонди і представництва, ресурси Internet.. Інформація може мати різні типи даних, розміри та формати, наприклад, структуровані дані у вигляді таблиць (EXL, DBF, BTV), текстові (у форматах txt, ZIP, RAR, DOC, RTF, PDF), у вигляді гіпертексту (HTML), XML-додатків або ASP-сторінок.

Програма адміністратора забезпечує завантаження даних у СУБД, формування дерева показників, опис територіальних об’єктів і одиниць виміру, можливість їхнього редагування, заповнює відсутні поля і виявляє помилки в структурі даних. Адміністратор при заповненні документальних баз аналізує матеріали (рис. 7). Задача аналізу зводиться не лише до визначення наявності або відсутності корисного об’єкта з параметрами, що характеризуються вектором S(j), але й до оцінки якості отриманої інформації за критерієм її цінності h = 1, H (<нова інформація>; <ідентична інформація> — виявлення текстів-дублікатів; <додаткова інформація>; <суперечлива інформація>; <помилкова інформація>).






Рис. 6. Головна сторінка АРМа адміністратора системи моніторингу



Рис. 7. Форми редагування даних


Інформаційоно-логічна модель предметної області визначає, яка інформація зберігається й обробляється у системі. На рис. 8 наведено концептуальну діаграму основних інформаційних об’єктів, які використані для створення системи моні-торингу макропоказників. Це — одиниці виміру (ODVYMIR), групи показників (VGROUP), регіони (REGION), властивості (PROPERTIES), посилання (REFERS), джерела надходження інформації (SBOOKS), власне показники (VALTAB), значення показників за роками (VDATA).

Система моніторингу реалізована у вигляді окремого програмного додатка з використанням набору взаємопов’язаних ASP-сторінок у середовищі СУБД Oracle 9i у сполученні з Internet Information Server, який відіграє роль Web-серверу.






Рис. 8. Інформаційоно-логічна модель предметної області


Висновки

Індикаторами стану економіки будь-якої країни є макроекономічні показники, дослідження та прогнозування яких необхідно при розробці стратегії розвитку та прийняття рішень як на рівні країни, так і на рівні її регіонів.

Ідея моніторингу полягає в аналітичному дослідженні ефективності бюджетних призначень на основі порівняння показників бюджетного процесу з макропоказниками, що визначають реальний стан економіки та соціальної сфери держави.

Запропоновані програмні засоби дозволяють вирішувати задачі аналізу в Internet-технології. Наявність власних засобів візуального аналізу та картографування дозволяє відмовитися від використання складних аналітичних пакетів та ГІС-технології, що істотно знижує витрати на придбання базового програмного забезпечення і на його наступний супровід.

Подальшим розвитком системи має стати вдосконалення економіко-матема-тичних методів дослідження соціально-економічного розвитку країни шляхом розробки та побудови комплексу макроеконометричних моделей та використання методів економетричного моделювання.




  1. Федоров А. Microsoft Data Analyzer — анализ данных в Microsoft Office // Компьютер
    Пресс. — 2002. — № 2.

  2. Арнхейм Р. Новые очерки по психологии искусства: Пер. с англ. — М.: Прометей, 1994.

  3. Грэхем И. Объектно-ориентированные методы. Принципы и практика. Третье издание: Пер. с англ. — М.: Издательский дом «Вильямс», 2004. — 880 с.

  4. Спирли Э. Корпоративные хранилища данных. Планирование, разработка, реализация. Том. 1: Пер. с англ. — М.: Издательский дом «Вильямс», 2001. — 400 с.

  5. Deductor — описание аналитического пакета. Лаборатория BaseGroup.

http://www.basegroup.ru/deductor/description.htm

  1. Аналитические бизнес приложения. Oracle ® Financial Analyzer.

http://www.ucg.com.ua/analyticapplications.html

  1. Financial Observer Technical Description. http://www.cad.ntu-kpi.kiev.ua

  2. Юдина Т.Н., Карасев О.И., Богомолова А.В., Сеннов Р.А. Базы данных по социально-эко-номической статистике Российской Федерации с Интернет-доступом. http://www.ecsocman.edu.ru/db

  3. Сенченко В.Р., Бойченко А.В. та ін. Створення інформаційно-аналітичної системи Рахункової палати України: Звіт з НДР. — УкрІНТІ; № ДР 0103U004614. — К., 2004.

  4. Материалы Семинара ЕВРОСАИ: «Использование информационных технологий в аудите исполнения государственного бюджета». — 2001. — 25-27 сентября. — Варшава (Польша). http://www.ach.gov.ru/ eurosai/



Надійшла до редакції 04.03.2005

ISSN 1560-9189 Реєстрація, зберігання і обробка даних, 2005, Т. 7, № 1 43