Információszigetek az adattengerben

Figyelem! Kérjük, az értelmezésénél a megjelenés időpontját (1999. május 1.) vegye figyelembe!

Megjelent a Cégvezetés (archív) 14. számában (1999. május 1.)

A számítástechnikai rendszerek gyors fejlődésének egyik szembetűnő következménye a vállalatoknál, szervezeteknél felgyűlt adatok mennyiségének hihetetlen mértékű növekedése. A korábbi kartotékrendszereket és irattároló szekrényeket gyakorlatilag mindenütt felváltották a vállalatirányítási-ügyviteli szoftverek, az adatbázisok és az elektronikus tárolóeszközök. Az új megoldások azonban új gondokat is szülnek. Mindenki tisztában van vele, hogy az információ korában az információ minden eddiginél nagyobb hatalom; a kérdés már csak az, hogyan lesz a puszta adatból a döntéshozatal során felhasználható információ.

Adatbázis-kezelők

Az adatok tárolására szolgáló rendszerek, szoftver- és hardvereszközök már régóta rendelkezésre állnak. Ami a szoftvert illeti, a legtöbb adat relációs adatbázis-kezelő rendszerekben (angol rövidítéssel RDBMS) található. Ezek az adatokat táblázatokban, sorok és oszlopok formájában tárolják, ahol minden sor egy egység, minden oszlop pedig egy kategória. Relációs attól lesz az adatbázis-kezelő, hogy a táblázatok összekapcsolhatók egymással, így az egyikben végrehajtott változás megjelenik az összes, hozzá kapcsolódó táblában. Számos forrásból érkezhetnek adatok az adatbázis-kezelőkbe (vállalatirányítási szoftverek, tranzakciós rendszerek), így azok mérete óriásira tud duzzadni: ma már nem ritkák a sok száz gigabájtos vagy éppen több terabájtos (egy terabájt 1000 gigabájt) adatbázisok. Ezekben megtalálni egy éppen keresett információt igen nehéz, már csak a puszta méretek miatt is (hiszen az összes adatot át kell nézni a keresett információ után); ráadásul ezeket a szoftvereket alapvetően nem arra találták ki, hogy kis információdarabok után kutassanak bennük. Bár alkalmasak erre is, sok ilyen jellegű kérés olyannyira leterhelheti a rendszert, hogy nem tudja eredeti feladatát – az adatok folyamatos beérkeztetését és a rendszer megfelelő helyére történő elraktározását – ellátni.

Márpedig az információ megtalálása egyre fontosabb. Ahogy mind összetettebb informatikai rendszerek működnek a nagyvállalatoknál, a bankoknál, a kormányzatban, és ezek mind nagyobb mennyiségű adatot gyűjtenek be, úgy egyre többen és egyre komolyabban akarnak az adatok mögé nézni, és kideríteni, mi is rejlik mögöttük. Ugyancsak mostanság megfigyelhető trend, hogy a vállalatok a korábbinál jóval nagyobb figyelmet szentelnek a vásárlókra, ügyfelekre és azok vásárlási, megrendelési szokásaira. Ez minden területen fontos, legyen szó bankról, távközlési cégről vagy akár a kormányzatról: ha több információval rendelkezünk a vásárlóról (avagy a kormányzat esetében az állampolgárról), akkor jobb szolgáltatást lehet nekik nyújtani, ami részükről növeli az elégedettséget, a vállalat pedig versenyelőnyre tehet szert.

Merre van az adatbánya?

Itt lépnek a képbe az úgynevezett adattárházak, adatbányászati vagy vezetői információs eszközök, amelyeket a piac egyik éllovasa, a SAS Institute összefoglaló névvel "information delivery tools"-nak nevez, vagyis olyan szoftvereknek, amelyek célja, hogy hasznos információvá alakítsák a meglevő adatokat. Hatalmas fejlődés előtt áll ez a terület: egy piackutató cég szerint a következő két év során az adatbányászati projektek száma megnégyszereződik; és míg jelenleg az adatbázisok piacán 70 százalék jut a tranzakciós rendszerekre és csak 30 százalék az adatkinyerésre, ez az arány pár éven belül megfordul.

Szorosan összefügg az adattárházak (data warehousing) és az adatbányászat (data mining) területe: az adattárházakban gyűjtik össze az elemzésre váró, nemegyszer bizonyos fokig összegzett adatokat, amelyeket aztán adatbányászati eszközökkel elemeznek, hasznos és érdekes összefüggések után kutatva. Már az sem mindegy, hogy milyen adatokkal töltik fel az adattárházat, mert ezek határozzák meg, hogy a későbbiekben milyen információt lehet kinyerni belőle. (Ha nincs benne mondjuk, hogy a vásárló férfi vagy nő, akkor majd nem lehet a nemek szerint elkülöníteni az ügyfeleket.) Éppen ezért nem árt már az elején tisztázni, mit is szeretnénk megtudni az adatbányászat segítségével. Ha ez megvan, akkor már használhatjuk az adatbányászati eszközöket, amelyek a megfelelő algoritmusok segítségével észlelik az adatokban megmutatkozó jellemző összefüggéseket. Vigyázni kell azonban arra is, milyen és mennyi változót adunk meg a kereséshez: ha egy kulcsfontosságú változó hiányzik, elsikkadhat az összefüggés, míg ha túl sokat definiálunk, kezelhetetlenül sok adathoz jutunk.

Speciális fajtái az adatbányászati eszközöknek az OLAP (online analytical processing) szoftverek, amelyek multidimenzionális adatbázisokból tudnak kivonni adatokat, és azokat képesek több szemszögből is megmutatni. A multidimenzionális adatbázist úgy kell elképzelni, mint egy kockát, amelynek minden éle egy, a vállalkozás számára fontos jellemzőt képvisel (időszakok, termékek, mennyiség, régiók, egyebek).

A kocka éleit az OLAP-eszközök segítségével szabadon lehet ide-oda rendezni, a teljes adatkockát lehet forgatni, hogy bizonyos összefüggéseket vagy összehasonlításokat emeljünk ki. Nagy előnye a multidimenzionális adatbázisoknak, hogy sokkal gyorsabb bennük az adatok megtalálása, mint a hagyományos, táblás relációs adatbázisokban: míg ez utóbbiakat a keresés feltételei szerint többször is át kellene lapoznia a szoftvernek, a "kocka" élein csak meg kell keresni a megfelelő értékeket (például "hány piros Opel Astrát adtak el az első negyedévben a Dunántúlon?"), és a koordináták metszéspontjában ott lesz a keresett információ. Az OLAP-eszközök éppen attól nagyon hasznosak vezetői információs rendszerekben, hogy a felhasználó bármilyen, általa definiált nézőpontból elemezheti az adatokat, nincs rákényszerítve arra, hogy mások által összeállított jelentések alapján tájékozódjon.

A legtöbbb adatbányászati eszköz alkalmas arra, hogy az összegzett adatok (negyedéves vagy régióbeli eredmények) felől elérhetővé tegye az alapszintű adatokat (a fenti példánál maradva az egyes autókereskedések napi eladásait); ettől válik az egész "bányászattá". Így ha egy vezető számára érdekes információra bukkan valami átfogó jelentésben, maga is utánanézhet, milyen adatok alapján született meg az adott eredmény. Mód van arra is, hogy ha a keresett információ nincs meg az adattárházban, akkor átjárást teremtsen a tranzakciós rendszerbe, ahol természetszerűen minden elemi adat megtalálható. Rugalmasságukból adódóan azonban az adatbányászati eszközök alapos előkészítést igényelnek bevezetés előtt. Telepítésük nagyobb feladat, mint mondjuk egy szövegszerkesztő üzembe helyezése, és rendszerint egyedi szoftverfejlesztést is igényelnek. Nem árt, ha a bevezetést irányító csapatban egyaránt helyet kapnak adatbázis-szakértők és a cég üzleti igényeit alaposan ismerő munkatársak is.

Bizonyos egyszerűbb elemzésekhez még adatbányászati eszközökre sincs szükség, mert a relációs adatbázis-kezelők újabb verziói (például az Oracle 8i) számos olyan funkciót tartalmaznak, amelyekkel elvégezhetők egyes feladatok. Ha például csak egy alkalmazáshoz kapcsolódóan akarunk ad hoc lekérdezéseket lefuttatni, és az eredményt nem akarjuk összevetni más belső vagy külső rendszerből származó adatokkal, akkor egy modern relációs adatbázis-kezelő is megteszi. Komolyabb feladatokhoz azonban mindenképpen ajánlatos elkülönített adattárházat felállítani.

Akik már tudják

Magyarországon is több nagy adattárházprojekt valósult már meg. A Westel 900-nál például a SAS Institute szoftvereire alapozva építettek ki adattárházra épülő marketinginformációs rendszert. Az adattárházba minden olyan adatot felvettek, amelyekre a jelentésekben – nemcsak a rendszeres riportokban, hanem az eseti lekérdezésekben is – szükség lehet. Több forrásból érkeznek az adatok: a legtöbb a számlázási-ügyfél-nyilvántartási rendszerből és a kapcsolóközpontokból származik (ez utóbbiakból jönnek a hívásokra vonatkozó, összesített adatok), és ezekhez társul még féltucatnyi különböző rendszer és adatbázis. Az adattárház mérete (noha csak előfizetőkre és időszakokra lebontott adatok szerepelnek benne) több tucat gigabájt, és folyamatosan nő. A modulfelépítésű marketinginformációs rendszer kétféle módon érhető el: egyrészt a SAS saját ügyfélalapú szoftverével, másrészt webes felületen keresztül, böngészőből. A középvezetői kör már a rendszerből nyeri a döntéseihez szükséges információkat, és nem a számítástechnikusokat vagy a marketingeseket zaklatja a jelentésekért. A lekérdezések eredményei közvetlenül kinyomtathatók vagy átvihetők Excel-táblázatokba. A marketinginformációs rendszer felbecsülhetetlen jelentőségű egy olyan ügyfélorientált cégnél, mint a Westel 900: jóformán az összes üzleti döntés (beleértve a műszaki jellegűeket is) a rendszerből kinyert információkra és elemzésekre alapul.

Az ABN Amro Bank többéves projekt keretében vezetői információs rendszert (MIS) épít ki, azzal a céllal, hogy megbízható információkat nyújtsanak az üzleti döntésekhez. A rendszer magja a központi relációs adatbázis, a CDB; ebbe a napi műveleteket kiszolgáló tranzakciós rendszerekből az összes napi adatot letöltik, hogy a vezetői információs rendszer innen érje el azokat. Az ABN Amro a központi adatbázis-kezelő gyártójától, az Oracle-től szerezte be a rendszer létrehozásához szükséges szoftvereket (Financial Analyzer és Express Analyzer). A két Oracle-szoftver a CDB-hez kapcsolódó multidimenzionális adatbázisból nyeri a információkat; ezt az öt dimenzióval definiált adatbázist napjában egyszer töltik fel a CDB-ből. Ha a lekérdezés során keresett információ nincs a multidimenzionális adatbázisban, a rendszer a CDB-hez fordul, és onnan nyeri ki a kívánt adatot. A rendszer kezelői felülete itt is a webböngésző, mert így nincs szükség külön ügyfélszoftverre. Ma már az MIS segítségével számolják az ügyfél- és termékjövedelmezőséget, de a rendszer kiépítése még nem fejeződött be: egyebek mellett támogatni fogja a lejárati és átárazási számításokat, információkkal szolgál majd a költségekről és ráfordításokról, módot ad a "what-if" forgatókönyvek készítésére, és kiszolgálja a banki kockázatelemzést is.

Döntéstámogatók Az adattárházak és az adatbányászat környékén jártas szakemberek szerint nagy jövő áll az információszolgáltatók előtt Magyarországon is. A cégek, hivatalok, egyéb intézmények jószerével egy évtizede gyűjtik az adatokat a számítástechnika segítségével. Az is tudott dolog, hogy a versenyszférában a legkülönfélébb adatbázisok jöttek létre, ámbár a fejlesztéseket kevés helyen motiválta az előrelátás. Ezeket az adatokat rendezni kellene, és a bennük rejlő információk elemzésével még további hasznos ismeretekre lehet szert tenni. Az információ felbecsülhetetlen érték a cégek számára. Az informatikai fejlesztéssel foglalkozó vállalkozások a vállalatok és az általuk felhalmozott adatok sokaságát figyelembe véve hozták létre az adattömeg kezelésére és elemzésére alkalmas szoftvereiket. Ma már a hazai piacon is megjelentek ezek a cégek. Mindegyiknek van olyan terméke, amelyik különbözik a többiekétől, amiben elsőnek, piacvezetőnek mondható. El kell fogadni ajánlásukat, miszerint a feladat, a vállalat profilja és céljai határozzák meg, hogy milyen szoftvert érdemes megvásárolni. A nagyságát, múltját és bevételét tekintve is e területen vezet a SAS Institute Magyarország. Az AXIS Kft. 1997-ben kezdte meg a COGNOS-termékek forgalmazását, és ez évtől lehet hazai forrásból a döntéstámogatást fő céljának tekintő Business Objects szoftvereket megvásárolni. E szoftvercsalád forgalmazója a Processorg Software '82 Kft. Az utóbbi két szoftvertípus grafikus windows-os környezetben fut, s ezért a nagyvállalatok, bankok, biztosítók, illetve a közigazgatáson kívül a néhány felhasználós számítógépes rendszerrel rendelkező középvállalatok is sikerrel alkalmazhatják. Közös jellemzőjük még, hogy többféle adatbázisból képesek adatot bányászni, a riportokat automatikusan elkészítik, sőt van, amelyik a határértékeket észlelve figyelmeztetéseket küld a vezető számítógépére. A fejlesztő és forgalmazó cégek mindegyikére jellemző, hogy kölcsönösen keresik a kapcsolatot a hardver-, illetve más jellegű szoftvergyártókkal, mivel tevékenységük ma már szervesen összeforr. De gyakori az ugyanilyen, egymásra épülő munka a könyvvizsgáló, tanácsadó cégekkel is, mivel ezek is felismerték, hogy kínálatukból nem hiányozhat a számítástechnikai támogatás.
 

Figyelem! Kérjük, az értelmezésénél a megjelenés időpontját (1999. május 1.) vegye figyelembe!