Olap excel kockák. OLAP = Többdimenziós nézet = Kocka. Internetes értékesítési kocka létrehozása

Az OLAP (Online Analytical Processing) adatkockák lehetővé teszik a többdimenziós adatok hatékony kinyerését és elemzését. Más típusú adatbázisoktól eltérően az OLAP adatbázisokat kifejezetten analitikai feldolgozásra és mindenféle adatkészlet gyors kinyerésére tervezték. Valójában számos lényeges különbség van a szabványos relációs adatbázisok, például az Access vagy az SQL Server és az OLAP adatbázisok között.

Rizs. 1. OLAP-kocka Excel-munkafüzethez való csatlakoztatásához használja a parancsot Az Analytics szolgáltatásokból

Töltse le a jegyzetet a vagy a

A relációs adatbázisokban az információk rekordokként jelennek meg, amelyek egymás után kerülnek hozzáadásra, törlésre és frissítésre. Az OLAP adatbázisok csak egy pillanatképet tárolnak az adatokból. Az OLAP-adatbázisban az információk egyetlen adatblokkként archiválódnak, és csak igény szerinti kimenetre szolgálnak. Bár új információk hozzáadhatók az OLAP adatbázishoz, a meglévő adatokat ritkán szerkesztik, és még kevésbé törlik.

A relációs adatbázisok és az OLAP adatbázisok szerkezetileg különböznek egymástól. A relációs adatbázisok jellemzően egymáshoz kapcsolódó táblák halmazából állnak. Egyes esetekben egy relációs adatbázis annyi táblát tartalmaz, hogy nagyon nehéz meghatározni, hogyan kapcsolódnak egymáshoz. Az OLAP adatbázisokban az egyes adatblokkok közötti kapcsolatot előre meghatározzák, és az úgynevezett struktúrában tárolják OLAP kockák. Az adatkockák teljes információt tárolnak az adatbázis hierarchikus felépítéséről és kapcsolatairól, ami nagyban leegyszerűsíti a navigációt. Emellett sokkal egyszerűbb riportokat készíteni, ha előre tudja, hogy a kinyert adatok hol találhatók, és milyen egyéb adatok vannak hozzárendelve.

A fő különbség a relációs adatbázisok és az OLAP adatbázisok között az információ tárolásának módja. Az OLAP-kockákban lévő adatok ritkán jelennek meg általánosan. Az OLAP adatkockák általában előre megtervezett formátumban tartalmazzák az információkat. Így az adatok kockákban történő csoportosítása, szűrése, rendezése és egyesítése műveletei az információkkal való feltöltést megelőzően kerülnek végrehajtásra. Ez a lehető legegyszerűbbé teszi a kért adatok lekérését és megjelenítését. A relációs adatbázisokkal ellentétben nincs szükség az információk megfelelő rendszerezésére a képernyőn való megjelenítés előtt.

Az OLAP adatbázisokat általában informatikai rendszergazdák hozzák létre és tartják karban. Ha a szervezete nem rendelkezik olyan struktúrával, amely az OLAP-adatbázisok kezeléséért felelne, forduljon a relációs adatbázis-adminisztrátorhoz, és kérje a megvalósítást. vállalati hálózat legalább néhány OLAP megoldást.

Csatlakozás OLAP adatkockához

Az OLAP-adatbázis eléréséhez először kapcsolatot kell létesítenie az OLAP-kockával. Először lépjen a Szalag fülre Adat. Kattintson a gombra Más forrásokbólés válassza ki a parancsot a legördülő menüből Az Analytics szolgáltatásokból(1. ábra).

Amikor kiválasztja az Adatkapcsolat varázsló megadott parancsát (2. ábra). Fő feladata, hogy segítsen a szerverrel való kapcsolat kialakításában, amelyet az Excel az adatkezelés során használ majd.

1. Először meg kell adnia az Excel regisztrációs adatait. Adja meg a kiszolgáló nevét, a bejelentkezési nevet és az adathozzáférési jelszót a párbeszédpanel mezőiben, amint az ábra mutatja. 2. Kattintson a gombra További. Ha a segítségével csatlakozik fiókot Windows, majd állítsa be a kapcsolót Használja a Windows hitelesítést.

2. A legördülő listából válassza ki azt az adatbázist, amellyel dolgozni fog (3. ábra). A jelenlegi példa az Analysis Services Tutorial adatbázist használja. Miután kiválasztotta ezt az adatbázist, az alábbi lista kéri, hogy importálja a benne elérhető összes OLAP-kockát. Válassza ki a kívánt adatkockát és kattintson a gombra További.

Rizs. 3. Válassza ki az adatelemzéshez használni kívánt működő adatbázist és OLAP-kockát

3. A következő varázsló párbeszédpanelen, az ábrán látható. 4, meg kell adnia leíró információkat a létrehozandó kapcsolatról. ábrán látható párbeszédpanel összes mezője. 4 nem kötelező kitölteni. Az aktuális párbeszédablakot mindig figyelmen kívül hagyhatja kitöltése nélkül, és ez semmilyen módon nem befolyásolja a kapcsolatot.

Rizs. 4. Módosítsa a kapcsolatleíró információkat

4. Kattintson a gombra Kész a kapcsolat létrehozásának befejezéséhez. Egy párbeszédpanel jelenik meg a képernyőn Adatok importálása(5. ábra). Állítsa be a kapcsolót PivotTable jelentésés kattintson az OK gombra a pivot tábla létrehozásának megkezdéséhez.

OLAP kocka szerkezet

Amikor pivot táblát hoz létre egy OLAP adatbázisból, észre fogja venni, hogy a munkaablak ablaka Pivot tábla mezői más lesz, mint egy normál pivot tábla esetében. Ennek oka a PivotTable elrendezésében rejlik, hogy pontosan tükrözze a hozzá csatolt OLAP-kocka szerkezetét. Ahhoz, hogy a lehető leggyorsabban navigálhasson egy OLAP-kockán, alaposan meg kell ismerkednie az összetevőivel és azok interakciójával. ábrán. A 6. ábra egy tipikus OLAP-kocka alapvető felépítését mutatja.

Mint látható, az OLAP-kocka fő összetevői a dimenziók, a hierarchiák, a szintek, a tagok és a mértékek:

  • Méretek. Az elemzett adatelemek főbb jellemzői. Gyakori példák a dimenziókra: Termékek, Ügyfél és Alkalmazott. ábrán. A 6. ábra a Termékek dimenzió felépítését mutatja.
  • Hierarchiák. Szintek előre meghatározott összesítése egy adott dimenzióban. A hierarchia lehetővé teszi összefoglaló adatok létrehozását és elemzését a struktúra különböző szintjein anélkül, hogy belemélyedne az e szintek közötti kapcsolatokba. ábrán látható példában. A 6. ábra szerint a Termékek dimenziónak három szintje van, amelyek a termékkategóriák egyetlen hierarchiájába vannak összesítve.
  • Szintek. A szintek olyan kategóriák, amelyek egy közös hierarchiába vannak összesítve. Tekintse a rétegeket adatmezőknek, amelyek egymástól függetlenül lekérdezhetők és elemezhetők. ábrán. 6 csak három szint van: Kategória, Alkategória és Terméknév.
  • tagok. Egyetlen adatelem egy dimenzión belül. A tagok általában dimenziókból, hierarchiákból és szintekből álló OLAP-struktúrán keresztül érhetők el. ábra példájában. A Terméknév szinthez 6 tag van meghatározva. A többi szintnek saját tagjai vannak, amelyek nem jelennek meg a szerkezetben.
  • Intézkedések- ez valós adat OLAP kockákban. A mérések saját méretükben vannak tárolva, amelyeket mértékdimenzióknak nevezünk. A mértékek lekérdezhetők a dimenziók, hierarchiák, szintek és tagok bármilyen kombinációjával. Ezt az eljárást „szeletelési” intézkedéseknek nevezik.

Most, hogy ismeri az OLAP-kockák szerkezetét, nézzük meg újra a Kimutatás mezőlistáját. A rendelkezésre álló mezők elrendezése egyértelművé válik, és nem okoz panaszt. ábrán. A 7. ábra azt mutatja, hogy a mezőlista hogyan ábrázolja az OLAP pivot tábla elemeit.

A PivotTable mezőlistában OLAP intézkedések először jelennek meg, és az összegzési ikon (szigma) jelzi őket. Csak ezek az adatelemek lehetnek a VALUE régióban. Utánuk a listában a méretek láthatók, táblázatos képpel ellátott ikonnal. Példánk az Ügyfél dimenziót használja. Ez a dimenzió számos hierarchiát tartalmaz. A hierarchia kiterjesztése után megtekintheti az egyes adatszinteket. Egy OLAP-kocka adatszerkezetének megtekintéséhez egyszerűen navigáljon a pivot tábla mezőinek listájában.

Az OLAP Pivot Tables korlátai

Amikor az OLAP-kimutatástáblákkal dolgozik, ne feledje, hogy az Analysis Services OLAP-környezetében használja a kimutatás-adatforrást. Ez azt jelenti, hogy az adatkocka minden viselkedési aspektusát, a dimenzióktól kezdve a kockában szereplő mérőszámokig, szintén az OLAP analitikai szolgáltatások vezérlik. Ez viszont az OLAP pivot táblákon végrehajtható műveletek korlátozásához vezet:

  • A kimutatástáblázat ÉRTÉKEK területén a mértékeken kívül nem helyezhet el mezőket;
  • az összegzéshez használt függvényt nem lehet megváltoztatni;
  • Nem hozhat létre számított mezőt vagy számított tételt;
  • A mezőnevek módosításai azonnal törlésre kerülnek, miután a mezőt eltávolították a pivot táblából;
  • Az oldalmező paramétereinek módosítása nem megengedett;
  • parancs nem elérhető Előadásoldalakat;
  • opció letiltva Előadásaláírásokatelemeket ha az értékterületen nincsenek mezők;
  • opció letiltva Részösszegek a szűrő által kiválasztott oldalelemek szerint;
  • paraméter nem elérhető Háttérkérés;
  • az ÉRTÉKEK mezőben való dupla kattintás után csak az első 1000 rekord jelenik meg a pivot tábla gyorsítótárából;
  • jelölőnégyzet letiltva Optimalizálásmemória.

Autonóm adatkockák létrehozása

Egy szabványos pivot táblában a forrásadatok a helyi merevlemezen tárolódnak. Így mindig kezelheti őket, és módosíthatja a szerkezetet, még a hálózathoz való hozzáférés nélkül is. De ez semmiképpen sem vonatkozik az OLAP pivot táblákra. Az OLAP pivot táblákban a gyorsítótár nem a helyi merevlemezen található. Ezért közvetlenül a hálózatról való lekapcsolás után helyi hálózat az OLAP pivot tábla többé nem fog működni. Egy ilyen táblázatban egyetlen mezőt sem fog tudni áthelyezni.

Ha továbbra is elemeznie kell az OLAP-adatokat, amikor nem csatlakozik hálózathoz, hozzon létre egy offline adatkockát. Ez egy külön fájl, amely a pivot tábla gyorsítótárát képviseli. Ez a fájl olyan OLAP-adatokat tárol, amelyeket a rendszer a helyi hálózatról való leválasztás után tekint meg. Önálló adatkocka létrehozásához először hozzon létre egy OLAP pivot táblát. Vigye a kurzort a pivot táblába, és kattintson a gombra OLAP eszközök kontextuális lap Elemzés, amely a környezetfüggő lapok készletében található Munka a kimutatástáblákkal. Válasszon ki egy csapatot Offline OLAP mód(8. ábra).

Egy párbeszédpanel jelenik meg a képernyőn Beállítások elem élettartam OLAP(9. ábra). Kattintson a gombra Offline adatfájl létrehozása. A képernyőn megjelenik a Data Cube File Creation Wizard első ablaka. Kattintson a gombra További az eljárás folytatásához.

A második lépésben (10. ábra) jelölje meg azokat a méreteket és szinteket, amelyeket az adatkocka tartalmazni fog. A párbeszédpanelen ki kell választania az OLAP adatbázisból importálni kívánt adatokat. Csak azokat a méreteket kell kiválasztani, amelyekre a számítógép helyi hálózatról való leválasztása után szükség lesz. Minél több dimenziót ad meg, annál nagyobb lesz az autonóm adatkocka.

Kattintson a gombra További hogy folytassa a harmadik lépéssel (11. ábra). Ebben az ablakban ki kell választani azokat a tagokat vagy adatelemeket, amelyek nem fognak szerepelni a kockában. Ha a jelölőnégyzet nincs bejelölve, a megadott elem nem lesz importálva, és felesleges helyet foglal el a helyi merevlemezen.

Adja meg az adatkocka helyét és nevét (12. ábra). Az adatkocka fájlok kiterjesztése .cub.

Egy idő után az Excel elmenti az offline adatkockát a megadott mappába. A teszteléshez kattintson duplán a fájlra, amely automatikusan létrehoz egy Excel-munkafüzetet, amely a kiválasztott adatkockához társított pivot táblát tartalmaz. Létrehozása után az offline adatkockát szétoszthatja minden érdeklődő felhasználó számára, aki offline LAN módban dolgozik.

Miután csatlakozott a helyi hálózathoz, megnyithatja az offline adatkockafájlt, és frissítheti azt, valamint a megfelelő adattáblázatot. Kérjük, vegye figyelembe, hogy bár az offline adatkockát akkor használják, ha nincs hálózati hozzáférés, frissíteni kell, ha a hálózati kapcsolat helyreáll. Az offline adatkocka frissítésének kísérlete a hálózati kapcsolat megszakadása után kudarcot okoz.

Adatkocka függvények használata pivot táblákban

Az OLAP-adatbázisokban használt adatkocka-függvények pivot táblából is futtathatók. Az Excel korábbi verzióiban csak az Analysis Pack bővítmény telepítése után férhetett hozzá az adatkocka-funkciókhoz. Az Excel 2013-ban ezek a funkciók be vannak építve a programba, ezért használhatók. Ahhoz, hogy teljes mértékben megértsük képességeiket, nézzünk meg egy konkrét példát.

Az egyik legtöbb egyszerű módokon Az adatkocka funkcióinak elsajátítása magában foglalja az OLAP pivot tábla adatkocka-képletekké alakítását. Ez az eljárás nagyon egyszerű, és lehetővé teszi az adatkocka-képletek gyors beszerzését anélkül, hogy azokat a semmiből hozná létre. A fő elv az, hogy a kimutatástábla összes celláját le kell cserélni olyan képletekre, amelyek az OLAP adatbázishoz kapcsolódnak. ábrán. A 13. ábra egy OLAP adatbázishoz társított pivot táblát mutat.

Vigye a kurzort a pivot tábla bármely pontjára, kattintson a gombra OLAP eszközök környezetfüggő szalaglap Elemzésés válassz egy csapatot Konvertálás képletekre(14. ábra).

Ha a kimutatástáblázat jelentésszűrő mezőt tartalmaz, az 1. ábrán látható párbeszédpanel jelenik meg a képernyőn. 15. Ebben az ablakban megadhatja, hogy az adatszűrő legördülő listáit képletté kívánja-e alakítani. Ha a válasz igen, a legördülő listák törlődnek, és helyette statikus képletek jelennek meg. Ha a jövőben legördülő listák használatával kívánja módosítani a pivot tábla tartalmát, törölje a jelölést a párbeszédpanel egyetlen négyzetéből. Ha kompatibilitási módban dolgozik egy kimutatáson, az adatszűrők automatikusan képletté alakulnak, előzetes figyelmeztetés nélkül.

Néhány másodperc múlva pivot tábla helyett olyan képletek jelennek meg, amelyek adatkockákban futnak le, és az Excel ablakban adják meg a szükséges információkat. Kérjük, vegye figyelembe, hogy ez eltávolítja a korábban alkalmazott stílusokat (16. ábra).

Rizs. 16. Vessen egy pillantást a képletsorra: a cellák az adatkocka képleteket tartalmazzák

Mivel a megtekintett értékek már nem részei a PivotTable objektumnak, hozzáadhat oszlopokat, sorokat és számított tagokat, és kombinálhatja őket más külső források, és módosítsa a jelentést is a legtöbbvel különböző utak, beleértve a húzó és ejtő képleteket.

Számítások hozzáadása az OLAP pivot táblákhoz

BAN BEN előző verziók Az Excel OLAP pivot táblái nem tettek lehetővé egyéni számításokat. Ez azt jelenti, hogy nem lehetett hozzáadni egy további elemzési szintet az OLAP-pivotTable-okhoz ugyanúgy, mint a számított mezők és tagok hozzáadása a szokásos kimutatásokhoz (további információért kérjük, ismerkedjen meg ezzel az anyaggal, mielőtt folytatná olvasás ).

Az Excel 2013 új OLAP-eszközöket – számított mértékeket és számított MDX-tagokat – vezet be. Már nem korlátozódik a DBA által biztosított OLAP-kockában lévő mértékek és tagok használatára. Egyedi számítások létrehozásával további elemzési lehetőségekre tehet szert.

Bevezetés az MDX-be. Ha kimutatástáblát használ egy OLAP-kockával, akkor MDX (Multidimensional Expressions) lekérdezéseket ad ki az adatbázisnak. Az MDX egy lekérdezési nyelv, amelyet többdimenziós forrásokból (például OLAP-kockákból) származó adatok lekérésére használnak. Amikor egy OLAP-pivotTable-t módosítanak vagy frissítenek, a megfelelő MDX-lekérdezések elküldésre kerülnek az OLAP-adatbázisba. A lekérdezés eredménye visszakerül az Excelbe, és megjelenik a kimutatásterületen. Ez lehetővé teszi az OLAP-adatokkal való munkát a pivot tábla gyorsítótárának helyi másolata nélkül.

Számított mértékek és MDX-tagok létrehozásakor MDX nyelvi szintaxist kell használnia. Ezzel a szintaxissal a pivot tábla lehetővé teszi, hogy a számítások együttműködjenek az OLAP adatbázis-háttérrendszerrel. A könyvben tárgyalt példák alapvető MDX-terveken alapulnak, amelyek újat mutatnak be Excel függvények 2013. Ha összetett számított mértékeket és MDX-tagokat kell létrehoznia, időt kell szánnia az MDX képességeinek további megismerésére.

Számított mértékek létrehozása. A számított mérték a számított mező OLAP verziója. Az ötlet egy új adatmező létrehozása a meglévő OLAP mezőkön végrehajtott néhány matematikai művelet alapján. ábrán látható példában. 17. pontja alapján egy OLAP összesítő táblázatot használnak, amely tartalmazza az áruk listáját és mennyiségét, valamint az egyes áruk értékesítéséből származó bevételeket. Hozzá kell adnunk egy új mérőszámot, amely kiszámítja a cikk egységenkénti átlagárát.

Elemzés Munka a kimutatástáblákkal. A legördülő menüben OLAP eszközök tárgy kiválasztása (18. ábra).

Rizs. 18. Válasszon ki egy menüpontot MDX Számított mérték

Egy párbeszédpanel jelenik meg a képernyőn Hozzon létre egy számított mértéket(19. ábra).

Kovesd ezeket a lepeseket:

2. Válassza ki azt a mértékcsoportot, amelyben az új számított mérték található. Ha ezt nem teszi meg, az Excel automatikusan az első elérhető mértékcsoportba helyezi az új mértéket.

3. A terepen MDX kifejezés(MDX) Írja be az új mértéket meghatározó kódot. A beviteli folyamat felgyorsításához használja a bal oldali listát a számításokhoz használandó meglévő mértékek kiválasztásához. Kattintson duplán a kívánt mértékre, hogy hozzáadja az MDX mezőhöz. A következő MDX-et használják az átlagos egységértékesítési ár kiszámításához:

4. Kattintson az OK gombra.

Ügyeljen a gombra Ellenőrizze az MDX-et, amely az ablak jobb alsó részén található. Kattintson erre a gombra az MDX szintaxis helyességének ellenőrzéséhez. Ha a szintaxis hibákat tartalmaz, megjelenik egy üzenet.

Miután befejezte az új számított mérték létrehozását, lépjen a listára Pivot tábla mezőiés válassza ki (20. ábra).

A számított mérték hatóköre csak az aktuális munkafüzetre vonatkozik. Más szavakkal, a számított mértékek nem közvetlenül az OLAP-kiszolgálókockában jönnek létre. Ez azt jelenti, hogy senki sem férhet hozzá a kiszámított mértékhez, hacsak nem nyitja meg általános hozzáférés a munkafüzetbe, különben nem teszi közzé az interneten.

Számított MDX-tagok létrehozása. Az MDX számított tag a normál számított tag OLAP változata. Az ötlet egy új adatelem létrehozása a meglévő OLAP-elemeken végrehajtott néhány matematikai művelet alapján. ábrán látható példában. 22, OLAP pivot táblát használnak, amely tartalmazza a 2005–2008 közötti értékesítési információkat (negyedéves bontásban). Tegyük fel, hogy az első és a második negyedév adatait szeretné összesíteni egy új elem, az első félév létrehozásával. A harmadik és negyedik negyedévre vonatkozó adatokat is kombináljuk, új elemet alkotva az év második felében.

Rizs. 22. Új MDX számított tagokat fogunk hozzáadni az év első feléhez és az év második feléhez

Helyezze a kurzort bárhová a kimutatásban, és válassza ki a környezetfüggő lapot Elemzés kontextuális lapok készletéből Munka a kimutatástáblákkal. A legördülő menüben OLAP eszközök tárgy kiválasztása MDX számítógépes tag(23. ábra).

Egy párbeszédpanel jelenik meg a képernyőn (24. ábra).

Rizs. 24. Ablak Számított tétel létrehozása

Kovesd ezeket a lepeseket:

1. Adjon nevet a számított mértéknek!

2. Válassza ki azt a szülőhierarchiát, amelyhez új számított tagokat hoz létre. Egy építkezésen Szülő elemértéket rendeljen hozzá Minden. Ez a beállítás lehetővé teszi, hogy az Excel hozzáférjen a szülőhierarchia összes tagjához egy kifejezés kiértékelésekor.

3. Az ablakban MDX kifejezésÍrja be az MDX szintaxist. Időt takaríthat meg a bal oldali lista segítségével az MDX-ben használni kívánt meglévő tagok kiválasztásához. Kattintson duplán a kiválasztott elemre, és az Excel hozzáadja az ablakhoz MDX kifejezés. ábrán látható példában. 24, az első és a második negyedév összegét számítják ki:

..&& +

.. && +

.. && + …

4. Kattintson az OK gombra. Az Excel megjeleníti az újonnan létrehozott MDX számított tagot a kimutatásban. ábrán látható módon. A 25. ábra szerint az új számított elem a többi számított elemmel együtt megjelenik a kimutatásban.

ábrán. A 26. ábra egy hasonló folyamatot szemléltet az év második felében számított tétel létrehozásához.

Figyeljük meg, hogy az Excel meg sem kísérli az eredeti MDX-tagok eltávolítását (27. ábra). A PivotTable továbbra is a 2005–2008-as évekhez tartozó rekordokat jeleníti meg negyedévenkénti bontásban. Ebben az esetben ez nem nagy baj, de a legtöbb esetben el kell rejteni az „extra” elemeket a konfliktusok elkerülése érdekében.

Rizs. 27. Az Excel a létrehozott MDX számított tagot eredeti tagként jeleníti meg. De még mindig jobb az eredeti elemek törlése az ütközések elkerülése érdekében

Ne feledje: A számított tagok csak az aktuális munkafüzetben találhatók. Más szavakkal, a számított mértékek nem közvetlenül az OLAP-kiszolgálókockában jönnek létre. Ez azt jelenti, hogy senki sem férhet hozzá a számított mértékhez vagy a számított taghoz, hacsak meg nem osztja a munkafüzetet vagy közzé nem teszi az interneten.

Vegye figyelembe, hogy ha egy OLAP-kockában a szülő hierarchia vagy a szülőelem megváltozik, az MDX által számított elem már nem működik. Ezt az elemet újra kell létrehoznia.

OLAP számítások kezelése. Az Excel olyan felületet biztosít, amely lehetővé teszi a számított mértékek és MDX-tagok kezelését az OLAP pivot táblákban. Helyezze a kurzort bárhová a kimutatásban, és válassza ki a környezetfüggő lapot Elemzés kontextuális lapok készletéből Munka a kimutatástáblákkal. A legördülő menüben OLAP eszközök tárgy kiválasztása Számításkezelés. Az ablakban Számításkezelés Három gomb áll rendelkezésre (28. ábra):

  • Teremt. Hozzon létre egy új számított mértéket vagy számított MDX-tagot.
  • Változás. Módosítsa a kiválasztott számítást.
  • Töröl. Törölje a kiválasztott számítást.

Rizs. 28. Párbeszédpanel Számításkezelés

Végezzen „mi lenne, ha” elemzést az OLAP-adatokon. Az Excel 2013-ban elvégezheti az OLAP kimutatástábláiban lévő adatok „mi lenne, ha” elemzését. Ennek köszönhetően új lehetőség Módosíthatja az értékeket a kimutatásban, és a változtatások alapján újraszámíthatja a mértékeket és a tagokat. A változtatásokat az OLAP-kockába is visszaterjesztheti. A mi lenne, ha elemzési képességeinek kihasználásához hozzon létre egy OLAP-pivotTable-t, és válassza ki a környezetfüggő lapot Elemzés Munka a kimutatástáblákkal. A legördülő menüben OLAP eszközök Válassz csapatot Mi lenne, ha elemzés –> Mi lenne, ha elemzés engedélyezése(29. ábra).

Ettől kezdve megváltoztathatja a pivot tábla értékeit. A kiválasztott érték módosításához a kimutatásban kattintson rá a jobb gombbal, és válassza ki az elemet a helyi menüből (30. ábra). Az Excel újra futtatja a kimutatás összes számítását az Ön által végzett módosításokkal, beleértve a számított mértékeket és a számított MDX-tagokat is.

Rizs. 30. Válasszon ki egy elemet Vegye figyelembe a változást a pivot tábla kiszámításakor hogy módosítsa a pivot táblát

Alapértelmezés szerint a PivotTable-ban végzett szerkesztések a Mi-ha elemzési módban helyiek. Ha a módosításokat az OLAP-kiszolgálóra szeretné terjeszteni, válassza ki a módosítások közzétételére szolgáló parancsot. Válasszon egy környezetfüggő lapot Elemzés kontextuális lapok készletében található Munka a kimutatástáblákkal. A legördülő menüben OLAP eszközök elemek kiválasztása Mi lenne, ha elemzés – > Módosítások közzététele(31. ábra). A parancs végrehajtásának eredményeként " írj vissza» az OLAP szerveren, ami azt jelenti, hogy a változtatások továbbíthatók a forrás OLAP kockára. (Az OLAP-kiszolgáló módosításainak terjesztéséhez rendelkeznie kell a megfelelő jogosultságokkal a kiszolgáló eléréséhez. Forduljon az adatbázis-adminisztrátorhoz, hogy segítsen megszerezni az OLAP-adatbázis írási hozzáférési engedélyeit.)

A jegyzet Jelen, Alexander könyve alapján készült. . 9. fejezet.

/ Kubista módon. OLAP kockák alkalmazása nagyvállalatok vezetési gyakorlatában


Kapcsolatban áll

osztálytársak

Konsztantyin Tokmacsev, rendszerépítész

Kubista stílusban.
OLAP kockák alkalmazása nagyvállalatok vezetési gyakorlatában

Talán elmúlt az az idő, amikor egy vállalat számítási erőforrásait csak információk rögzítésére és számviteli jelentések rögzítésére fordították. Ugyanakkor a vezetői döntések „szemből” születtek az irodákban, az üléseken, üléseken. Talán Oroszországban itt az ideje, hogy a vállalati számítástechnikai rendszereket visszahelyezzék fő erőforrásukba - a menedzsment problémák megoldása a számítógépen regisztrált adatok alapján

Az üzleti elemzés előnyeiről

A vállalatirányítási körben a „nyers” adatok és a kezelt objektumot befolyásoló „karok” között „teljesítménymutatók” - KPI-k találhatók. Egyfajta „műszerfalat” alkotnak, amely a vezérelt objektum különféle alrendszereinek állapotát tükrözi. A cég informatív teljesítménymutatókkal való felszerelése, számításuk és a kapott értékek nyomon követése egy üzleti elemző munkája. Az automatizált elemző szolgáltatások, mint például az MS SQL Server Analysis Services (SSAS) segédprogram és annak fő eszköze, az OLAP kocka jelentős segítséget nyújthatnak a vállalat elemző munkájának megszervezésében.

Itt még egy pontot kell kiemelni. Tegyük fel, hogy az amerikai hagyomány szerint az OLAP-kockákkal való munkavégzésre összpontosító specialitást BI-nek (Business Intelligence) hívják. Nem lehetnek illúziók arról, hogy az amerikai BI megfelel az orosz „üzleti elemzőnek”. Nem sértődj meg, de üzleti elemzőnk gyakran „alulkönyvelő” és „alulprogramozó”, homályos tudású, csekély fizetésű szakember, akinek valóban nincs saját eszköze és módszertana.

A BI-szakember valójában alkalmazott matematikus, magasan képzett szakember, aki modern matematikai módszereket használ a vállalat arzenáljához (ezt nevezték Operations Research). A BI jobban megfelel a „rendszerelemző” szakterületnek, amely egykor a Szovjetunióban volt, és a Moszkvai Állami Egyetem Számítógépes Matematikai és Matematikai Karán végzett. M.V. Lomonoszov. Az OLAP kocka és elemzési szolgáltatások ígéretes alapjává válhatnak egy orosz üzleti elemző munkahelyének, talán némi továbbképzést követően az amerikai BI irányába.

A közelmúltban egy újabb káros tendencia jelent meg. A specializációnak köszönhetően elveszett a kölcsönös megértés a vállalati alkalmazottak különböző kategóriái között. Egy könyvelő, menedzser és programozó, mint „hattyú, rák és csuka” I.A. meséjében. Krylov, különböző irányokba húzzák a vállalatot.

A könyvelő a beszámolókészítéssel van elfoglalva, összegei mind jelentésben, sem dinamikában nem kapcsolódnak közvetlenül a cég üzleti folyamatához.

A menedzser elfoglalt az üzleti folyamat saját részével, de nem tudja globálisan, a vállalat egészének szintjén értékelni tevékenységének eredményeit és kilátásait.

Végül a programozó, aki egykor (képzettségének köszönhetően) a tudomány szférától az üzleti szféráig haladó műszaki ötletek karmestere volt, a könyvelő és menedzser fantáziájának passzív végrehajtójává vált, így nem már ritka, hogy a vállalatok informatikai részlegét könyvelők hajtják, és általában mindenki, akihez nem lusta. A kezdeményezés hiánya, az írástudatlan, de viszonylag jól fizetett 1C programozó igazi csapás az orosz vállalatok számára. (Majdnem úgy, mint egy hazai futballista.) Az úgynevezett „közgazdászokról és jogászokról” nem is beszélek, róluk már régen minden el lett mondva.

Tehát a programozási és számviteli alapismeretekben járatos, tudásintenzív SSAS apparátussal felszerelt üzleti elemző pozíciója képes megszilárdítani a vállalat munkáját az üzleti folyamat elemzésével és előrejelzésével kapcsolatban.

Az OLAP kockák előnyei

OLAP kocka az modern gyógymód a vállalati számítógépes rendszer adatbázisának elemzése, amely lehetővé teszi, hogy a hierarchia minden szintjén a munkavállalók rendelkezésére álljon a szükséges indikátorkészlet, amely jellemzi gyártási folyamat cégek. A lényeg nem csak az, hogy az MDX kocka kényelmes felülete és rugalmas lekérdezési nyelve (MultiDimensional eXpressions) lehetővé teszi a szükséges analitikai mutatók megfogalmazását és kiszámítását, hanem az a figyelemre méltó sebesség és egyszerűség, amellyel az OLAP kocka ezt megteszi. Ráadásul ez a sebesség és egyszerűség bizonyos határokon belül nem függ a számítások összetettségétől és az adatbázis méretétől.

Néhány bevezető az OLAP-ba
kockát az MS Excel „pivot táblája” adhat meg. Ezek az objektumok hasonló logikával és hasonló interfészekkel rendelkeznek. De ahogy a cikkből kiderül, az OLAP funkcionalitása összehasonlíthatatlanul gazdagabb, a teljesítmény pedig összehasonlíthatatlanul magasabb, így a „pivot tábla” továbbra is helyi asztali termék marad, míg az OLAP vállalati szintű termék.

Miért olyan jó az OLAP kocka a megoldásra? elemző feladatokat? Az OLAP kocka úgy van kialakítva, hogy az összes lehetséges szakaszon minden mutató előre kiszámított (egészben vagy részben), és a felhasználó csak a szükséges mutatókat (mértékeket) és méreteket (méreteket) tudja „kihúzni” a egérrel, és a program újra tudja rajzolni a táblázatokat.

Az összes lehetséges elemzés minden szekcióban egyetlen hatalmas mezőt alkot, vagy inkább nem egy mezőt, hanem csak egy többdimenziós OLAP-kockát. Bármilyen kéréssel fordul is a felhasználó (menedzser, üzleti elemző, ügyvezető) az analitikai szolgáltatáshoz, a válaszadás gyorsaságát két dolog magyarázza: egyrészt könnyen megfogalmazható a szükséges elemzés (vagy név szerint kiválasztható egy listából, vagy megadható). képlet az MDX nyelvben ), másodszor, általában már ki van számítva.

Az analitika megfogalmazása háromféleképpen lehetséges: vagy adatbázismező (vagy inkább raktármező), vagy kocka tervezési szinten definiált számítási mező, vagy MDX nyelvi kifejezés, amikor interaktívan dolgozik a kockával.

Ez az OLAP kockák számos vonzó tulajdonságát jelenti. Lényegében megszűnik az akadály a felhasználó és az adatok között. Az akadályt egy alkalmazásprogramozó jelenti, akinek először is meg kell magyaráznia a problémát (feladatot kell kitűznie). Másodszor, meg kell várnia, amíg az alkalmazásprogramozó létrehoz egy algoritmust, megírja és hibakeresi a programot, majd esetleg módosítja. Ha sok alkalmazott van, és az igényeik változatosak és változékonyak, akkor alkalmazásprogramozók egész csapatára van szükség. Ebben az értelemben egy OLAP-kocka (és egy képzett üzleti elemző) egy egész csapat alkalmazás-programozót helyettesít az analitikai munkában, ahogy egy nagy teljesítményű kotrógép egy kotrógép-kezelővel egy egész csapat migráns munkás lapáttal helyettesít egy árokásásnál!

Ezzel párhuzamosan a kapott analitikai adatok egy másik nagyon fontos minősége is megvalósul. Mivel az egész cégnek csak egy OLAP kocka van, i.e. Ez ugyanaz a mező, ahol az elemzők mindenki számára elérhetők, ami kiküszöböli az adatok bosszantó eltéréseit. Amikor egy menedzsernek ugyanazt a feladatot több független munkatársnak kell feltennie a szubjektivitás tényezőjének kiküszöbölése érdekében, de mégis különböző válaszokat hoznak, amit mindenki vállalkozik valamilyen módon megmagyarázni stb. Az OLAP-kocka biztosítja az analitikai adatok egységességét a vállalati hierarchia különböző szintjein, pl. ha egy vezető részletezni akar egy számára érdekes mutatót, akkor minden bizonnyal eljut azokhoz az alacsonyabb szintű adatokhoz, amelyekkel a beosztottja dolgozik, és pontosan ez lesz az az adat, amely alapján a magasabb szintű mutatót kiszámították. , és nem valami más adat, más módon, máskor kapott stb. Vagyis az egész vállalat ugyanazt az elemzést látja, de az összesítés különböző szintjein.

Mondjunk egy példát. Tegyük fel, hogy egy kezelő kezeli a követeléseket. Amíg a lejárt követelések KPI-je zöld, ez azt jelenti, hogy minden normális, és nincs szükség kezelési lépésekre. Ha a szín sárgára vagy pirosra változott, akkor valami nem stimmel: értékesítési részlegenként levágjuk a KPI-ket, és azonnal „pirossal” látjuk a részlegeket. A következő részben a menedzserek - és az eladó, akinek ügyfelei le vannak maradva a fizetéssel, az azonosításra kerül. (Továbbá a lejárt összeg megosztható vásárlókra, feltételekre stb.) A társaság vezetője bármilyen szinten közvetlenül kapcsolatba léphet a szabálysértőkkel. De általában ugyanazt a KPI-t (a hierarchia szintjein) látják mind az osztályvezetők, mind az értékesítési vezetők. A helyzet korrigálása érdekében tehát nem is kell a „szőnyegre hívásra” várniuk... Természetesen magának a KPI-nek nem kell feltétlenül a lejárt fizetések összegének lennie – lehet a a késedelmes fizetések súlyozott átlagos időtartama, vagy általában a követelések forgási üteme.

Vegyük észre, hogy az MDX nyelv összetettsége és rugalmassága a gyors (néha azonnali) eredményekkel együtt lehetővé teszi számunkra, hogy olyan összetett vezérlési problémákat oldjunk meg (figyelembe véve a fejlesztés és a hibakeresés szakaszait), amelyek egyébként fel sem merülhettek volna. az alkalmazásprogramozók bonyolultsága és a megfogalmazás kezdeti bizonytalansága miatt. (Hosszú határidők az alkalmazásprogramozóknak az analitikai problémák megoldására a rosszul értelmezett megfogalmazások és a programok hosszas módosításai miatt, amikor a feltételek megváltoznak a gyakorlatban.)

Ügyeljünk arra is, hogy a cég minden dolgozója az általános területről pontosan azt a termést tudja begyűjteni egy OLAP elemzőtől, amelyre a munkájához szüksége van, és ne elégedjen meg a neki közösen kivágott „csíkkal”. „standard jelentések”.

Az OLAP-kockákkal kliens-szerver módban történő munkavégzéshez használható többfelhasználós felület lehetővé teszi, hogy minden alkalmazott, másoktól függetlenül, saját (akár bizonyos készségekkel saját maga által készített) elemzési blokkokkal (jelentésekkel) rendelkezzen, amelyek meghatározása után automatikusan frissítve – más szóval, mindig naprakész állapotban vannak.

Vagyis az OLAP-kocka lehetővé teszi, hogy az analitikai munkát (amelyet valójában nemcsak a recepciós elemzők végeznek, hanem a vállalat szinte minden alkalmazottja, még a logisztikusok és az egyenlegeket és szállítmányokat irányító menedzserek is) szelektívebbé tegyük, „nem általánosságban” , ami feltételeket teremt a munka javításához és a termelékenység növeléséhez.

Bevezetésünket összefoglalva megjegyezzük, hogy az OLAP kockák használata magasabb szintre emelheti a vállalat irányítását. Az analitikai adatok egységessége a hierarchia minden szintjén, megbízhatóságuk, összetettségük, indikátorok létrehozásának és módosításának egyszerűsége, egyedi beállítások, nagy adatfeldolgozási sebesség, végül az alternatív elemzési utak támogatására fordított pénz és idő megtakarítása (alkalmazásprogramozók, alkalmazott független számításai) távlatokat nyitnak az OLAP kockák használatára az orosz nagyvállalatok gyakorlatában.

OLTP + OLAP: vázlat Visszacsatolás a vállalatirányítási láncban

Most nézzük meg az OLAP kockák általános elképzelését és alkalmazási helyét a vállalati menedzsment láncban. Az OLAP (OnLine Analytical Processing) kifejezést Edgar Codd brit matematikus vezette be a korábban bevezetett OLTP (OnLine Transactions Processing) kifejezése mellé. Erről később lesz szó, de E. Codd természetesen nem csak a terminusokat, hanem az OLTP és az OLAP matematikai elméleteit is javasolta. Anélkül, hogy belemennénk a részletekbe, a modern értelmezés szerint az OLTP egy relációs adatbázis, amely információrögzítési, tárolási és visszakeresési mechanizmusnak tekinthető.

Megoldás módszertana

Az ERP-rendszerek (Enterprice Resource Planning), mint például az 1C7, 1C8, MS Dynamics AX, felhasználó-orientált szoftverfelülettel (dokumentumok bevitele és szerkesztése stb.) és relációs adatbázissal (DB) rendelkeznek az információk tárolására és visszakeresésére, amelyet ma szoftverek képviselnek. termékek, mint például az MS SQL Server (SS).

Vegye figyelembe, hogy az ERP-rendszer adatbázisában regisztrált információk valóban nagyon értékes erőforrások. Nem csak az a lényeg, hogy a nyilvántartott információk biztosítsák a társaság aktuális dokumentumáramlását (bizonylatok kinyerése, helyesbítése, kinyomtatási és egyeztetési képesség stb.), és ne csak a pénzügyi kimutatások (adók, könyvvizsgálat stb.) számítási képességét biztosítsák. ). Vezetési szempontból sokkal fontosabb, hogy az OLTP rendszer (relációs adatbázis) valójában a vállalat tevékenységének valóságos, életnagyságú digitális modellje.

A folyamat irányításához azonban nem elegendő az ezzel kapcsolatos információk regisztrálása. A folyamatot a folyamat előrehaladását jellemző numerikus mutatók (KPI-k) rendszerében kell bemutatni. Ezenkívül a mutatók számára elfogadható értéktartományokat kell meghatározni. És csak akkor, ha a mutató értéke a megengedett intervallumon kívül esik, akkor ellenőrzési műveletet kell végrehajtani.

Az irányítás e logikáját (vagy mitológiáját) tekintve mind az ókori görög filozófus, Platón, aki megalkotta a kormányos (kibernóz) képét, aki az evezőre támaszkodik, amikor a csónak letér az irányról, mind a Norbert Wiener amerikai matematikus, aki a számítógépes korszak előestéjén megalkotta a kibernetika tudományát.

Az OLTP módszerrel történő információrögzítés szokásos rendszere mellett egy másik rendszerre van szükség - egy rendszerre az összegyűjtött információk elemzésére. Ez a kiegészítő, amely a vezérlőkörben a felügyelet és a vezérlőobjektum közötti visszacsatolás szerepét tölti be, egy OLAP rendszer vagy röviden egy OLAP kocka.

Az OLAP szoftveres megvalósításaként az MS Analysis Services segédprogramot fogjuk figyelembe venni, amely az MS SQL Server (rövidítve SSAS) szabványos szállításának része. Vegyük észre, hogy E. Codd terve szerint az OLAP kockának az analitikában ugyanolyan átfogó cselekvési szabadságot kell biztosítania, mint az OLTP rendszernek és a relációs adatbázisnak (SQL Server) az információk tárolása és visszakeresése során.

OLAP logisztika

Most nézzük a konkrét konfigurációt külső eszközök, alkalmazási programok és technológiai műveletek, amelyeken az OLAP kocka automatizált működése alapul.

Feltételezzük, hogy a vállalat ERP rendszert használ, például 1C7 vagy 1C8, amelyen belül a szokásos módon rögzítik az információkat. Ennek az ERP-rendszernek az adatbázisa egy bizonyos szerveren található, és az MS SQL Server támogatja.

Azt is feltételezzük, hogy egy másik szerveren van telepítve szoftver, beleértve az MS Analysis Services (SSAS) segédprogrammal rendelkező MS SQL Servert, valamint az MS SQL Server Management Studio, MS C#, MS Excel és MS Visual Studio alkalmazásokat. Ezek a programok együtt alkotják a szükséges kontextust: az OLAP-kockák fejlesztője számára szükséges eszközöket és felületeket.

Az SSAS szerveren van egy szabadon terjesztett, blat nevű program, amelyet (paraméterekkel) innen hívnak parancs sorés postai szolgáltatást nyújt.

A helyi hálózaton belüli alkalmazottak munkaállomásain többek között MS Excel programok (2003-as verziószámmal) telepítve vannak, valamint adott esetben egy speciális illesztőprogram, amely biztosítja, hogy az MS Excel együttműködjön az MS Analysis Services szolgáltatással (kivéve, ha a megfelelő illesztőprogram már telepítve van). szerepel az MS Excelben).

A határozottság kedvéért feltételezzük, hogy az alkalmazottak munkaállomásain operációs rendszer van telepítve. Windows rendszer XP és szervereken - Windows Server 2008. Ezenkívül az MS SQL Server 2005 használható SQL Serverként, az Enterprise Edition (EE) vagy a Developer Edition (DE) verzióval a kiszolgálóra az OLAP kockával együtt. Ezekben a kiadásokban lehetőség van az ún. „félig additív intézkedések”, azaz a közönséges összegeken kívüli további összesített függvények (statisztika) (például szélsőség vagy átlag).

OLAP-kocka tervezés (OLAP-kubizmus)

Ejtsünk néhány szót magáról az OLAP-kocka kialakításáról. A statisztika nyelvén az OLAP-kocka teljesítménymutatók összessége, amelyeket minden szükséges szakaszban kiszámítanak, például a szállítási mutatót vevők, áruk, dátumok szerinti szakaszokban stb. Az OLAP-kockákkal foglalkozó orosz szakirodalomban az angolról való közvetlen fordítás miatt a mutatókat „méréseknek”, a szakaszokat pedig „dimenzióknak” nevezik. Ez egy matematikailag helyes, de szintaktikailag és szemantikailag nem túl sikeres fordítás. Az orosz „measure”, „dimension”, „dimension” szavak jelentése és írásmódja szinte megegyezik, míg az angol „measure” és „dimension” eltér mind helyesírási, mind jelentési szempontból. Ezért előnyben részesítjük a hagyományos orosz statisztikai „mutató” és „kivágás” kifejezéseket, amelyek jelentésükben hasonlóak.

Az adatok rögzítésére szolgáló OLTP-rendszerrel kapcsolatban számos lehetőség kínálkozik az OLAP-kocka szoftveres megvalósítására. Csak egy sémát fogunk figyelembe venni, a legegyszerűbb, legmegbízhatóbb és leggyorsabb.

Ebben a kialakításban az OLAP és az OLTP nem osztja meg a táblákat, és az OLAP elemzés a lehető legrészletesebben kerül kiszámításra a kocka frissítési (folyamat) szakaszában, amely megelőzi a használati szakaszt. Ezt a sémát MOLAP-nak (Multidimensional OLAP) hívják. Hátránya az ERP-vel való aszinkronitás és a magas memóriaköltségek.

Bár formálisan egy OLAP-kockát fel lehet építeni az összes (ezer) ERP-rendszer relációs adatbázis-táblázatának adatforrásként és azok összes (több száz) mezőjéből indikátorként vagy szakaszként, a valóságban ezt nem szabad megtenni. Oda-vissza. A kockába való betöltéshez célszerűbb külön adatbázist készíteni, amelyet „kirakatnak” vagy „raktárnak” neveznek.

Több ok is rákényszerít bennünket erre.

  • Először, Egy OLAP-kocka összekapcsolása egy valós adatbázis tábláival minden bizonnyal technikai problémákat okoz. A táblázatban lévő adatok megváltoztatása kiválthatja a kocka frissítését, és a kocka frissítése nem feltétlenül gyors folyamat, így a kocka folyamatos újjáépítés állapotában lesz; Ugyanakkor a kockafrissítési eljárás blokkolhatja (olvasáskor) az adatbázistáblák adatait, lelassítva a felhasználók munkáját az adatok ERP rendszerben történő rögzítésében.
  • Másodszor, A túl sok mutató és vágás drámaian megnöveli a kocka tárolóterületét a szerveren. Ne felejtsük el, hogy az OLAP-kocka nemcsak a forrásadatokat tárolja, mint az OLTP-rendszerben, hanem az összes lehetséges szakaszon (sőt az összes szekció összes kombinációján) összesített mutatót is. Emellett ennek megfelelően lelassul a kocka frissítési sebessége, végső soron az elemzések és az ezek alapján készült felhasználói jelentések elkészítésének, frissítésének sebessége is.
  • Harmadik, túl sok mező (jelzők és szakaszok) problémákat okoz az OLAP fejlesztői felületén, mert az elemek listája hatalmas lesz.
  • Negyedszer, Az OLAP kocka nagyon érzékeny az adatintegritás megsértésére. A kocka nem építhető fel, ha a kulcsadatok nem a kocka mezőkapcsolatok felépítésében meghatározott hivatkozáson találhatók. Az ideiglenes vagy állandó integritássértések és az üres mezők gyakoriak az ERP rendszer adatbázisában, de ez egyáltalán nem alkalmas az OLAP számára.

Azt is hozzáteheti, hogy az ERP rendszernek és az OLAP kockának különböző szervereken kell elhelyezkednie a terhelés megosztásához. De ha vannak közös táblák az OLAP-hoz és az OLTP-hez, akkor a hálózati forgalom problémája is felmerül. Gyakorlatilag megoldhatatlan problémák merülnek fel ilyenkor, amikor több, egymástól eltérő ERP rendszert (1C7, 1C8, MS Dynamics AX) kell egyetlen OLAP kockába összevonni.

Valószínűleg továbbra is halmozhatjuk a technikai problémákat. De ami a legfontosabb, ne feledje, hogy az OLTP-vel ellentétben az OLAP nem az adatok rögzítésének és tárolásának eszköze, hanem egy elemző eszköz. Ez azt jelenti, hogy nincs szükség „piszkos” adatok feltöltésére és letöltésére az ERP-ből az OLAP-ba „csak abban az esetben”. Ellenkezőleg, először ki kell dolgozni egy koncepciót a vállalat menedzselésére, legalább a KPI rendszer szintjén, majd meg kell tervezni egy alkalmazás adattárházat (raktárt), amely ugyanazon a szerveren található, mint az OLAP-kocka, és tartalmaz egy kis , a menedzsmenthez szükséges finomított adatmennyiség az ERP-ből.

A rossz szokások népszerűsítése nélkül az OLTP-vel kapcsolatos OLAP-kocka a jól ismert „méghez” hasonlítható, amelyen keresztül a valódi regisztráció „erjesztett tömegéből” egy „tiszta termék” nyerhető ki.

Tehát azt kaptuk, hogy az OLAP adatforrása egy speciális adatbázis (raktár), amely ugyanazon a szerveren található, mint az OLAP. Ez általában két dolgot jelent. Először is speciális eljárásoknak kell lenniük, amelyek ERP-adatbázisokból raktárt hoznak létre. Másodszor, az OLAP kocka aszinkron az ERP rendszereivel.

A fentiek figyelembevételével a számítási folyamat architektúra következő változatát javasoljuk.

Megoldás architektúra

Tegyük fel, hogy egy bizonyos vállalatnak (holdingnak) sok ERP rendszere található különböző szervereken, amelyek elemzési adatait egy OLAP-kockán belül szeretnénk konszolidálni. Hangsúlyozzuk, hogy az ismertetett technológiában az ERP rendszerek adatait raktárszinten kombináljuk, az OLAP kocka kialakítását változatlanul hagyva.

Az OLAP szerveren képfájlokat (üres másolatokat) készítünk ezen ERP rendszerek adatbázisaiból. Időnként (éjszakánként) végrehajtjuk a megfelelő aktív ERP-adatbázisok részleges replikációját ezekre az üres másolatokra.

Ezután elindul az SP (tárolt eljárás), amely ugyanazon az OLAP szerveren, hálózati forgalom nélkül, az ERP rendszer adatbázisainak részleges replikái alapján létrehoz (vagy feltölt) egy raktárt (raktárt) - az OLAP kocka adatforrását.

Ezután elindul a raktári adatok alapján a kocka frissítésének/építésének standard eljárása (Folyamatművelet az SSAS felületen).

Nézzük meg a technológia néhány vonatkozását. Milyen munkát végeznek az SP-k?

A részleges replikáció eredményeként az aktuális adatok az OLAP-kiszolgálón lévő ERP-rendszerek képében jelennek meg. A részleges replikációt egyébként kétféleképpen lehet végrehajtani.

Először is, az ERP rendszer adatbázisában lévő összes táblából a részleges replikáció során csak azokat másolják át, amelyek a raktár felépítéséhez szükségesek. Ezt a táblanevek rögzített listája vezérli.

Másodszor, a részleges replikáció azt is jelentheti, hogy a tábla nem minden mezője másolódik, hanem csak azok, amelyek részt vesznek a raktár felépítésében. A másolandó mezők listája vagy megadásra kerül, vagy dinamikusan jön létre az SP-ben a másolat képében (ha nem minden mező szerepel kezdetben a táblázat másolatában).

Természetesen nem lehet teljes táblasorokat másolni, hanem csak új rekordokat lehet hozzáadni. Ez azonban komoly kellemetlenségeket okoz az ERP-revíziók „visszamenőleges” elszámolása során, ami a valós rendszerekben gyakran előfordul. Így könnyebb minden további nélkül átmásolni az összes rekordot (vagy frissíteni a „farkat” egy bizonyos dátumtól kezdve).

Ezután az SP fő feladata az ERP rendszer adatainak raktár formátumba konvertálása. Ha csak egy ERP rendszer van, akkor az átalakítás feladata elsősorban a szükséges adatok másolása, esetleg újraformázása. De ha több különböző felépítésű ERP rendszert kell összevonni ugyanabban az OLAP kockában, akkor az átalakítások bonyolultabbá válnak.

A több különböző ERP rendszer egy kockában való összevonásának feladata különösen nehéz, ha az objektumok halmazai (árukönyvtárak, vállalkozók, raktárak stb.) részben átfedik egymást, az objektumok jelentésük azonos, de természetesen eltérően íródnak le a könyvtárakban különböző rendszerek (kódok, azonosítók, nevek stb. értelmében).

Valójában egy nagy holdingban egy ilyen kép alakul ki, amikor több, azonos típusú, önállóan működő társasága megközelítőleg ugyanazon a területen végez megközelítőleg azonos típusú tevékenységet, de saját és nem egyeztetett regisztrációs rendszert alkalmaz. Ebben az esetben az adatok raktárszintű konszolidálásakor nem nélkülözheti a segédleképezési táblákat.

Fordítsunk egy kis figyelmet a raktári tárolási architektúrára. Az OLAP kocka sémát jellemzően „csillag” formájában ábrázolják, azaz. mint adattábla, amelyet könyvtárak „sugarai” vesznek körül - másodlagos kulcsértékek táblázatai. A táblázat az „indikátorok” blokkja, a referenciakönyvek a részük. Ebben az esetben a címtár lehet tetszőleges kiegyensúlyozatlan fa vagy kiegyensúlyozott hierarchia, például áruk vagy vállalkozók többszintű osztályozása. Egy OLAP-kockában a raktárból származó adattábla numerikus mezői automatikusan „mutatókká” (vagy mértékekké) válnak, a szakaszok (vagy dimenziók) pedig másodlagos kulcstáblázatok segítségével határozhatók meg.

Ez egy vizuális „pedagógiai” leírás. Valójában egy OLAP-kocka architektúrája sokkal összetettebb lehet.

Először is, egy raktár több „csillagból” állhat, amelyek esetleg közös könyvtárakon keresztül kapcsolódnak egymáshoz. Ebben az esetben az OLAP-kocka több kocka (több adatblokk) uniója lesz.

Másodszor, egy csillag „sugara” nem csak egy könyvtár lehet, hanem egy teljes (hierarchikus) fájlrendszer.

Harmadszor, a meglévő dimenzió szekciók alapján az OLAP fejlesztői felület eszközeivel új hierarchikus szakaszok definiálhatók (mondjuk kevesebb szinttel, eltérő szintrenddel stb.)

Negyedszer, a meglévő indikátorok és szakaszok alapján, MDX nyelvi kifejezések segítségével új mutatók (számítások) definiálhatók. Fontos megjegyezni, hogy az új kockák, új mutatók, új szakaszok automatikusan teljes mértékben integrálódnak az eredeti elemekkel. Azt is meg kell jegyezni, hogy a rosszul megfogalmazott számítások és a hierarchikus szakaszok jelentősen lelassíthatják az OLAP kocka működését.

MS Excel, mint interfész az OLAP-pal

Külön érdekesség az OLAP kockákat tartalmazó felhasználói felület. A legteljesebb interfészt természetesen maga az SSAS segédprogram biztosítja. Ez magában foglal egy OLAP kocka fejlesztői eszközkészletet, egy interaktív jelentéstervezőt és egy ablakot interaktív munka egy OLAP kockával MDX lekérdezések segítségével.

Magán az SSAS-on kívül számos olyan program létezik, amely interfészt biztosít az OLAP-nak, kisebb-nagyobb mértékben lefedi a funkcionalitásukat. De van köztük egy, amelynek véleményünk szerint tagadhatatlan előnyei vannak. Ez az MS Excel.

Az MS Excel-lel való interfészt egy speciális illesztőprogram biztosítja, amely külön letölthető vagy az Excel disztribúció része. Nem fedi le az összes OLAP funkcionalitást, de az MS Excel verziószámának növekedésével ez a lefedettség egyre szélesebb lesz (például az MS Excel 2007-ben úgy tűnik grafikus kép KPI, ami nem volt az MS Excel 2003-ban stb.).

Természetesen a meglehetősen teljes funkcionalitás mellett az MS Excel fő előnye ennek a programnak a széleskörű elterjedése, valamint az irodai felhasználók elsöprő számú ismeretsége. Ebben az értelemben, a többi interfész-programtól eltérően, a cégnek nem kell semmit sem vásárolnia, és senkit sem kell tovább képeznie.

Az MS Excel, mint az OLAP-pal való interfész nagy előnye, hogy az OLAP-jelentésben kapott adatokat önállóan tovább tudja feldolgozni (vagyis az OLAP-ból nyert adatok továbbtanulmányozása ugyanazon Excel más lapjain, már nem OLAP-eszközök használatával, hanem szokásos Excel eszközök használatával).

Facubi éjszakai kezelési ciklus

Most leírjuk az OLAP működés napi (éjszakai) számítási ciklusát. A számítás a C# 2005 nyelven írt és Task Scheduler-en keresztül elindított facubi program vezérlése alatt történik egy raktárral és SSAS-szal rendelkező szerveren. Kezdetben a facubi felmegy az Internetre, és leolvassa az aktuális árfolyamokat (egy pénznemben számos mutatót ábrázol). Ezután hajtsa végre a következő lépéseket.

Először a facubi olyan SP-ket indít el, amelyek a helyi hálózaton elérhető különböző ERP-rendszerek (holding elemek) adatbázisainak részleges replikációját végzik. A replikáció, mint mondtuk, előre elkészített „háttérre” - az SSAS-kiszolgálón található távoli ERP-rendszerek képeire - történik.

Másodszor, az SP-n keresztül leképezés történik az ERP-replikákról a raktári tárolóra - egy speciális DB-re, amely az OLAP-kockaadatok forrása és az SSAS-kiszolgálón található. Ebben az esetben három fő feladatot oldanak meg:

  • ERP adatok a szükséges kockaformátumokhoz igazítva; arról beszélünk táblázatokról és táblázatmezőkről egyaránt. (Néha a szükséges táblázatot „módosítani” kell, mondjuk több MS Excel-lapból.) A hasonló adatok eltérő formátumúak lehetnek a különböző ERP-kben, például az 1C7 könyvtárak kulcsazonosító mezőinek 36 számjegyű karakterkódja 8 hosszúságú. , és _idrref mezők az 1С8 könyvtárakban – 32 hosszúságú hexadecimális számok;
  • feldolgozás során logikai adatellenőrzést (beleértve a hiányzó adatok helyére alapértelmezett írást, ahol lehetséges) és integritás-ellenőrzést, pl. az elsődleges és másodlagos kulcsok jelenlétének ellenőrzése a megfelelő osztályozókban;
  • kódkonszolidáció objektumok, amelyeknek ugyanaz a jelentése a különböző ERP-kben. Például a különböző ERP-k címtárainak megfelelő elemei azonos jelentéssel bírhatnak, mondjuk ugyanazt a partnert jelentik. A kódok konszolidálásának problémáját leképezési táblák készítésével oldjuk meg, ahol különféle kódok ugyanazok a tárgyak kerülnek egységbe.

Harmadszor, a facubi elindul szokásos eljárás a folyamatkocka adatok frissítése (az SSAS segédprogram eljárásaiból).

Az ellenőrző listák alapján a facubi e-maileket küld a feldolgozási lépések előrehaladásáról.

A facubi végrehajtása után a Task Scheduler számos programot elindít excel fájlokat, amelyben az OLAP kocka indikátorok alapján előre elkészítik a riportokat. Mint mondtuk, az MS Excelnek van egy különlegessége szoftver interfész(külön letölthető vagy beépített illesztőprogram) az OLAP kockákkal való munkához (SSAS-szal). Az MS Excel indításakor az MS VBA programok (például makrók) aktiválódnak, amelyek biztosítják a jelentésekben szereplő adatok frissítését; a riportokat szükség esetén módosítjuk és ellenőrző listák szerint postai úton (blat program) küldjük el a felhasználóknak.

Az SSAS-kiszolgálóhoz hozzáféréssel rendelkező helyi hálózati felhasználók „élő” jelentéseket kapnak az OLAP-kockához konfiguráltan. (Elvileg ők maguk, mindenféle levél nélkül frissíthetik a náluk lévő OLAP-jelentéseket MS Excelben helyi számítógépek.) A helyi hálózaton kívüli felhasználók vagy eredeti jelentéseket kapnak, de korlátozott funkcionalitással, vagy számukra (az OLAP jelentések MS Excelben történő frissítése után) speciális „halott” jelentéseket számítanak ki, amelyek nem érik el az SSAS szervert.

Az eredmények értékelése

Fentebb beszéltünk az OLTP és az OLAP aszinkronjáról. A vizsgált technológiai változatban az OLAP kocka frissítési ciklus éjszaka történik (mondjuk hajnali 1-kor kezdődik). Ez azt jelenti, hogy az aktuális munkanapon a felhasználók a tegnapi adatokkal dolgoznak. Mivel az OLAP nem rögzítési eszköz (nézze meg a dokumentum legfrissebb változatát), hanem felügyeleti eszköz (értse a folyamat trendjét), az ilyen késés általában nem kritikus. Szükség esetén azonban a kocka architektúra (MOLAP) leírt változatában is naponta többször is elvégezhető a frissítés.

A frissítési eljárások végrehajtási ideje az OLAP kocka tervezési jellemzőitől (több-kevesebb bonyolultság, többé-kevésbé sikeres indikátorok és szekciók meghatározása), valamint a külső OLTP rendszerek adatbázisainak mennyiségétől függ. A tapasztalatok szerint a raktárépítési folyamat több perctől két óráig tart, a kockafrissítési eljárás (Process) 1-20 percig tart. Összetett OLAP kockákról beszélünk, amelyek több tucat csillag típusú struktúrát egyesítenek, több tucat közös „sugarról” (referencia szakaszról) és több száz indikátorról. Külső ERP rendszerek adatbázisainak mennyiségét a szállítási dokumentumok alapján becsülve évente több százezer dokumentumról és ennek megfelelően több millió terméksorról beszélünk. A felhasználót érdeklő történelmi feldolgozási mélység három-öt év volt.

A leírt technológiát számos területen alkalmazzák nagyvállalatok: 2008 óta a Russian Fish Company (RRK) és az Russian Sea Company (RM), 2012 óta a Santa Bremor társaság (SB). Egyes vállalatok elsősorban kereskedelmi és beszerző cégek (PPC), mások termelő vállalatok (hal- és tenger gyümölcsei feldolgozó üzemek a Moldovai Köztársaságban és a Fehérorosz Köztársaságban). Valamennyi vállalat nagy holding, amely több vállalatot egyesít független és különféle számítógépes számviteli rendszerekkel – a szabványos ERP-rendszerektől, mint például az 1C7 és 1C8, a DBF és Excel alapú „relic” számviteli rendszerekig. Hozzáteszem, hogy az OLAP kockák üzemeltetésének leírt technológiája (a fejlesztési szakasz figyelembevétele nélkül) vagy egyáltalán nem igényel speciális alkalmazottakat, vagy egy főállású üzleti elemző feladata. A probléma évek óta kavarog automatikus üzemmód, amely a vállalati alkalmazottak különböző kategóriáinak napi szintű naprakész jelentését biztosítja.

A megoldás előnyei és hátrányai

A tapasztalat azt mutatja, hogy a javasolt megoldás meglehetősen megbízható és könnyen használható. Könnyen módosítható (új ERP-k csatlakoztatása/lekapcsolása, új indikátorok és szekciók létrehozása, Excel jelentések és levelezési listáik létrehozása és módosítása) változatlanság nélkül vezérlő program facubi.

Az MS Excel, mint interfész az OLAP-pal, kellő kifejezőképességet biztosít, és lehetővé teszi a különböző kategóriájú irodai alkalmazottak számára, hogy gyorsan megismerjék az OLAP technológiát. A felhasználó napi „standard” OLAP jelentéseket kap; az MS Excel interfész OLAP használatával, önállóan tud OLAP jelentéseket készíteni MS Excelben. Ezenkívül a felhasználó önállóan folytathatja az OLAP-jelentések információinak tanulmányozását az MS Excel szokásos lehetőségeivel.

A „finomított” raktári adatbázis, amelyben több heterogén ERP rendszer konszolidálódik (a kocka építése során), akár OLAP nélkül is megoldható (SSAS szerveren, a nyelvi lekérdezési módszerrel Transzaktálj SQL-t vagy az SP módszer stb.) számos alkalmazott szabályozási probléma. Emlékezzünk vissza, hogy a raktári adatbázis-struktúra egységes és sokkal egyszerűbb (a táblák számát és a táblamezők számát tekintve), mint az eredeti ERP adatbázis-struktúrái.

Külön megjegyezzük, hogy a javasolt megoldásunkban lehetőség van különböző ERP-rendszerek egy OLAP-kockában történő összevonására. Ez lehetővé teszi a teljes holdingra vonatkozó elemzések beszerzését és az elemzések hosszú távú folytonosságának fenntartását, amikor egy vállalat egy másik számviteli ERP rendszerre költözik, például amikor 1C7-ről 1C8-ra lép át.

A MOLAP kocka modellt használtuk. Ennek a modellnek az előnyei a működési megbízhatóság és a felhasználói kérések gyors feldolgozása. Hátrányok: Az OLAP és az OLTP aszinkron, valamint nagy mennyiségű memória az OLAP tárolására.

Végezetül, itt van egy másik érv az OLAP mellett, amely alkalmasabb lehetett a középkorban. Mert bizonyító ereje a tekintélyen nyugszik. Egy szerény, egyértelműen alulértékelt brit matematikus, E. Codd a 60-as évek végén dolgozta ki a relációs adatbázisok elméletét. Ennek az elméletnek akkora ereje volt, hogy most, 50 év után már nehéz nem relációs adatbázist és az SQL-től eltérő adatbázis-lekérdező nyelvet találni.

A relációs adatbázisok elméletén alapuló OLTP technológia volt E. Codd első ötlete. Valójában az OLAP-kockák koncepciója a második ötlete, amelyet a 90-es évek elején fogalmazott meg. Még matematikus nélkül is számíthat arra, hogy a második ötlet ugyanolyan hatékony lesz, mint az első. Vagyis a számítógépes elemzés szempontjából az OLAP-ötletek hamarosan átveszik a világot, és kiszorítják az összes többit. Egyszerűen azért, mert az analitika témaköre az OLAP-ban találja meg átfogó matematikai megoldását, és ez a megoldás „megfelelő” (B. Spinoza kifejezése) az analitika gyakorlati problémájának. A „megfelelően” azt jelenti Spinozában, hogy Isten maga sem gondolhatott volna jobbat...

  1. Larson B. Üzleti elemzés fejlesztése Microsoft SQL Server 2005-ben. – Szentpétervár: „Péter”, 2008.
  2. Codd E. Az adatbázis-alnyelvek relációs teljessége, Data Base Systems, Courant Computer Science Sumposia Series 1972, v. 6, Englwood cliffs, N.Y., Prentice – Hall.

Kapcsolatban áll

Az adatok általában ritkák és hosszú ideig tárolódnak. Megvalósítható univerzális relációs DBMS vagy speciális szoftver (lásd még OLAP) alapján. BAN BEN szoftver termékek Az SAP cég az „infocube” kifejezést használja.

A tömb indexei a kocka méreteinek (dimenziói) vagy tengelyeinek, a tömbelemek értékei pedig a kocka mértékeinek (mértékeinek) felelnek meg.

w : (x,y,z) → w xyz,

Ahol x, y, z- mérések, w- mérni.

Ellentétben a programozási nyelv normál tömbjével, az OLAP-kocka elemeihez akár az indexdimenziók teljes készletével, akár azok részhalmazával lehet hozzáférni, és ekkor nem egy elem lesz az eredmény, hanem sok.

W : (x,y) → W = ( w z1, w z2, …, w zn}

Ismert leírás is OLAP kocka relációs algebra terminológiát használva relációk vetületeként.

Lásd még


Wikimédia Alapítvány. 2010.

  • Csillag diagram
  • Az otthonunk Oroszország (frakció)

Nézze meg, mi az „OLAP-kocka” más szótárakban:

    OLAP kocka- ... Wikipédia

    OLAP- (analitikus online feldolgozás, valós idejű elemző feldolgozás) adatfeldolgozási technológia, amely nagy mennyiségű adat alapján összefoglaló (összesített) információk elkészítésében áll, a ... ... Wikipédia által strukturált

    Kocka (egyértelműsítés)- A kocka egy többértékű kifejezés: A matematikában A sztereometriában a kocka egy hatszögletű szabályos poliéder Az algebrában a szám harmadik hatványa Tudományos-fantasztikus filmek sorozata: „Kocka” „Kocka 2: Hiperkocka” „Cube Zero” Orvosi szleng és zsargon... ... Wikipédia

    Kocka- Ennek a kifejezésnek más jelentése is van, lásd Kocka (jelentések). Kocka Típus Szabályos poliéder Arc négyzet ... Wikipédia

    Mondrian- OLAP-kiszolgáló típusa OLAP-kiszolgáló, fejlesztői Pentaho operációs rendszer platformközi szoftver Legújabb verzió 3.4.1 (2012 05 07) Licencmentes szoftver ... Wikipédia - Információelemző rendszer automatizált rendszer rendszerint a helyzetközpontok egyik eleme, hogy a szakértők nagy mennyiségű adatot gyorsan elemezhessenek. Ezenkívül az IAS néha tartalmaz egy gyűjtőrendszert... ... Wikipédia

E munka részeként a következő kérdéseket veszik figyelembe:

  • Mik azok az OLAP kockák?
  • Mik azok a mértékek, dimenziók, hierarchiák?
  • Milyen típusú műveleteket lehet végrehajtani az OLAP kockákon?
Az OLAP kocka fogalma

Az OLAP fő posztulátuma az adatmegjelenítés többdimenziós jellege. Az OLAP terminológiában a kocka vagy hiperkocka fogalmát egy többdimenziós diszkrét adattér leírására használják.

Kocka egy többdimenziós adatstruktúra, amelyből a felhasználó-elemző információkat tud lekérdezni. A kockák tényekből és méretekből jönnek létre.

Adat- ezek a vállalaton belüli tárgyakra és eseményekre vonatkozó adatok, amelyek elemzés tárgyát képezik. Az azonos típusú tények mércéket alkotnak. A mérték a kockacellában lévő érték típusa.

Mérések- ezek azok az adatelemek, amelyek alapján a tényeket elemzik. Az ilyen elemek gyűjteménye dimenzióattribútumot képez (például a hét napjai alkothatnak idődimenzió-attribútumot). A kereskedelmi vállalkozások üzleti elemzési feladataiban a dimenziók gyakran tartalmaznak olyan kategóriákat, mint „idő”, „értékesítés”, „termékek”, „vevők”, „munkavállalók”, „földrajzi elhelyezkedés”. A dimenziók leggyakrabban hierarchikus struktúrák, amelyek logikai kategóriákat képviselnek, amelyek segítségével a felhasználó elemezheti a tényleges adatokat. Minden hierarchiának egy vagy több szintje lehet. Így a „földrajzi elhelyezkedés” dimenzió hierarchiája a következő szinteket tartalmazhatja: „ország – régió – város”. Az időhierarchiában például a következő szintsorokat különböztethetjük meg: Egy dimenziónak több hierarchiája is lehet (egy dimenzió minden hierarchiájának a dimenziótábla kulcsattribútumaival kell rendelkeznie).

A kocka egy vagy több ténytáblázatból származó tényleges adatokat tartalmazhat, és leggyakrabban több dimenziót is tartalmazhat. Minden adott kockának általában van egy meghatározott fókusza az elemzéshez.

Az 1. ábra egy példát mutat be egy kockára, amelyet egy adott vállalat kőolajtermékek értékesítésének régiónkénti elemzésére terveztek. Ennek a kockának három dimenziója van (idő, termék és régió) és egy mérték (pénzben kifejezett értékesítési volumen). A mérési értékek a kocka megfelelő celláiban tárolódnak. Minden cellát egyedileg azonosít az egyes dimenziók tagjainak halmaza, úgynevezett sor. Például a kocka bal alsó sarkában található cellát (amely a $98399 értéket tartalmazza) a sor határozza meg [2005. július, Távol-Kelet, Diesel]. Itt a 98 399 dolláros érték a gázolaj Távol-Keleten 2005. júliusi értékesítési volumenét mutatja (pénzben kifejezve).

Azt is érdemes megjegyezni, hogy egyes cellák nem tartalmaznak értékeket: ezek a cellák üresek, mert a ténytábla nem tartalmaz rájuk vonatkozó adatokat.

Rizs. 1. Kocka információkkal a kőolajtermékek értékesítéséről a különböző régiókban

Az ilyen kockák létrehozásának végső célja az, hogy minimalizálja a lekérdezések feldolgozási idejét, amelyek a tényleges adatokból kinyerik a szükséges információkat. Ennek a feladatnak a végrehajtásához a kockák általában előre kiszámított összegeket tartalmaznak aggregációk(összesítések). Azok. a kocka a ténylegesnél nagyobb adatteret fed le - logikai, számított pontok vannak benne. Az aggregációs függvények lehetővé teszik a logikai térben lévő pontok értékeinek kiszámítását a tényleges értékek alapján. A legegyszerűbb összesítő függvények a SUM, MAX, MIN, COUNT. Tehát például a használata MAX funkció, a példában megadott kockánál beazonosítható, hogy mikor következett be a gázolaj értékesítés csúcsa a Távol-Keleten stb.

A többdimenziós kockák másik sajátossága az eredet meghatározásának nehézsége. Például hogyan állíthatja be a 0 pontot a Termék vagy régiók dimenzióhoz? A probléma megoldása egy speciális attribútum bevezetése, amely egyesíti a dimenzió összes elemét. Ez az attribútum (automatikusan létrehozva) csak egy elemet tartalmaz – Mind. Az olyan egyszerű összesítő függvényeknél, mint az összeg, az All elem egyenértékű az adott dimenzió tényleges terében lévő összes elem értékének összegével.

A többdimenziós adatmodellek egyik fontos fogalma az altér vagy alkocka. Az alkocka a kocka teljes területének egy része, a kockán belüli többdimenziós alakzat formájában. Mivel a kocka többdimenziós tere diszkrét és korlátozott, az alkocka is diszkrét és korlátozott.

Műveletek OLAP kockákon

A következő műveletek hajthatók végre egy OLAP-kockán:

  • szelet;
  • forgás;
  • konszolidáció;
  • részletezve.
Szelet(2. ábra) egy alkocka speciális esete. Ez az eljárás egy többdimenziós adattömb részhalmazának kialakítására, amely egy vagy több, ebben az alhalmazban nem szereplő dimenzióelem egyetlen értékének felel meg. Például annak megtudásához, hogy a kőolajtermékek értékesítése hogyan haladt az idő múlásával csak egy bizonyos régióban, nevezetesen az Urálban, rögzítenie kell a „Termékek” dimenziót az „Ural” elemen, és ki kell bontania a megfelelő részhalmazt (alkockát) a kocka.
  • Rizs. 2. OLAP kocka szelet

    Forgás(3. ábra) - a jelentésben vagy a megjelenített oldalon bemutatott mérések helyének megváltoztatásának művelete. Például egy elforgatási művelet magában foglalhatja egy táblázat sorainak és oszlopainak átrendezését. Ezenkívül az adatkocka elforgatásával a táblázatból kimaradt méretek a helyükre kerülnek a megjelenített oldalon lévő méretekkel, és fordítva.

    OLAP (On-Line Analytical Processing) Az elektronikus analitikai adatfeldolgozás olyan módszere, amely az adatok hierarchikus kategóriákba rendezését mutatja be előre kiszámított összegek felhasználásával. Az OLAP-adatok hierarchikusan vannak rendezve, és táblák helyett kockákban tárolódnak. Az OLAP-kockák egy többdimenziós adatkészlet, amelynek tengelyei paramétereket és cellákat tartalmaznak, amelyek paraméterfüggő összesített adatokat tartalmaznak. A kockákat nagy mennyiségű adat összetett, többdimenziós elemzésére tervezték, mivel a nagyszámú egyedi rekord helyett csak összefoglaló eredményeket biztosítanak a jelentésekhez.

    Az OLAP fogalmát a híres adatbázis-kutató és a relációs adatmodell szerzője, E. F. Codd írta le 1993-ban. Jelenleg az OLAP támogatás számos DBMS-ben és más eszközben van megvalósítva.

    Az OLAP-kocka kétféle adatot tartalmaz:

    · összértékek, értékek, amelyekre összesíteni kívánja, reprezentálja számított adatmezők;

    · leíró információkat reprezentáló mérések vagy méretek. A leíró információk jellemzően részletezettségi szintekre vannak rendezve. Például: „Év”, „Negyed”, „Hónap” és „Nap” az „Idő” dimenzióban. A mezők részletezettségi szintjei szerinti rendszerezése lehetővé teszi a jelentéskészítő felhasználók számára, hogy megválasszák a megtekinteni kívánt részletességi szintet, kezdve a magas szintű összefoglaló adatokkal, majd a részletesebb nézetig, és fordítva.

    A Microsoft Query eszközök lehetővé teszik OLAP-kockák létrehozását is olyan lekérdezésekből, amelyek relációs adatbázis-adatokat töltenek be, mint pl. Microsoft Access, ebben az esetben a lineáris tábla strukturális hierarchiává (kockává) alakul.

    Az OLAP kocka létrehozása varázsló egy beépített Microsoft Query eszköz. Relációs adatbázison alapuló OLAP-kocka létrehozásához a varázsló futtatása előtt végre kell hajtania a következő lépéseket.

    1. Határozza meg az adatforrást (lásd: 6.1. ábra).

    2. A Microsoft Query segítségével hozzon létre egy lekérdezést, amely csak azokat a mezőket tartalmazza, amelyek egy OLAP-kocka adatmezői vagy dimenziómezői lesznek; ha egy kockában egy mezőt többször használnak, akkor azt a lekérdezésben kell szerepeltetni. hányszor.

    3. A lekérdezés-létrehozó varázsló utolsó lépésében állítsa a kapcsolót az elemre OLAP-kocka létrehozása innen ennek a kérésnek (lásd 6.2. ábra), vagy a kérés közvetlenül a Lekérdezés menü segítségével történő létrehozása után Fájl válassz egy csapatot Hozzon létre OLAP-kockát, amely után elindul az OLAP kocka létrehozása varázsló.

    Az OLAP-kocka létrehozása varázsló három lépésből áll.

    A varázsló első lépésénél (lásd 6.6. ábra) a adatmezők– számított mezők, amelyekhez összértéket kell meghatározni.



    Rizs. 6.6. Adatmezők meghatározása

    A varázsló a várt számított mezőket (általában numerikus mezőket) a lista elejére helyezi, ellenőrzi, és meghatározza ezeknek a mezőknek az eredményül kapott függvényét, általában - Összeg. Az adatmezők kiválasztásakor legalább egy mezőt ki kell választani számított mezőként, és legalább egy mezőt ki kell hagyni a méret meghatározásához.

    OLAP-kocka létrehozásakor négy összefoglaló függvényt használhat − Összeg, Szám(értékek száma), Minimális, Maximális numerikus mezőkhöz és egy függvényhez Szám minden más területen. Ha ugyanabban a mezőben több különböző összegző függvényt szeretne használni, akkor azt a mezőt a szükséges számú alkalommal szerepeltetni kell a lekérdezésben.

    A számított mező neve egy oszlopban megváltoztatható Adatmező neve.

    A varázsló második lépésében meghatározzák a leíró adatokat és azok méreteit (lásd 6.7. ábra). Mérési mező kiválasztásához a listából kell kiválasztania Forrás mezők húzza a kívánt méretmezőt felső szint a listára Mérések jelű területre Húzza ide a mezőket a méretek létrehozásához. OLAP-kocka létrehozásához meg kell határoznia legalább egy dimenziót. A varázsló ugyanazon lépésében használja a helyi menü Módosíthatja egy dimenzió vagy szintmező nevét.

    Rizs. 6.7. Dimenziómezők meghatározása

    Azok a mezők, amelyek elszigetelt vagy diszkrét adatokat tartalmaznak, és nem tartoznak hierarchiába, egyszintű dimenzióként definiálhatók. A kocka azonban hatékonyabb lesz, ha néhány mezőt szintekbe rendeznek. Ha egy dimenzió részeként szeretne szintet létrehozni, húzzon egy mezőt a listából Forrás mezők olyan mezőn, amely dimenzió vagy szint. A részletesebb információkat tartalmazó mezőket alacsonyabb szinteken kell elhelyezni. Például a 6.7. ábrán a mező Munka megnevezése a mező szintje Osztály neve.

    Ha egy mezőt alacsonyabb vagy magasabb szintre szeretne mozgatni, át kell húznia egy alacsonyabb vagy magasabb mezőbe a dimenzión belül. A szintek megjelenítéséhez vagy elrejtéséhez használja a vagy a gombokat.

    Ha dátum- vagy időmezőket használ legfelső szintű dimenzióként, az OLAP-kocka varázsló automatikusan létrehozza a szinteket ezekhez a dimenziókhoz. A felhasználó ezután kiválaszthatja, hogy mely szintek jelenjenek meg a jelentésekben. Kiválaszthat például heteket, negyedéveket és éveket vagy hónapokat (lásd: 6.7. ábra).

    Ne feledje, hogy a varázsló csak akkor hoz létre automatikusan szinteket a dátum- és időmezőkhöz, ha létrehoz egy legfelső szintű dimenziót; Ha ezeket a mezőket egy dimenzió alszintjeként adja hozzá, az automatikus szintek nem jönnek létre.

    A varázsló harmadik lépésében meghatározásra kerül a varázsló által létrehozott kocka típusa, három lehetőség közül választhat (lásd 6.8. ábra).

    Rizs. 6.8. A létrehozandó kocka típusának kiválasztása a varázsló harmadik lépésében

    · Az első két lehetőség egy kocka létrehozását jelenti minden egyes jelentés megnyitásakor (ha a kockát Excelből nézzük, akkor pivot tábláról beszélünk). Ebben az esetben a kérelemfájl és a fájl kocka definíciók *.oqy, amely a kocka létrehozására vonatkozó utasításokat tartalmazza. Az *.oqy fájl megnyitható Excel program jelentéseket készíthet a kocka alapján, és ha módosítania kell a kockán, a Lekérdezés megnyitásával újra futtassa a Kocka létrehozása varázslót.

    Alapértelmezés szerint a kockadefiníciós fájlok, valamint a lekérdezési fájlok az Application Data\Microsoft\Que-ries felhasználói profilmappájában tárolódnak. Ha *.oqy fájlt ment a szabványos mappába, a kockadefiníciós fájl neve megjelenik a lapon OLAP kockákúj lekérdezés megnyitásakor a Microsoft Queryben vagy parancs kiválasztásakor Hozzon létre egy kérést(menü Adat, almenü Külső adatok importálása) Microsoft Excelben.

    · A kockatípus harmadik opciójának kiválasztása esetén A kocka összes adatát tartalmazó kockafájl mentése, a rendszer lekéri a kocka összes adatát, és létrejön egy * kiterjesztésű kockafájl a felhasználó által megadott helyen .kölyök, amelyben ezeket az adatokat tárolják. Teremtés ez a fájl nem történik meg azonnal a gomb megnyomásakor Kész; a fájl akkor jön létre, amikor a kockadefiníciót fájlba menti, vagy amikor jelentést hoz létre a kocka alapján.

    A kocka típusának kiválasztását több tényező határozza meg: a kocka által tartalmazott adatok mennyisége; a kocka alapján létrehozandó jelentések típusa és összetettsége; rendszererőforrások (memória és lemezterület) stb.

    Külön *.cub kockafájlt kell létrehozni a következő esetekben:

    1) gyakran változó interaktív jelentések esetén, ha van elegendő lemezterület;

    2) amikor el kell mentenie a kockát egy hálózati kiszolgálóra, hogy hozzáférést biztosítson a többi felhasználó számára a jelentések létrehozásakor. A kockafájl adott adatokat szolgáltathat a forrásadatbázisból, miközben kihagyja azokat az érzékeny vagy érzékeny adatokat, amelyekhez meg szeretné akadályozni, hogy más felhasználók hozzáférjenek.



  • 
    Top