Olap excel kubi. OLAP = daudzdimensiju skats = kubs. Interneta pārdošanas kuba izveide

OLAP (Online Analytical Processing) datu kubi ļauj efektīvi iegūt un analizēt daudzdimensionālus datus. Atšķirībā no cita veida datubāzēm, OLAP datu bāzes ir īpaši izstrādātas analītiskai apstrādei un ātrai visu veidu datu kopu iegūšanai no tām. Faktiski pastāv vairākas galvenās atšķirības starp standarta relāciju datu bāzēm, piemēram, Access vai SQL Server, un OLAP datu bāzēm.

Rīsi. 1. Lai savienotu OLAP kubu ar Excel darbgrāmatu, izmantojiet komandu No Analytics pakalpojumiem

Lejupielādējiet piezīmi vai

Relāciju datu bāzēs informācija tiek attēlota kā ieraksti, kas tiek pievienoti, dzēsti un atjaunināti secīgi. OLAP datu bāzēs tiek glabāti tikai datu momentuzņēmumi. OLAP datu bāzē informācija tiek arhivēta kā viens datu bloks un ir paredzēta tikai izvadei pēc pieprasījuma. Lai gan OLAP datu bāzei var pievienot jaunu informāciju, esošie dati tiek reti rediģēti un vēl mazāk dzēsti.

Relāciju datu bāzes un OLAP datu bāzes ir strukturāli atšķirīgas. Relāciju datu bāzes parasti sastāv no tabulu kopas, kas ir savstarpēji saistītas. Dažos gadījumos relāciju datu bāzē ir tik daudz tabulu, ka ir ļoti grūti noteikt, kā tās ir savienotas. OLAP datu bāzēs attiecības starp atsevišķiem datu blokiem tiek definētas iepriekš un saglabātas struktūrā, kas pazīstama kā OLAP kubi. Datu kubi glabā pilnīgu informāciju par datu bāzes hierarhisko struktūru un attiecībām, kas ievērojami vienkāršo navigāciju tajā. Turklāt ir daudz vienkāršāk izveidot atskaites, ja jau iepriekš zināt, kur atrodas izvelkamie dati un kādi citi dati ar tiem ir saistīti.

Galvenā atšķirība starp relāciju datu bāzēm un OLAP datu bāzēm ir informācijas glabāšanas veids. Dati OLAP kubā reti tiek parādīti vispārīgā veidā. OLAP datu kubi parasti satur informāciju, kas tiek parādīta iepriekš izstrādātā formātā. Tādējādi datu grupēšanas, filtrēšanas, šķirošanas un apvienošanas operācijas kubos tiek veiktas pirms to aizpildīšanas ar informāciju. Tas padara pieprasīto datu izgūšanu un parādīšanu pēc iespējas vienkāršāku. Atšķirībā no relāciju datu bāzēm, nav nepieciešams pareizi sakārtot informāciju pirms tās parādīšanas ekrānā.

OLAP datu bāzes parasti izveido un uztur IT administratori. Ja jūsu organizācijai nav struktūras, kas būtu atbildīga par OLAP datu bāzu pārvaldību, varat sazināties ar relāciju datu bāzes administratoru ar pieprasījumu ieviest korporatīvais tīkls vismaz daži OLAP risinājumi.

Savienojuma izveide ar OLAP datu kubu

Lai piekļūtu OLAP datu bāzei, vispirms ir jāizveido savienojums ar OLAP kubu. Sāciet, atverot cilni Lente Dati. Noklikšķiniet uz pogas No citiem avotiem un nolaižamajā izvēlnē atlasiet komandu No Analytics pakalpojumiem(1. att.).

Kad atlasāt norādīto Data Connection Wizard komandu (2. att.). Tās galvenais uzdevums ir palīdzēt izveidot savienojumu ar serveri, ko Excel izmantos, pārvaldot datus.

1. Vispirms jums ir jāiesniedz Excel ar reģistrācijas informāciju. Dialoglodziņa laukos ievadiet servera nosaukumu, pieteikšanās vārdu un datu piekļuves paroli, kā parādīts attēlā. 2. Noklikšķiniet uz pogas Tālāk. Ja savienojat, izmantojot konts Windows, pēc tam iestatiet slēdzi Izmantojiet Windows autentifikāciju.

2. Nolaižamajā sarakstā atlasiet datu bāzi, ar kuru strādāsit (3. att.). Pašreizējā piemērā tiek izmantota Analysis Services Tutorial datu bāze. Kad esat atlasījis šo datu bāzi, tālāk esošajā sarakstā tiek piedāvāts importēt visus tajā pieejamos OLAP kubus. Izvēlieties vajadzīgo datu kubu un noklikšķiniet uz pogas Tālāk.

Rīsi. 3. Izvēlieties strādājošu datu bāzi un OLAP kubs, ko plānojat izmantot datu analīzei

3. Nākamajā vedņa dialoglodziņā, kas parādīts attēlā. 4, jums ir jāievada aprakstoša informācija par savienojumu, kuru veidojat. Visi dialoglodziņa lauki, kas parādīti attēlā. 4 nav jāaizpilda. Jūs vienmēr varat ignorēt pašreizējo dialoglodziņu, to neaizpildot, un tas nekādā veidā neietekmēs jūsu savienojumu.

Rīsi. 4. Mainiet savienojuma aprakstošo informāciju

4. Noklikšķiniet uz pogas Gatavs lai pabeigtu savienojuma izveidi. Ekrānā parādīsies dialoglodziņš Importēt datus(5. att.). Iestatiet slēdzi Rakurstabulas pārskats un noklikšķiniet uz Labi, lai sāktu rakurstabulas izveidi.

OLAP kuba struktūra

Veidojot rakurstabulu no OLAP datu bāzes, jūs ievērosiet, ka uzdevumrūts logs Rakurstabulas lauki atšķirsies no parastās rakurstabulas. Iemesls ir rakurstabulas izkārtojumā, lai precīzi atspoguļotu tai pievienotā OLAP kuba struktūru. Lai pēc iespējas ātrāk pārvietotos pa OLAP kubu, jums rūpīgi jāpārzina tā komponenti un to mijiedarbība. Attēlā 6. attēlā parādīta tipiska OLAP kuba pamatstruktūra.

Kā redzat, OLAP kuba galvenie komponenti ir izmēri, hierarhijas, līmeņi, dalībnieki un mēri:

  • Izmēri. Analizēto datu elementu galvenās īpašības. Parastie dimensiju piemēri ir Produkti, Klients un Darbinieks. Attēlā 6. attēlā parādīta dimensijas Produkti struktūra.
  • Hierarhijas. Iepriekš definēts līmeņu apkopojums noteiktā dimensijā. Hierarhija ļauj izveidot kopsavilkuma datus un analizēt tos dažādos struktūras līmeņos, neiedziļinoties attiecībās, kas pastāv starp šiem līmeņiem. Attēlā parādītajā piemērā. 6. attēlā, kategorijai Produkti ir trīs līmeņi, kas ir apkopoti vienā produktu kategoriju hierarhijā.
  • Līmeņi. Līmeņi ir kategorijas, kas ir apkopotas kopējā hierarhijā. Uztveriet slāņus kā datu laukus, kurus var pieprasīt un analizēt atsevišķi vienu no otra. Attēlā 6 ir tikai trīs līmeņi: kategorija, apakškategorija un produkta nosaukums.
  • Biedri. Viens datu elements dimensijā. Dalībniekiem parasti var piekļūt, izmantojot dimensiju, hierarhiju un līmeņu OLAP struktūru. Attēlā redzamajā piemērā. Produkta nosaukuma līmenī ir definēti 6 dalībnieki. Citiem līmeņiem ir savi dalībnieki, kas struktūrā nav parādīti.
  • Pasākumi- tie ir reāli dati OLAP kubos. Mērījumi tiek saglabāti savos izmēros, kurus sauc par mēra izmēriem. Varat pieprasīt mērījumus, izmantojot jebkuru dimensiju, hierarhiju, līmeņu un dalībnieku kombināciju. Šo procedūru sauc par “šķelšanas” pasākumiem.

Tagad, kad esat iepazinies ar OLAP kubu struktūru, no jauna apskatīsim PivotTable lauku sarakstu. Pieejamo lauku organizācija kļūst skaidra un nerada nekādas pretenzijas. Attēlā 7. attēlā parādīts, kā lauku saraksts attēlo OLAP rakurstabulas elementus.

Rakurstabulas lauku sarakstā OLAP pasākumi vispirms tiek parādīti un norādīti ar summēšanas ikonu (sigma). Šie ir vienīgie datu elementi, kas var atrasties VALUE reģionā. Aiz tiem sarakstā ir norādīti izmēri, kas norādīti ar ikonu ar tabulas attēlu. Mūsu piemērā tiek izmantota dimensija Klients. Šajā dimensijā ir vairākas hierarhijas. Kad hierarhija ir izvērsta, varat skatīt atsevišķus datu līmeņus. Lai skatītu OLAP kuba datu struktūru, vienkārši pārvietojieties pa rakurstabulas lauku sarakstu.

OLAP rakurstabulu ierobežojumi

Strādājot ar OLAP rakurstabulām, atcerieties, ka jūs mijiedarbojaties ar rakurstabulas datu avotu Analysis Services OLAP vidē. Tas nozīmē, ka katru datu kuba uzvedības aspektu, sākot no dimensijām līdz kubā iekļautajiem pasākumiem, kontrolē arī OLAP analīzes pakalpojumi. Tas savukārt rada ierobežojumus darbībām, kuras var veikt OLAP rakurstabulās:

  • Rakurstabulas apgabalā VĒRTĪBAS nevar ievietot citus laukus, izņemot mērus;
  • nav iespējams mainīt summēšanai izmantoto funkciju;
  • Jūs nevarat izveidot aprēķināto lauku vai aprēķināto vienumu;
  • visas izmaiņas lauku nosaukumos tiek atceltas uzreiz pēc lauka noņemšanas no rakurstabulas;
  • Lapas lauka parametru maiņa nav atļauta;
  • komanda nav pieejama Rādītlapas;
  • opcija ir atspējota Rādītparakstielementi ja vērtību apgabalā nav lauku;
  • opcija ir atspējota Starpsummas pēc filtra atlasītajiem lapas elementiem;
  • parametrs nav pieejams Fonspieprasījumu;
  • pēc dubultklikšķa veikšanas laukā VĒRTĪBAS tiek atgriezti tikai pirmie 1000 ieraksti no rakurstabulas kešatmiņas;
  • izvēles rūtiņa ir atspējota Optimizētatmiņa.

Autonomu datu kubu izveide

Standarta rakurstabulā avota dati tiek glabāti jūsu vietējā cietajā diskā. Tādējādi jūs vienmēr varat tos pārvaldīt, kā arī mainīt struktūru, pat bez piekļuves tīklam. Bet tas nekādā gadījumā neattiecas uz OLAP rakurstabulām. OLAP rakurstabulās kešatmiņa neatrodas vietējā cietajā diskā. Tāpēc uzreiz pēc atvienošanas no lokālais tīkls jūsu OLAP rakurstabula vairs nedarbosies. Šādā tabulā nevarēs pārvietot nevienu lauku.

Ja jums joprojām ir jāanalizē OLAP dati, kad neesat izveidojis savienojumu ar tīklu, izveidojiet bezsaistes datu kubu. Šis ir atsevišķs fails, kas attēlo rakurstabulas kešatmiņu. Šajā failā tiek glabāti OLAP dati, kas tiek skatīti pēc atvienošanas no lokālā tīkla. Lai izveidotu atsevišķu datu kubu, vispirms izveidojiet OLAP rakurstabulu. Novietojiet kursoru rakurstabulā un noklikšķiniet uz pogas OLAP rīki kontekstuālā cilne Analīze, kas iekļauta konteksta ciļņu komplektā Darbs ar rakurstabulām. Izvēlieties komandu Bezsaistes OLAP režīms(8. att.).

Ekrānā parādīsies dialoglodziņš Iestatījumi akumulatora darbības laiks OLAP(9. att.). Noklikšķiniet uz pogas Izveidojiet bezsaistes datu failu. Ekrānā parādīsies pirmais Data Cube File Creation Wizard logs. Noklikšķiniet uz pogas Tālāk lai turpinātu procedūru.

Otrajā solī (10. att.) norādiet izmērus un līmeņus, kas tiks iekļauti datu kubā. Dialoglodziņā ir jāatlasa dati, ko importēt no OLAP datu bāzes. Ir jāizvēlas tikai tie izmēri, kas būs nepieciešami pēc datora atvienošanas no lokālā tīkla. Jo vairāk izmēru norādāt, jo lielāks būs autonomais datu kubs.

Noklikšķiniet uz pogas Tālāk lai pārietu uz trešo soli (11. att.). Šajā logā ir jāatlasa dalībnieki vai datu elementi, kas netiks iekļauti kubā. Ja izvēles rūtiņa nav atzīmēta, norādītais vienums netiks importēts un aizņems nevajadzīgu vietu vietējā cietajā diskā.

Norādiet datu kuba atrašanās vietu un nosaukumu (12. attēls). Datu kuba failiem ir paplašinājums .cub.

Pēc kāda laika programma Excel saglabās bezsaistes datu kubu norādītajā mapē. Lai to pārbaudītu, veiciet dubultklikšķi uz faila, kas automātiski ģenerēs darba failu Excel darbgrāmatas, kurā ir rakurstabula, kas saistīta ar atlasīto datu kubu. Kad tas ir izveidots, varat izplatīt bezsaistes datu kubu visiem ieinteresētajiem lietotājiem, kuri strādā bezsaistes LAN režīmā.

Kad ir izveidots savienojums ar vietējo tīklu, varat atvērt bezsaistes datu kuba failu un atjaunināt to un saistīto datu tabulu. Lūdzu, ņemiet vērā: lai gan bezsaistes datu kubs tiek izmantots, ja nav piekļuves tīklam, tas ir jāatjaunina, kad tiek atjaunots tīkla savienojums. Mēģinot atjaunināt bezsaistes datu kubu pēc tam, kad tīkla savienojums ir zaudēts, radīsies kļūme.

Datu kuba funkciju izmantošana rakurstabulās

Datu kuba funkcijas, kas tiek izmantotas OLAP datu bāzēs, var palaist arī no rakurstabulas. Mantotajās Excel versijās datu kuba funkcionalitātei bija piekļuve tikai pēc pievienojumprogrammas Analysis Pack instalēšanas. Programmā Excel 2013 šīs funkcijas ir iebūvētas programmā un tāpēc ir pieejamas lietošanai. Lai pilnībā izprastu viņu iespējas, apskatīsim konkrētu piemēru.

Viens no visvairāk vienkāršus veidus Datu kuba funkciju apguve ietver OLAP rakurstabulas pārveidošanu datu kuba formulās. Šī procedūra ir ļoti vienkārša un ļauj ātri iegūt datu kubu formulas, neveidojot tās no nulles. Galvenais princips ir aizstāt visas rakurstabulas šūnas ar formulām, kas ir saistītas ar OLAP datu bāzi. Attēlā 13. attēlā parādīta rakurstabula, kas saistīta ar OLAP datu bāzi.

Novietojiet kursoru jebkurā rakurstabulas vietā, noklikšķiniet uz pogas OLAP rīki kontekstuālā lentes cilne Analīze un izvēlieties komandu Konvertēt uz formulām(14. att.).

Ja rakurstabulā ir pārskata filtra lauks, ekrānā parādīsies dialoglodziņš, kas parādīts 1. attēlā. 15. Šajā logā varat norādīt, vai vēlaties pārveidot datu filtru nolaižamos sarakstus formulās. Ja atbilde ir apstiprinoša, nolaižamie saraksti tiks noņemti un tā vietā tiks parādītas statiskas formulas. Ja nākotnē plānojat izmantot nolaižamos sarakstus, lai mainītu rakurstabulas saturu, notīriet vienīgo izvēles rūtiņu dialoglodziņā. Ja strādājat ar rakurstabulu saderības režīmā, datu filtri tiks automātiski pārveidoti formulās bez iepriekšēja brīdinājuma.

Pēc dažām sekundēm rakurstabulas vietā tiks parādītas formulas, kas tiek izpildītas datu kubos un nodrošina nepieciešamās informācijas izvadi Excel logā. Lūdzu, ņemiet vērā, ka tādējādi tiek noņemti iepriekš lietotie stili (16. att.).

Rīsi. 16. Apskatiet formulu joslu: šūnās ir datu kuba formulas

Tā kā skatītās vērtības vairs nav rakurstabulas objekta daļa, varat pievienot kolonnas, rindas un aprēķinātos dalībniekus un apvienot tos ar citām ārējie avoti, un arī mainīt pārskatu ar visvairāk Dažādi ceļi, tostarp vilkšanas un nomešanas formulas.

Aprēķinu pievienošana OLAP rakurstabulām

IN iepriekšējās versijas Excel OLAP rakurstabulas neļāva veikt pielāgotus aprēķinus. Tas nozīmē, ka OLAP rakurstabulām nebija iespējams pievienot papildu analīzes līmeni tādā pašā veidā, kā ir iespējams pievienot aprēķinātos laukus un dalībniekus parastajām rakurstabulām (lai iegūtu plašāku informāciju, pirms turpināt, lūdzu, pārliecinieties, ka esat iepazinies ar šo materiālu lasīšana).

Programmā Excel 2013 ir ieviesti jauni OLAP rīki - aprēķinātie mēri un aprēķinātie MDX izteiksmju dalībnieki. Jūs vairs neaprobežojaties tikai ar mērījumu un dalībnieku izmantošanu savā OLAP kubā, ko nodrošina jūsu DBA. Izveidojot pielāgotus aprēķinus, jūs iegūstat papildu analīzes iespējas.

Ievads MDX. Izmantojot rakurstabulu ar OLAP kubu, datu bāzei izsniedzat MDX (daudzdimensiju izteiksmes) vaicājumus. MDX ir vaicājumu valoda, ko izmanto, lai izgūtu datus no daudzdimensionāliem avotiem (piemēram, OLAP kubiem). Kad tiek mainīta vai atjaunināta OLAP rakurstabula, attiecīgie MDX vaicājumi tiek nosūtīti uz OLAP datu bāzi. Vaicājuma rezultāti tiek atgriezti atpakaļ programmā Excel un parādīti rakurstabulas apgabalā. Tas ļauj strādāt ar OLAP datiem bez lokālās rakurstabulas kešatmiņas kopijas.

Veidojot aprēķinātos mērus un MDX dalībniekus, tiek izmantota MDX valodas sintaksi. Izmantojot šo sintaksi, rakurstabula ļauj aprēķiniem mijiedarboties ar OLAP datu bāzes aizmugursistēmu. Grāmatā apskatītie piemēri ir balstīti uz pamata MDX dizainiem, kas demonstrē jaunu Excel funkcijas 2013. gads. Ja jums ir jāizveido sarežģīti aprēķināti mēri un MDX dalībnieki, jums būs jāpavada laiks, lai uzzinātu vairāk par MDX iespējām.

Izveidojiet aprēķinātos mērījumus. Aprēķinātais pasākums ir aprēķinātā lauka OLAP versija. Ideja ir izveidot jaunu datu lauku, pamatojoties uz dažām matemātiskām operācijām, kas veiktas esošajos OLAP laukos. Attēlā parādītajā piemērā. 17, tiek izmantota OLAP kopsavilkuma tabula, kurā iekļauts preču saraksts un daudzums, kā arī ienākumi no katras no tām realizācijas. Mums ir jāpievieno jauns pasākums, kas aprēķinās vidējo cenu par vienu preces vienību.

Analīze Darbs ar rakurstabulām. Nolaižamajā izvēlnē OLAP rīki atlasiet vienumu (18. att.).

Rīsi. 18. Izvēlieties izvēlnes vienumu MDX aprēķinātais mērs

Ekrānā parādīsies dialoglodziņš Izveidojiet aprēķināto mēru(19. att.).

Veiciet tālāk norādītās darbības.

2. Izvēlieties pasākumu grupu, kurā atradīsies jaunais aprēķinātais pasākums. Ja to neizdarīsiet, programma Excel automātiski ievietos jauno mērvienību pirmajā pieejamajā mērvienību grupā.

3. Laukā MDX izteiksme(MDX) Ievadiet kodu, kas norāda jauno pasākumu. Lai paātrinātu ievadīšanas procesu, izmantojiet sarakstu kreisajā pusē, lai atlasītu esošos mērījumus, ko izmantot aprēķinos. Veiciet dubultklikšķi uz vajadzīgā mēra, lai to pievienotu MDX laukam. Lai aprēķinātu vidējo vienības pārdošanas cenu, tiek izmantots šāds MDX:

4. Noklikšķiniet uz Labi.

Pievērsiet uzmanību pogai Pārbaudiet MDX, kas atrodas loga apakšējā labajā daļā. Noklikšķiniet uz šīs pogas, lai pārbaudītu, vai MDX sintakse ir pareiza. Ja sintaksē ir kļūdas, tiek parādīts ziņojums.

Kad esat pabeidzis jaunā aprēķinātā mēra izveidi, dodieties uz sarakstu Rakurstabulas lauki un atlasiet to (20. att.).

Aprēķinātā pasākuma apjoms attiecas tikai uz pašreizējo darbgrāmatu. Citiem vārdiem sakot, aprēķinātie mēri netiek izveidoti tieši OLAP servera kubā. Tas nozīmē, ka neviens nevarēs piekļūt aprēķinātajam mēram, ja vien neatvērsit vispārēja piekļuve uz darba burtnīcu, pretējā gadījumā jūs to nepublicēsit internetā.

Izveidot aprēķinātos MDX dalībniekus. MDX aprēķinātais dalībnieks ir parastā aprēķinātā dalībnieka OLAP versija. Ideja ir izveidot jaunu datu elementu, pamatojoties uz dažām matemātiskām operācijām, kas veiktas ar esošajiem OLAP elementiem. Attēlā parādītajā piemērā. 22, tiek izmantota OLAP rakurstabula, kas ietver pārdošanas informāciju par 2005.–2008. gadu (ar ceturkšņa sadalījumu). Pieņemsim, ka vēlaties apkopot datus par pirmo un otro ceturksni, izveidojot jaunu elementu Pirmā pusgada. Apvienosim arī datus, kas saistīti ar trešo un ceturto ceturksni, veidojot jaunu elementu Second of Year.

Rīsi. 22. Mēs pievienosim jaunus MDX aprēķinātos dalībniekus gada pirmajā pusē un otrajā pusgadā

Novietojiet kursoru jebkurā rakurstabulas vietā un atlasiet konteksta cilni Analīze no konteksta ciļņu kopas Darbs ar rakurstabulām. Nolaižamajā izvēlnē OLAP rīki atlasiet vienumu MDX aprēķinātais dalībnieks(23. att.).

Ekrānā parādīsies dialoglodziņš (24. att.).

Rīsi. 24.Logs Aprēķinātās preces izveide

Veiciet tālāk norādītās darbības.

1. Nosauciet aprēķināto mēru.

2. Atlasiet vecākhierarhiju, kurai veidojat jaunus aprēķinātos dalībniekus. Būvlaukumā Vecāku elements piešķirt vērtību Visi. Šis iestatījums ļauj programmai Excel piekļūt visiem vecākhierarhijas dalībniekiem, novērtējot izteiksmi.

3. Logā MDX izteiksme Ievadiet MDX sintaksi. Lai ietaupītu laiku, izmantojiet sarakstu kreisajā pusē, lai atlasītu esošos dalībniekus, ko izmantot MDX. Veiciet dubultklikšķi uz atlasītā vienuma, un Excel to pievienos logam MDX izteiksme. Attēlā parādītajā piemērā. 24, pirmā un otrā ceturkšņa summu aprēķina:

..&& +

.. && +

.. && + …

4. Noklikšķiniet uz Labi. Programmā Excel tiek parādīts jaunizveidotais MDX aprēķinātais dalībnieks rakurstabulā. Kā parādīts attēlā. 25, jaunais aprēķinātais vienums tiek parādīts kopā ar citiem aprēķinātajiem rakurstabulas vienumiem.

Attēlā 26. attēlā parādīts līdzīgs process, ko izmanto, lai izveidotu otrā pusgada aprēķināto vienību.

Ņemiet vērā, ka programma Excel pat nemēģina noņemt sākotnējos MDX dalībniekus (27. attēls). Rakurstabulā joprojām tiek rādīti ieraksti, kas atbilst 2005.–2008. gadam, sadalīti pa ceturkšņiem. Šajā gadījumā tas nav nekas liels, taču vairumā gadījumu jums vajadzētu paslēpt "papildus" elementus, lai izvairītos no konfliktiem.

Rīsi. 27. Programma Excel parāda izveidoto MDX aprēķināto dalībnieku kā sākotnējos dalībniekus. Bet joprojām ir labāk izdzēst sākotnējos elementus, lai izvairītos no konfliktiem

Atcerieties: aprēķinātie dalībnieki ir atrodami tikai pašreizējā darbgrāmatā. Citiem vārdiem sakot, aprēķinātie mēri netiek izveidoti tieši OLAP servera kubā. Tas nozīmē, ka neviens nevarēs piekļūt aprēķinātajam mēram vai aprēķinātajam dalībniekam, ja vien jūs kopīgosit darbgrāmatu vai nepublicēsit to tiešsaistē.

Ņemiet vērā: ja mainās vecākhierarhija vai vecākelements OLAP kubā, MDX aprēķinātais elements vairs nedarbojas. Šis elements būs jāizveido no jauna.

OLAP aprēķinu pārvaldība. Excel nodrošina saskarni, kas ļauj pārvaldīt aprēķinātos mērus un MDX dalībniekus OLAP rakurstabulās. Novietojiet kursoru jebkurā rakurstabulas vietā un atlasiet konteksta cilni Analīze no konteksta ciļņu kopas Darbs ar rakurstabulām. Nolaižamajā izvēlnē OLAP rīki atlasiet vienumu Aprēķinu pārvaldība. Logā Aprēķinu pārvaldība Ir pieejamas trīs pogas (28. att.):

  • Izveidot. Izveidojiet jaunu aprēķināto mērvienību vai aprēķināto MDX dalībnieku.
  • Mainīt. Mainiet atlasīto aprēķinu.
  • Dzēst. Dzēst atlasīto aprēķinu.

Rīsi. 28. Dialoglodziņš Aprēķinu pārvaldība

Veiciet OLAP datu analīzi, kas notiks, ja. Programmā Excel 2013 varat veikt datu analīzi OLAP rakurstabulās. Pateicoties tam jauna iespēja Rakurstabulā varat mainīt vērtības un pārrēķināt mērus un dalībniekus, pamatojoties uz veiktajām izmaiņām. Varat arī izplatīt izmaiņas atpakaļ OLAP kubā. Lai izmantotu “kā būtu, ja” analīzes iespējas, izveidojiet OLAP rakurstabulu un atlasiet kontekstuālo cilni Analīze Darbs ar rakurstabulām. Nolaižamajā izvēlnē OLAP rīki izvēlieties komandu Ko darīt, ja analīze –> Iespējot analīzi, kas notiks, ja(29. att.).

No šī brīža jūs varat mainīt rakurstabulas vērtības. Lai mainītu atlasīto vērtību PivotTable, ar peles labo pogu noklikšķiniet uz tās un atlasiet vienumu konteksta izvēlnē (30. att.). Programma Excel atkārtoti izpildīs visus rakurstabulas aprēķinus ar jūsu veiktajām izmaiņām, tostarp aprēķinātajiem mēriem un aprēķinātajiem MDX dalībniekiem.

Rīsi. 30. Izvēlieties vienumu Aprēķinot rakurstabulu, ņemiet vērā izmaiņas lai veiktu izmaiņas rakurstabulā

Pēc noklusējuma rakurstabulas labojumi, kas veikti, ja analīzes režīmā, ir lokāli. Ja vēlaties izplatīt izmaiņas OLAP serverī, atlasiet komandu, lai publicētu izmaiņas. Atlasiet konteksta cilni Analīze, kas atrodas kontekstuālo ciļņu komplektā Darbs ar rakurstabulām. Nolaižamajā izvēlnē OLAP rīki atlasiet vienumus Ko darīt, ja analīze – > Publicēt izmaiņas(31. att.). Šīs komandas izpildes rezultātā " rakstīt atpakaļ» OLAP serverī, kas nozīmē, ka izmaiņas var pārnest uz avota OLAP kubu. (Lai izplatītu izmaiņas OLAP serverī, jums ir jābūt atbilstošām atļaujām, lai piekļūtu serverim. Sazinieties ar datu bāzes administratoru, lai palīdzētu iegūt rakstīšanas piekļuves atļaujas OLAP datu bāzei.)

Piezīme tika uzrakstīta, pamatojoties uz Jeļenas Aleksandra grāmatu. . 9. nodaļa

/ Kubistiskā manierē. OLAP kubu pielietojums lielo uzņēmumu vadības praksē


Saskarsmē ar

Klasesbiedriem

Konstantīns Tokmačovs, sistēmas arhitekts

Kubisma stilā.
OLAP kubu pielietojums lielo uzņēmumu vadības praksē

Iespējams, ir pagājis laiks, kad korporācijas skaitļošanas resursi tika tērēti tikai informācijas un grāmatvedības pārskatu ierakstīšanai. Tajā pašā laikā vadības lēmumi tika pieņemti "ar aci" birojos, sanāksmēs un sanāksmēs. Varbūt Krievijā ir pienācis laiks atgriezt korporatīvās skaitļošanas sistēmas to galvenajam resursam - vadības problēmu risināšanai, pamatojoties uz datorā reģistrētajiem datiem

Par biznesa analītikas priekšrocībām

Korporatīvās vadības cilpā starp “neapstrādātajiem” datiem un pārvaldītā objekta ietekmēšanas “svirām” ir “veiktspējas rādītāji” - KPI. Tie veido sava veida “informācijas paneli”, kas atspoguļo dažādu kontrolētā objekta apakšsistēmu stāvokli. Uzņēmuma aprīkošana ar informatīviem darbības rādītājiem un to aprēķināšanas un iegūto vērtību uzraudzība ir biznesa analītiķa darbs. Automatizētie analīzes pakalpojumi, piemēram, MS SQL Server Analysis Services (SSAS) utilīta un tās galvenais rīks OLAP kubs, var sniegt nozīmīgu palīdzību korporācijas analītisko darbu organizēšanā.

Šeit ir jāpiemin vēl viens punkts. Teiksim, amerikāņu tradīcijās specialitāti, kas vērsta uz darbu ar OLAP kubiem, sauc par BI (Business Intelligence). Nevajadzētu būt ilūzijām, ka amerikāņu BI atbilst Krievijas “biznesa analītiķim”. Neapvainojieties, bet bieži vien mūsu biznesa analītiķis ir "zemgrāmatvedis" un "nepietiekams programmētājs", speciālists ar neskaidrām zināšanām un nelielu atalgojumu, kuram īsti nav neviena sava darbarīka un metodikas.

BI speciālists faktiski ir lietišķs matemātiķis, augsti kvalificēts speciālists, kurš uzņēmuma arsenālā izmanto modernas matemātiskās metodes (to sauca par operāciju izpēti). BI vairāk atbilst specialitātei "sistēmu analītiķis", kas kādreiz bija PSRS, absolvējis Maskavas Valsts universitātes Skaitļošanas matemātikas un matemātikas fakultāti. M.V. Lomonosovs. OLAP kubs un analīzes pakalpojumi var kļūt par daudzsološu pamatu Krievijas biznesa analītiķa darba vietai, iespējams, pēc dažām padziļinātām apmācībām amerikāņu BI virzienā.

Pēdējā laikā ir parādījusies vēl viena kaitīga tendence. Pateicoties specializācijai, ir zudusi savstarpējā sapratne starp dažādām uzņēmumu darbinieku kategorijām. Grāmatvedis, vadītājs un programmētājs, piemēram, “gulbis, vēži un līdaka” I. A. pasakā. Krilovs, velk korporāciju dažādos virzienos.

Grāmatvedis ir aizņemts ar atskaitēm, viņa summas gan pēc nozīmes, gan dinamikas nav tieši saistītas ar uzņēmuma biznesa procesu.

Vadītājs ir aizņemts ar savu biznesa procesa daļu, bet nespēj globāli, uzņēmuma līmenī kopumā novērtēt savas darbības rezultātus un perspektīvas.

Beidzot programmētājs, kurš savulaik (pateicoties savai izglītībai) bija progresīvu tehnisko ideju diriģents no zinātnes sfēras uz biznesa sfēru, ir pārvērties par pasīvu grāmatveža un vadītāja fantāziju īstenotāju, tāpēc nav vairs neparasti, ka korporāciju IT nodaļas virza grāmatveži un vispār visi, kam nav slinkums. Iniciatīvas trūkums, analfabēts, bet salīdzinoši augsti apmaksāts 1C programmētājs ir īsts Krievijas korporāciju posts. (Gandrīz kā pašmāju futbolists.) Es pat nerunāju par tā sauktajiem "ekonomistiem un juristiem", par viņiem viss ir pateikts jau sen.

Tātad biznesa analītiķa amats, kas aprīkots ar zināšanu ietilpīgu SSAS aparātu, pārzinot programmēšanas un grāmatvedības pamatus, spēj konsolidēt uzņēmuma darbu saistībā ar biznesa procesa analīzi un prognozēšanu.

OLAP kubu priekšrocības

OLAP kubs ir moderns līdzeklis korporatīvās datorsistēmu datu bāzes analīze, kas ļauj nodrošināt darbiniekus visos hierarhijas līmeņos ar nepieciešamo rādītāju kopumu, kas raksturo ražošanas process kompānijas. Lieta ir ne tikai tajā, ka ērtais interfeiss un elastīgā vaicājumu valoda MDX kubam (MultiDimensional eXpressions) ļauj formulēt un aprēķināt nepieciešamos analītiskos rādītājus, bet arī ievērojamais ātrums un vieglums, ar kādu OLAP kubs to dara. Turklāt šis ātrums un vieglums noteiktās robežās nav atkarīgs no aprēķinu sarežģītības un datu bāzes lieluma.

Neliels ievads OLAP-
kubu var dot ar MS Excel “rakurstabulu”. Šiem objektiem ir līdzīga loģika un līdzīgas saskarnes. Bet, kā būs redzams no raksta, OLAP funkcionalitāte ir nesalīdzināmi bagātāka, un veiktspēja ir nesalīdzināmi augstāka, tāpēc “raurstabula” paliek lokāls darbvirsmas produkts, savukārt OLAP ir uzņēmuma līmeņa produkts.

Kāpēc OLAP kubs ir tik labs risināšanai analītiskie uzdevumi? OLAP kubs ir izveidots tā, lai visi rādītāji visās iespējamās sadaļās būtu iepriekš aprēķināti (pilnībā vai daļēji), un lietotājs var tikai “izvilkt” nepieciešamos rādītājus (mērījumus) un izmērus (izmērus) ar peli, un programma var pārzīmēt tabulas.

Visa iespējamā analītika visās sadaļās veido vienu milzīgu lauku, pareizāk sakot, nevis lauku, bet tikai daudzdimensionālu OLAP kubu. Neatkarīgi no tā, kādu pieprasījumu lietotājs (vadītājs, biznesa analītiķis, izpilddirektors) vēršas pie analītikas pakalpojuma, atbildes ātrums ir izskaidrojams ar divām lietām: pirmkārt, nepieciešamo analīzi var viegli formulēt (vai nu atlasīt no saraksta pēc nosaukuma, vai norādīt formula MDX valodā ), otrkārt, kā likums, tā jau ir aprēķināta.

Analītikas formulēšana ir iespējama trīs variantos: tas ir vai nu datu bāzes lauks (vai drīzāk noliktavas lauks), vai aprēķina lauks, kas definēts kuba dizaina līmenī, vai MDX valodas izteiksme, interaktīvi strādājot ar kubu.

Tas nozīmē vairākas pievilcīgas OLAP kubu funkcijas. Būtībā pazūd barjera starp lietotāju un datiem. Barjera ir lietojumprogrammu programmētāja formā, kuram, pirmkārt, ir jāpaskaidro problēma (uzstādītu uzdevumu). Otrkārt, jums būs jāgaida, līdz lietojumprogrammu programmētājs izveidos algoritmu, uzrakstīs un atkļūdos programmu un pēc tam, iespējams, to modificēs. Ja darbinieku ir daudz un viņu prasības ir daudzveidīgas un mainīgas, tad nepieciešama vesela aplikāciju programmētāju komanda. Šajā ziņā OLAP kubs (un kvalificēts biznesa analītiķis) analītiskā darba ziņā aizstāj veselu lietojumprogrammu programmētāju komandu, tāpat kā jaudīgs ekskavators ar ekskavatora operatoru aizvieto veselu viesstrādnieku komandu ar lāpstām, rokot grāvi!

Tajā pašā laikā tiek sasniegta vēl viena ļoti svarīga iegūto analītisko datu kvalitāte. Tā kā visam uzņēmumam ir tikai viens OLAP kubs, t.i. Šis ir viens un tas pats lauks ar analītiķiem visiem, kas novērš kaitinošas datu neatbilstības. Kad vadītājam viens un tas pats uzdevums jāuzdod vairākiem neatkarīgiem darbiniekiem, lai novērstu subjektivitātes faktoru, bet viņi tomēr nes dažādas atbildes, kuras katrs apņemas kaut kā izskaidrot utt. OLAP kubs nodrošina analītisko datu vienveidību dažādos korporatīvās hierarhijas līmeņos, t.i. ja vadītājs vēlas precizēt kādu sev interesējošo rādītāju, tad viņš noteikti nonāks pie zemākā līmeņa datiem, ar kuriem strādā viņa padotais, un tieši uz šiem datiem tika aprēķināts augstākā līmeņa rādītājs. , nevis kādi citi dati, kas saņemti kādā citā veidā, citā laikā utt. Tas nozīmē, ka viss uzņēmums redz vienu un to pašu analīzi, bet dažādos apkopojuma līmeņos.

Sniegsim piemēru. Pieņemsim, ka pārzinis kontrolē debitoru parādus. Kamēr nokavēto debitoru KPI ir zaļā krāsā, tas nozīmē, ka viss ir normāli un nekādas pārvaldības darbības nav nepieciešamas. Ja krāsa ir mainījusies uz dzeltenu vai sarkanu, kaut kas nav kārtībā: mēs sagriežam KPI pa pārdošanas nodaļām un uzreiz redzam nodaļas “sarkanā krāsā”. Nākamā sadaļa pēc vadītājiem - un tiek identificēts pārdevējs, kura klienti kavē maksājumus. (Turklāt nokavēto summu var dalīt pa klientiem, pēc termiņiem utt.) Korporācijas vadītājs var tieši sazināties ar pārkāpējiem jebkurā līmenī. Bet kopumā vienu un to pašu KPI (to hierarhijas līmeņos) redz gan nodaļu vadītāji, gan pārdošanas vadītāji. Tāpēc, lai situāciju labotu, viņiem pat nav jāgaida “zvans uz paklāja”... Protams, pašam KPI nav obligāti jābūt nokavēto maksājumu summai - tas var būt vidējais svērtais kavēto maksājumu periods vai kopumā debitoru parādu apgrozījuma likme.

Ņemsim vērā, ka MDX valodas sarežģītība un elastība kopā ar ātrajiem (dažkārt momentānajiem) rezultātiem ļauj atrisināt (ņemot vērā izstrādes un atkļūdošanas posmus) sarežģītus vadības uzdevumus, kuri citādi nemaz nebūtu uzdoti. lietojumprogrammu programmētāju sarežģītības un sākotnējās formulēšanas neskaidrības dēļ. (Ilgie termiņi lietojumprogrammu programmētājiem, lai atrisinātu analītiskos uzdevumus, jo praksē bieži rodas slikti saprotami formulējumi un ilgstošas ​​programmu modifikācijas, kad apstākļi mainās.)

Pievērsīsim uzmanību arī tam, ka katrs uzņēmuma darbinieks no vispārējā lauka var savākt OLAP analītiķim tieši to ražu, kas viņam nepieciešama darbam, nevis apmierināties ar “sloksni”, kas viņam tiek izgriezta komunālajā jomā. "Standarta ziņojumi".

Vairāku lietotāju saskarne darbam ar OLAP kubu klienta-servera režīmā ļauj katram darbiniekam neatkarīgi no citiem izveidot savus (pat ar zināmām prasmēm izveidotus) analītikas blokus (atskaites), kas pēc definēšanas tiek automātiski definēti. atjaunināts - citiem vārdiem sakot, tie vienmēr ir atjaunināti.

Tas ir, OLAP kubs ļauj padarīt analītisko darbu (kuru faktiski veic ne tikai uzņemšanas analītiķi, bet faktiski gandrīz visi uzņēmuma darbinieki, pat loģisti un vadītāji, kas kontrolē atlikumus un sūtījumus) padarīt selektīvāku, “nevis vispārīgi” , kas rada apstākļus darba uzlabošanai un produktivitātes paaugstināšanai.

Apkopojot mūsu ievadu, mēs atzīmējam, ka OLAP kubu izmantošana var paaugstināt uzņēmuma vadību augstākā līmenī. Analītisko datu vienveidība visos hierarhijas līmeņos, to uzticamība, sarežģītība, indikatoru izveides un modificēšanas vienkāršība, individuāli iestatījumi, liels datu apstrādes ātrums un, visbeidzot, naudas un laika ietaupījums alternatīvu analītisko ceļu atbalstam (lietojumprogrammu programmētāji, darbinieka neatkarīgie aprēķini) paver perspektīvas OLAP kubu izmantošanai lielo Krievijas uzņēmumu praksē.

OLTP + OLAP: kontūra atsauksmes uzņēmuma vadības ķēdē

Tagad apskatīsim OLAP kubu vispārējo ideju un to pielietojuma punktu korporatīvajā vadības ķēdē. Terminu OLAP (OnLine Analytical Processing) ieviesa britu matemātiķis Edgars Kods papildus savam iepriekš ieviestajam terminam OLTP (OnLine Transactions Processing). Par to tiks runāts vēlāk, bet E. Kods, protams, piedāvāja ne tikai terminus, bet arī OLTP un OLAP matemātiskās teorijas. Neiedziļinoties detaļās, mūsdienu interpretācijā OLTP ir relāciju datu bāze, kas tiek uzskatīta par informācijas ierakstīšanas, uzglabāšanas un izguves mehānismu.

Risinājuma metodika

ERP sistēmām (Enterprice Resource Planning), piemēram, 1C7, 1C8, MS Dynamics AX, ir uz lietotāju orientētas programmatūras saskarnes (dokumentu ievade un rediģēšana utt.) un relāciju datu bāze (DB) informācijas glabāšanai un izguvei, ko mūsdienās pārstāv programmatūra. produkti, piemēram, MS SQL Server (SS).

Ņemiet vērā, ka ERP sistēmas datubāzē reģistrētā informācija patiešām ir ļoti vērtīgs resurss. Lieta ir ne tikai tajā, ka reģistrētā informācija nodrošina korporācijas aktuālo dokumentu plūsmu (dokumentu izvilkšana, koriģēšana, drukāšanas un saskaņošanas iespējas u.c.), nevis tikai finanšu pārskatu (nodokļi, audits u.c.) spēju aprēķināt. ). No vadības viedokļa daudz svarīgāk ir tas, ka OLTP sistēma (relāciju datu bāze) faktiski ir korporācijas darbības reāls reālā izmēra digitālais modelis.

Taču, lai procesu vadītu, nepietiek tikai ar informācijas reģistrēšanu par to. Process jāparāda skaitlisko rādītāju (KPI) sistēmas veidā, kas raksturo tā gaitu. Turklāt indikatoriem ir jānosaka pieļaujamie vērtību diapazoni. Un tikai tad, ja indikatora vērtība ir ārpus pieļaujamā intervāla, ir jāseko kontroles darbībai.

Runājot par šo kontroles loģiku (vai mitoloģiju) (“kontrole ar novirzi”), gan sengrieķu filozofs Platons, kurš radīja stūrmaņa (kibernozes) tēlu, kurš, laivai novirzoties no kursa, balstās uz airu, gan Amerikāņu matemātiķis Norberts Vīners, kurš datoru ēras priekšvakarā radīja kibernētikas zinātni.

Papildus parastajai informācijas reģistrēšanas sistēmai, izmantojot OLTP metodi, ir nepieciešama vēl viena sistēma - savāktās informācijas analīzes sistēma. Šis papildinājums, kas vadības cilpā spēlē atgriezeniskās saites lomu starp pārvaldību un vadības objektu, ir OLAP sistēma vai, īsi sakot, OLAP kubs.

Kā OLAP programmatūras ieviešanu mēs apsvērsim MS Analysis Services utilītu, kas ir daļa no MS SQL Server, saīsināti SSAS, standarta piegādes. Ņemiet vērā, ka saskaņā ar E. Codd plānu OLAP kubam analītikā ir jānodrošina tāda pati visaptveroša rīcības brīvība, kādu nodrošina OLTP sistēma un relāciju datu bāze (SQL Server), glabājot un izgūstot informāciju.

OLAP loģistika

Tagad apskatīsim konkrēto konfigurāciju ārējās ierīces, lietojumprogrammas un tehnoloģiskās darbības, uz kurām balstās OLAP kuba automatizētā darbība.

Mēs pieņemsim, ka korporācija izmanto ERP sistēmu, piemēram, 1C7 vai 1C8, kurā informācija tiek ierakstīta kā parasti. Šīs ERP sistēmas datu bāze atrodas uz noteikta servera un to atbalsta MS SQL Server.

Mēs arī pieņemsim, ka citā serverī ir instalēta programmatūra, tostarp MS SQL Server ar MS Analysis Services (SSAS) utilītu, kā arī MS SQL Server Management Studio, MS C#, MS Excel un MS Visual Studio. Šīs programmas kopā veido nepieciešamo kontekstu: rīkus un nepieciešamās saskarnes OLAP kubu izstrādātājam.

SSAS serverim ir brīvi izplatīta programma blat, ko sauc (ar parametriem) no komandrinda un pasta pakalpojumu sniegšana.

Darbinieku darbstacijās lokālajā tīklā cita starpā tiek instalētas MS Excel programmas (versijas ne mazāk kā 2003), kā arī, iespējams, īpašs draiveris, lai nodrošinātu MS Excel darbību ar MS Analysis Services (ja vien atbilstošais draiveris jau nav iekļauts programmā MS Excel).

Precīzāk, pieņemsim, ka darbinieku darbstacijās ir instalēta operētājsistēma. Windows sistēma XP un serveros - Windows Server 2008. Turklāt ļaujiet MS SQL Server 2005 izmantot kā SQL serveri ar Enterprise Edition (EE) vai Developer Edition (DE) instalētu serverī ar OLAP kubu. Šajos izdevumos ir iespējams izmantot t.s. “daļēji piedevas pasākumi”, t.i. papildu agregētās funkcijas(statistika), kas nav parastas summas (piemēram, galējās vai vidējās).

OLAP kuba dizains (OLAP kubisms)

Teiksim dažus vārdus par paša OLAP kuba dizainu. Statistikas valodā OLAP kubs ir darbības rādītāju kopums, kas aprēķināts visās nepieciešamajās sadaļās, piemēram, sūtījuma rādītājs sadaļās pa klientiem, pēc precēm, pēc datumiem utt. Sakarā ar tiešo tulkojumu no angļu valodas krievu literatūrā par OLAP kubiem indikatorus sauc par "pasākumiem", bet sadaļas - par "dimensiju". Šis ir matemātiski pareizs, bet sintaktiski un semantiski ne pārāk veiksmīgs tulkojums. Krievu vārdiem “measure”, “dimension”, “dimension” ir gandrīz vienāda nozīme un pareizrakstība, savukārt angļu “mērs” un “dimension” atšķiras gan pareizrakstības, gan nozīmes ziņā. Tāpēc mēs dodam priekšroku tradicionālajiem krievu statistikas terminiem “indikators” un “griezums”, kas pēc nozīmes ir līdzīgi.

Ir vairākas iespējas OLAP kuba programmatūras ieviešanai saistībā ar OLTP sistēmu, kurā tiek ierakstīti dati. Mēs apsvērsim tikai vienu shēmu, visvienkāršāko, uzticamāko un ātrāko.

Šajā dizainā OLAP un OLTP netiek koplietotas tabulas, un OLAP analītika tiek aprēķināta pēc iespējas detalizētāk kuba atjaunināšanas (procesa) posmā, kas ir pirms lietošanas stadijas. Šo shēmu sauc par MOLAP (daudzdimensiju OLAP). Tās trūkumi ir asinhronitāte ar ERP un augstās atmiņas izmaksas.

Lai gan formāli OLAP kubu var izveidot, izmantojot visas (tūkstošiem) ERP sistēmas relāciju datu bāzes tabulu kā datu avotu un visus (simtiem) to laukus kā rādītājus vai sadaļas, patiesībā to nevajadzētu darīt. Pretēji. Lai ielādētu kubā, pareizāk ir sagatavot atsevišķu datu bāzi, ko sauc par “vitrīnu” vai “noliktavu”.

Vairāki iemesli liek mums to darīt.

  • Pirmkārt, OLAP kuba saistīšana ar tabulām reālā datubāzē noteikti radīs tehniskas problēmas. Datu maiņa tabulā var izraisīt kuba atsvaidzināšanu, un kuba atsvaidzināšana ne vienmēr ir ātrs process, tāpēc kubs būs nepārtrauktas atjaunošanas stāvoklī; Tajā pašā laikā kuba atjaunināšanas procedūra var bloķēt (nolasot) datu bāzes tabulu datus, palēninot lietotāju darbu datu reģistrēšanā ERP sistēmā.
  • Otrkārt, Pārāk daudz indikatoru un izcirtņu krasi palielinās kuba uzglabāšanas laukumu serverī. Neaizmirsīsim, ka OLAP kubs glabā ne tikai avota datus, kā tas ir OLTP sistēmā, bet arī visus rādītājus, kas apkopoti pa visām iespējamām sadaļām (un pat visām visu sadaļu kombinācijām). Turklāt attiecīgi palēnināsies kuba atjaunināšanas ātrums un, visbeidzot, analītikas un uz tiem balstīto lietotāju pārskatu izveides un atjaunināšanas ātrums.
  • Trešais, pārāk daudz lauku (rādītāju un sadaļu) radīs problēmas OLAP izstrādātāja saskarnē, jo elementu saraksti kļūs milzīgi.
  • Ceturtkārt, OLAP kubs ir ļoti jutīgs pret datu integritātes pārkāpumiem. Kubu nevar izveidot, ja atslēgas dati neatrodas kuba lauka savienojumu struktūrā norādītajā saitē. Īslaicīgi vai pastāvīgi integritātes pārkāpumi, tukši lauki ir izplatīti ERP sistēmas datu bāzē, taču tas absolūti nav piemērots OLAP.

Varat arī pievienot, ka ERP sistēmai un OLAP kubam jāatrodas dažādos serveros, lai koplietotu slodzi. Bet tad, ja ir kopīgas OLAP un OLTP tabulas, rodas arī tīkla trafika problēma. Praktiski neatrisināmas problēmas rodas šajā gadījumā, kad ir nepieciešams apvienot vairākas atšķirīgas ERP sistēmas (1C7, 1C8, MS Dynamics AX) vienā OLAP kubā.

Iespējams, varam turpināt krāmēt tehniskas problēmas. Bet pats galvenais, atcerieties, ka atšķirībā no OLTP, OLAP nav datu ierakstīšanas un uzglabāšanas līdzeklis, bet gan analīzes rīks. Tas nozīmē, ka nav nepieciešams augšupielādēt un lejupielādēt "netīros" datus no ERP uz OLAP "katram gadījumam". Gluži pretēji, vispirms ir jāizstrādā uzņēmuma vadības koncepcija vismaz KPI sistēmas līmenī un pēc tam jāizstrādā lietojumprogrammu datu noliktava (noliktava), kas atrodas tajā pašā serverī, kur atrodas OLAP kubs un satur nelielu , rafinēts datu apjoms no ERP , kas nepieciešams pārvaldībai .

Neveicinot sliktos ieradumus, OLAP kubu saistībā ar OLTP var pielīdzināt labi zināmajam “joprojām”, ar kura palīdzību no reālās reģistrācijas “fermentētās masas” tiek iegūts “tīrs produkts”.

Tātad, mēs sapratām, ka OLAP datu avots ir īpaša datu bāze (noliktava), kas atrodas tajā pašā serverī, kur OLAP. Parasti tas nozīmē divas lietas. Pirmkārt, ir jābūt īpašām procedūrām, kas no ERP datu bāzēm izveidos noliktavu. Otrkārt, OLAP kubs ir asinhrons ar tā ERP sistēmām.

Ņemot vērā iepriekš minēto, mēs piedāvājam šādu skaitļošanas procesa arhitektūras versiju.

Risinājuma arhitektūra

Pieņemsim, ka uz dažādiem serveriem atrodas daudzas noteiktas korporācijas (holdinga) ERP sistēmas, kuru analītiskos datus mēs vēlētos redzēt apvienotus vienā OLAP kubā. Uzsveram, ka aprakstītajā tehnoloģijā mēs apvienojam datus no ERP sistēmām noliktavas līmenī, atstājot OLAP kuba dizainu nemainīgu.

OLAP serverī mēs izveidojam visu šo ERP sistēmu datu bāzu attēlus (tukšas kopijas). Mēs periodiski (katru nakti) veicam attiecīgo aktīvo ERP datu bāzu daļēju replikāciju uz šīm tukšajām kopijām.

Tālāk tiek palaists SP (glabāta procedūra), kas tajā pašā OLAP serverī bez tīkla trafika, pamatojoties uz ERP sistēmas datu bāzu daļējām replikām, izveido (vai papildina) noliktavu (noliktavu) - OLAP kuba datu avotu.

Pēc tam tiek uzsākta standarta procedūra kuba atjaunināšanai/veidošanai, pamatojoties uz noliktavas datiem (Procesa darbība SSAS saskarnē).

Komentēsim dažus tehnoloģijas aspektus. Kādu darbu veic SP?

Daļējas replikācijas rezultātā pašreizējie dati parādās kādas ERP sistēmas attēlā OLAP serverī. Starp citu, daļēju replikāciju var veikt divos veidos.

Pirmkārt, no visām tabulām ERP sistēmas datubāzē daļējas replikācijas laikā tiek kopētas tikai tās, kas nepieciešamas noliktavas uzbūvēšanai. To kontrolē fiksēts tabulu nosaukumu saraksts.

Otrkārt, daļēja replikācija var nozīmēt arī to, ka netiek kopēti visi tabulas lauki, bet tikai tie, kas ir iesaistīti noliktavas veidošanā. Kopējamo lauku saraksts ir norādīts vai dinamiski izveidots SP kopijas attēlā (ja tabulas kopijā sākotnēji nav visi lauki).

Protams, ir iespējams nepārkopēt veselas tabulas rindas, bet tikai pievienot jaunus ierakstus. Tomēr tas rada nopietnas neērtības, uzskaitot ERP pārskatīšanu "ar atpakaļejošu spēku", kas bieži notiek reālās dzīves sistēmās. Tāpēc ir vieglāk bez papildu piepūles kopēt visus ierakstus (vai atjaunināt “aste”, sākot no noteikta datuma).

Tālāk SP galvenais uzdevums ir ERP sistēmas datu konvertēšana noliktavas formātā. Ja ir tikai viena ERP sistēma, konvertēšanas uzdevums galvenokārt ir nepieciešamo datu kopēšana un, iespējams, pārformatēšana. Bet, ja ir nepieciešams apvienot vairākas dažādu struktūru ERP sistēmas vienā OLAP kubā, tad transformācijas kļūst sarežģītākas.

Vairāku dažādu ERP sistēmu apvienošana kubā ir īpaši grūts uzdevums, ja to objektu kopas (preču katalogi, darbuzņēmēji, noliktavas u.c.) daļēji pārklājas, objektiem ir vienāda nozīme, bet tie, protams, katalogos tiek aprakstīti atšķirīgi. dažādām sistēmām (kodu, identifikatoru, nosaukumu utt. nozīmē).

Reāli šāda aina rodas lielā holdingā, kad vairāki tajā ietilpstošie viena veida autonomie uzņēmumi veic aptuveni vienāda veida darbības aptuveni vienā un tajā pašā teritorijā, bet izmanto savas un nesaskaņotās reģistrācijas sistēmas. Šajā gadījumā, konsolidējot datus noliktavas līmenī, nevar iztikt bez papildu kartēšanas tabulām.

Pievērsīsim uzmanību noliktavas uzglabāšanas arhitektūrai. Parasti OLAP kuba shēma tiek attēlota “zvaigznes” formā, t.i. kā datu tabula, ko ieskauj direktoriju "stari" - sekundāro atslēgu vērtību tabulas. Tabula ir “rādītāju” bloks; atsauces grāmatas ir to sadaļas. Šajā gadījumā direktorijs, savukārt, var būt patvaļīgs nelīdzsvarots koks vai līdzsvarota hierarhija, piemēram, preču vai darbuzņēmēju daudzlīmeņu klasifikācija. OLAP kubā noliktavas datu tabulas ciparu lauki automātiski kļūst par “rādītājiem” (vai mēriem), un sadaļas (vai dimensijas) var definēt, izmantojot sekundāro atslēgu tabulas.

Šis ir vizuāls “pedagoģisks” apraksts. Faktiski OLAP kuba arhitektūra var būt daudz sarežģītāka.

Pirmkārt, noliktava var sastāvēt no vairākām “zvaigznēm”, kas, iespējams, ir savienotas caur kopīgiem direktorijiem. Šajā gadījumā OLAP kubs būs vairāku kubu (vairāku datu bloku) savienība.

Otrkārt, zvaigznītes “stars” var būt ne tikai viens direktorijs, bet visa (hierarhiska) failu sistēma.

Treškārt, pamatojoties uz esošajām dimensiju sadaļām, jaunas hierarhiskas sadaļas var definēt, izmantojot OLAP izstrādātāja saskarnes rīkus (teiksim, ar mazāk līmeņu, ar atšķirīgu līmeņu secību utt.)

Ceturtkārt, pamatojoties uz esošajiem indikatoriem un sadaļām, izmantojot MDX valodas izteiksmes, var definēt jaunus rādītājus (aprēķinus). Ir svarīgi atzīmēt, ka jauni kubi, jauni indikatori, jaunas sadaļas tiek automātiski pilnībā integrētas ar sākotnējiem elementiem. Jāņem vērā arī tas, ka slikti formulēti aprēķini un hierarhiskas sadaļas var būtiski palēnināt OLAP kuba darbību.

MS Excel kā saskarne ar OLAP

Īpašu interesi rada lietotāja saskarne ar OLAP kubiem. Protams, vispilnīgāko saskarni nodrošina pati SSAS utilīta. Tas ietver OLAP kuba izstrādātāja rīkkopu, interaktīvu pārskatu noformētāju un logu interaktīvs darbs ar OLAP kubu, izmantojot MDX vaicājumus.

Papildus pašam SSAS ir daudzas programmas, kas nodrošina saskarni ar OLAP, lielākā vai mazākā mērā aptverot to funkcionalitāti. Bet starp tiem ir viens, kam, mūsuprāt, ir nenoliedzamas priekšrocības. Šī ir MS Excel.

Saskarni ar MS Excel nodrošina īpašs draiveris, kas ir lejupielādējams atsevišķi vai iekļauts Excel izplatīšanā. Tas neaptver visu OLAP funkcionalitāti, taču, pieaugot MS Excel versiju numuriem, šis pārklājums kļūst arvien plašāks (piemēram, MS Excel 2007 parādās KPI grafiskais attēlojums, kas nebija MS Excel 2003 utt.). ).

Protams, papildus diezgan pilnīgai funkcionalitātei MS Excel galvenā priekšrocība ir šīs programmas plašā izplatība un lielais biroja lietotāju skaits. Šajā ziņā, atšķirībā no citām interfeisa programmām, uzņēmumam nekas papildus nav jāiegādājas un neviens papildus nav jāapmāca.

MS Excel kā saskarnes ar OLAP lielā priekšrocība ir iespēja tālāk patstāvīgi apstrādāt OLAP atskaitē iegūtos datus (t.i., turpināt pētīt no OLAP iegūtos datus uz citām tās pašas Excel lapām, vairs neizmantojot OLAP rīkus, bet izmantojot parastos Excel rīkus).

Facubi nakts procedūru cikls

Tagad mēs aprakstīsim OLAP darbības ikdienas (iknakts) skaitļošanas ciklu. Aprēķins tiek veikts facubi programmas kontrolē, kas rakstīta C# 2005 un tiek palaista, izmantojot Task Scheduler serverī ar noliktavu un SSAS. Sākumā facubi dodas uz internetu un nolasa pašreizējos valūtas kursus (tiek izmantots, lai attēlotu vairākus rādītājus valūtā). Pēc tam veiciet tālāk norādītās darbības.

Pirmkārt, facubi palaiž SP, kas veic dažādu lokālajā tīklā pieejamo ERP sistēmu (turēšanas elementu) datu bāzu daļēju replikāciju. Replikācija tiek veikta, kā jau teicām, uz iepriekš sagatavotiem “foniem” - attālo ERP sistēmu attēliem, kas atrodas SSAS serverī.

Otrkārt, izmantojot SP, tiek veikta kartēšana no ERP replikām uz noliktavas krātuvi - īpašu DB, kas ir OLAP kuba datu avots un atrodas SSAS serverī. Šajā gadījumā tiek atrisināti trīs galvenie uzdevumi:

  • ERP dati pielāgoti nepieciešamajiem kubu formātiem; mēs runājam par gan par tabulām, gan tabulu laukiem. (Dažreiz vajadzīgā tabula ir “jāpārveido”, teiksim, no vairākām MS Excel lapām.) Līdzīgiem datiem dažādās ERP var būt dažādi formāti, piemēram, atslēgas ID laukos 1C7 direktorijās ir 36 ciparu rakstzīmju kods ar garumu 8. , un _idrref lauki katalogos 1С8 – heksadecimālie skaitļi ar garumu 32;
  • apstrādes laikā tiek veikta loģiskā datu kontrole (ieskaitot “noklusējumu” rakstīšanu trūkstošo datu vietā, kur iespējams) un integritātes kontrole, t.i. primāro un sekundāro atslēgu klātbūtnes pārbaude attiecīgajos klasifikatoros;
  • koda konsolidācija objekti, kuriem ir viena un tā pati nozīme dažādās ERP. Piemēram, dažādu ERP direktoriju atbilstošajiem elementiem var būt vienāda nozīme, piemēram, tie ir viens un tas pats darījuma partneris. Kodu konsolidācijas problēma tiek atrisināta, konstruējot kartēšanas tabulas, kur dažādi kodi tie paši objekti tiek savesti vienotībā.

Treškārt, tiek palaists facubi standarta procedūra procesa kuba datu atjaunināšana (no SSAS utilīta procedūrām).

Pamatojoties uz kontrolsarakstiem, facubi nosūta e-pasta ziņojumus par apstrādes darbību gaitu.

Pēc facubi izpildes Task Scheduler pēc kārtas palaiž vairākus Excel failus, kuros atskaites tiek iepriekš izveidotas, pamatojoties uz OLAP kuba indikatoriem. Kā jau teicām, MS Excel ir īpašs programmatūras interfeiss(atsevišķi lejupielādējams vai iebūvēts draiveris) darbam ar OLAP kubiem (ar SSAS). Uzsākot MS Excel, tiek aktivizētas MS VBA programmas (piemēram, makro), kas nodrošina datu atjaunināšanu atskaitēs; atskaites vajadzības gadījumā tiek modificētas un nosūtītas pa pastu (blat programma) lietotājiem pēc kontrolsarakstiem.

Vietējā tīkla lietotāji ar piekļuvi SSAS serverim saņems “tiešraides” atskaites, kas konfigurētas OLAP kubam. (Principā viņi paši bez pasta var atjaunināt OLAP atskaites programmā MS Excel, kas atrodas viņu rīcībā vietējie datori.) Lietotāji ārpus lokālā tīkla vai nu saņems oriģinālās atskaites, bet ar ierobežotu funkcionalitāti, vai arī viņiem (pēc OLAP atskaišu atjaunināšanas programmā MS Excel) tiks aprēķinātas īpašas “mirušās” atskaites, kas nepiekļūst SSAS serverim.

Rezultātu izvērtēšana

Iepriekš mēs runājām par OLTP un OLAP asinhroniju. Apskatāmajā tehnoloģijas variantā OLAP kuba atjaunināšanas cikls tiek veikts naktī (teiksim, tas sākas pulksten 1 naktī). Tas nozīmē, ka pašreizējā darba dienā lietotāji strādā ar vakardienas datiem. Tā kā OLAP nav ierakstīšanas rīks (skatieties uz jaunāko dokumenta versiju), bet gan pārvaldības rīks (saprotiet procesa tendenci), šāda nobīde parasti nav kritiska. Tomēr, ja nepieciešams, pat aprakstītajā kuba arhitektūras (MOLAP) versijā atjaunināšanu var veikt vairākas reizes dienā.

Atjaunināšanas procedūru izpildes laiks ir atkarīgs no OLAP kuba dizaina iezīmēm (lielāka vai mazāka sarežģītība, vairāk vai mazāk veiksmīgas indikatoru un sadaļu definīcijas) un ārējo OLTP sistēmu datu bāzu apjoma. Pēc pieredzes noliktavas būvniecības procedūra ilgst no vairākām minūtēm līdz divām stundām, kuba atjaunināšanas procedūra (Process) ilgst no 1 līdz 20 minūtēm. Mēs runājam par sarežģītiem OLAP kubiem, kas apvieno desmitiem zvaigžņu tipa struktūru, desmitiem kopīgu “staru” (atsauces sadaļu) un simtiem indikatoru. Aprēķinot ārējo ERP sistēmu datu bāzu apjomu, pamatojoties uz nosūtīšanas dokumentiem, mēs runājam par simtiem tūkstošu dokumentu un attiecīgi miljoniem produktu līniju gadā. Vēsturiskais apstrādes dziļums, kas interesēja lietotāju, bija trīs līdz pieci gadi.

Aprakstītā tehnoloģija tiek izmantota vairākos lielajām korporācijām: kopš 2008. gada Krievijas zivju uzņēmumā (RRK) un Krievijas jūras uzņēmumā (RM), no 2012. gada uzņēmumā Santa Bremor (SB). Dažas korporācijas galvenokārt ir tirdzniecības un iepirkuma firmas (PPC), citas ir ražošanas uzņēmumi (zivju un jūras velšu pārstrādes rūpnīcas Moldovas Republikā un Baltkrievijas Republikā). Visas korporācijas ir lielas saimniecības, kas apvieno vairākus uzņēmumus ar neatkarīgām un dažādām datorizētām grāmatvedības sistēmām - sākot no standarta ERP sistēmām, piemēram, 1C7 un 1C8, līdz "reliktām" grāmatvedības sistēmām, kuru pamatā ir DBF un Excel. Piebildīšu, ka aprakstītā tehnoloģija OLAP kubu darbināšanai (neņemot vērā izstrādes stadiju) vai nu vispār neprasa īpašus darbiniekus, vai arī par to atbild viens pilna laika biznesa analītiķis. Problēma virmo jau gadiem ilgi automātiskais režīms, nodrošinot dažādu kategoriju uzņēmumu darbiniekus ar aktuālām atskaitēm ikdienā.

Risinājuma plusi un mīnusi

Pieredze liecina, ka piedāvātais risinājums ir diezgan uzticams un viegli lietojams. Tas ir viegli modificējams (jaunu ERP pievienošana/atvienošana, jaunu indikatoru un sadaļu izveide, Excel atskaišu un to adresātu sarakstu izveide un modificēšana) ar nemainīgumu kontroles programma facubi.

MS Excel kā saskarne ar OLAP nodrošina pietiekamu izteiksmīgumu un ļauj dažādu kategoriju biroja darbiniekiem ātri iepazīties ar OLAP tehnoloģiju. Lietotājs katru dienu saņem “standarta” OLAP atskaites; izmantojot MS Excel saskarni ar OLAP, var patstāvīgi izveidot OLAP atskaites programmā MS Excel. Turklāt lietotājs var patstāvīgi turpināt pētīt OLAP atskaišu informāciju, izmantojot savas MS Excel ierastās iespējas.

“Rafinētā” noliktavas datu bāze, kurā ir apvienotas vairākas neviendabīgas ERP sistēmas (kuba veidošanas laikā), pat bez OLAP ļauj atrisināt (SSAS serverī, izmantojot vaicājuma metodi valodā Darījumi ar SQL vai SP metode utt.) daudzas pielietotās kontroles problēmas. Atgādināsim, ka noliktavas datu bāzes struktūra ir vienota un daudz vienkāršāka (tabulu skaita un tabulu lauku skaita ziņā) nekā sākotnējās ERP datu bāzes struktūras.

Īpaši atzīmējam, ka mūsu piedāvātajā risinājumā ir iespēja apvienot dažādas ERP sistēmas vienā OLAP kubā. Tas ļauj iegūt analīzi visai saimniecībai un saglabāt analītikas ilgtermiņa nepārtrauktību, kad korporācija pāriet uz citu grāmatvedības ERP sistēmu, piemēram, pārejot no 1C7 uz 1C8.

Mēs izmantojām MOLAP kuba modeli. Šī modeļa priekšrocības ir darbības uzticamība un liels lietotāju pieprasījumu apstrādes ātrums. Trūkumi: OLAP un OLTP ir asinhroni, kā arī liels atmiņas apjoms OLAP glabāšanai.

Nobeigumā šeit ir vēl viens arguments par labu OLAP, kas varētu būt bijis piemērotāks viduslaikos. Jo tās pierādījumu spēks balstās uz autoritāti. Pieticīgs, nepārprotami nenovērtēts britu matemātiķis E. Kods 60. gadu beigās izstrādāja relāciju datu bāzu teoriju. Šīs teorijas spēks bija tāds, ka tagad, pēc 50 gadiem, jau ir grūti atrast nerelāciju datubāzi un datu bāzes vaicājumu valodu, kas nav SQL.

OLTP tehnoloģija, kas balstīta uz relāciju datu bāzu teoriju, bija pirmā E. Koda ideja. Faktiski OLAP kubu koncepcija ir viņa otrā ideja, ko viņš izteica 90. gadu sākumā. Pat nebūdams matemātiķis, jūs varat sagaidīt, ka otrā ideja būs tikpat efektīva kā pirmā. Tas nozīmē, ka datoru analītikas ziņā OLAP idejas drīz pārņems pasauli un izstums visas pārējās. Vienkārši tāpēc, ka analītikas tēma savu visaptverošo matemātisko risinājumu atrod OLAP, un šis risinājums ir “adekvāts” (B. Spinozas termins) analītikas praktiskajai problēmai. “Adekvāti” Spinozā nozīmē, ka pats Dievs neko labāku nevarēja izdomāt...

  1. Larsons B. Biznesa analītikas izstrāde programmā Microsoft SQL Server 2005. – Sanktpēterburga: “Pēteris”, 2008. gads.
  2. Codd E. Datu bāzes apakšvalodu relāciju pilnība, datu bāzu sistēmas, Courant Computer Science Sumposia Series 1972, v. 6, Englvudas klintis, N.Y., Prentice – Hall.

Saskarsmē ar

Dati parasti ir reti un tiek glabāti ilgstoši. To var ieviest, pamatojoties uz universālu relāciju DBVS vai specializētu programmatūru (sk. arī OLAP). IN programmatūras produkti SAP uzņēmums lieto terminu “infokubs”.

Masīva indeksi atbilst kuba izmēriem (izmēriem) vai asīm, un masīva elementu vērtības atbilst kuba mēriem (mērījumiem).

w : (x,y,z) → w xyz,

Kur x, y, z- mērījumi, w- mērs.

Atšķirībā no parasta masīva programmēšanas valodā, piekļuvi OLAP kuba elementiem var nodrošināt vai nu ar pilnu indeksa dimensiju kopu, vai ar to apakškopu, un tad rezultāts būs nevis viens elements, bet gan daudzi no tiem.

W : (x,y) → W = ( w z1, w z2, …, w zn}

Zināms arī apraksts OLAP kubs izmantojot relāciju algebras terminoloģiju kā attiecību projekciju.

Skatīt arī


Wikimedia fonds. 2010. gads.

  • Zvaigžņu diagramma
  • Mūsu mājas ir Krievija (frakcija)

Skatiet, kas ir “OLAP kubs” citās vārdnīcās:

    OLAP kubs- ... Vikipēdija

    OLAP- (ang. tiešsaistes analītiskā apstrāde, analītiskā apstrāde reāllaikā) datu apstrādes tehnoloģija, kas sastāv no kopsavilkuma (apkopotas) informācijas sagatavošanas, pamatojoties uz lielu datu apjomu, strukturētu ... ... Wikipedia

    Kubs (noskaidrošana)- Kubs ir daudzvērtīgs termins: matemātikā Stereometrijā kubs ir sešstūra regulārs daudzskaldnis. Algebrā skaitļa trešais pakāpe. Zinātniskās fantastikas filmu sērija: “Kubs” “Kubs 2: Hiperkubs” “Kubs nulle” Slengs un žargons medicīnas... ... Wikipedia

    Kubs- Šim terminam ir citas nozīmes, skatiet Cube (nozīmes). Kuba tips Regulārs daudzskaldnis Sejas kvadrāts ... Wikipedia

    Mondriāns- OLAP servera tips OLAP servera izstrādātājs Pentaho operētājsistēma starpplatformu programmatūra Jaunākā versija 3.4.1 (2012 05 07) Licences bezmaksas programmatūra ... Wikipedia — Informācijas analīzes sistēma automatizēta sistēmaļaut ekspertiem ātri analizēt lielu datu apjomu, kā likums, ir viens no situācijas centru elementiem. Arī dažreiz IAS ietver savākšanas sistēmu... ... Wikipedia

Šī darba ietvaros tiks izskatīti šādi jautājumi:

  • Kas ir OLAP kubi?
  • Kas ir mēri, dimensijas, hierarhijas?
  • Kāda veida darbības var veikt ar OLAP kubiem?
OLAP kuba jēdziens

Galvenais OLAP postulāts ir datu prezentācijas daudzdimensionalitāte. OLAP terminoloģijā kuba jeb hiperkuba jēdzienu izmanto, lai aprakstītu daudzdimensiju diskrētu datu telpu.

Kubs ir daudzdimensionāla datu struktūra, no kuras lietotājs-analītiķis var pieprasīt informāciju. Kubi tiek veidoti no faktiem un izmēriem.

Dati- tie ir dati par objektiem un notikumiem uzņēmumā, kas tiks analizēti. Tāda paša veida fakti veido mērus. Mērs ir vērtības veids kuba šūnā.

Mērījumi- tie ir datu elementi, ar kuriem tiek analizēti fakti. Šādu elementu kolekcija veido dimensijas atribūtu (piemēram, nedēļas dienas var veidot laika dimensijas atribūtu). Komercuzņēmumu biznesa analīzes uzdevumos dimensijas bieži ietver tādas kategorijas kā "laiks", "pārdošana", "produkti", "klienti", "darbinieki", "ģeogrāfiskā atrašanās vieta". Mērījumi visbiežāk ir hierarhiskās struktūras, kas ir loģiskas kategorijas, ar kurām lietotājs var analizēt faktiskos datus. Katrai hierarhijai var būt viens vai vairāki līmeņi. Tādējādi dimensijas “ģeogrāfiskā atrašanās vieta” hierarhija var ietvert līmeņus: “valsts – reģions – pilsēta”. Laika hierarhijā mēs varam atšķirt, piemēram, šādu līmeņu secību: Dimensijai var būt vairākas hierarhijas (katrai vienas dimensijas hierarhijai jābūt vienam un tam pašam dimensiju tabulas atslēgas atribūtam).

Kubs var saturēt faktiskos datus no vienas vai vairākām faktu tabulām un visbiežāk satur vairākas dimensijas. Jebkuram konkrētam kubam parasti ir īpašs analīzes fokuss.

1. attēlā parādīts kuba piemērs, kas paredzēts, lai analizētu noteikta uzņēmuma naftas produktu pārdošanu pēc reģiona. Šim kubam ir trīs dimensijas (laiks, produkts un reģions) un viens mērs (pārdošanas apjoms, kas izteikts naudas izteiksmē). Mērījumu vērtības tiek saglabātas attiecīgajās kuba šūnās. Katru šūnu unikāli identificē katras dimensijas locekļu kopa, ko sauc par kopu. Piemēram, šūna, kas atrodas kuba apakšējā kreisajā stūrī (satur vērtību 98399 $), tiek norādīta ar korteži [2005. gada jūlijs, Tālie Austrumi, Dīzeļdegviela]. Šeit vērtība 98 399 USD parāda dīzeļdegvielas pārdošanas apjomu (naudas izteiksmē) Tālajos Austrumos 2005. gada jūlijā.

Ir arī vērts atzīmēt, ka dažas šūnas nesatur nekādas vērtības: šīs šūnas ir tukšas, jo faktu tabulā nav par tām datu.

Rīsi. 1. Kubs ar informāciju par naftas produktu pārdošanu dažādos reģionos

Šādu kubu izveides galvenais mērķis ir samazināt vaicājumu apstrādes laiku, kas no faktiskajiem datiem iegūst nepieciešamo informāciju. Lai veiktu šo uzdevumu, kubi parasti satur iepriekš aprēķinātas kopsummas, ko sauc agregācijas(apkopojumi). Tie. kubs aptver datu telpu, kas ir lielāka par reālo - tajā ir loģiski, aprēķināti punkti. Apkopošanas funkcijas ļauj aprēķināt punktu vērtības loģiskajā telpā, pamatojoties uz faktiskajām vērtībām. Vienkāršākās apkopošanas funkcijas ir SUM, MAX, MIN, COUNT. Tā, piemēram, izmantojot funkciju MAX, piemērā norādītajam kubam varat noteikt, kad dīzeļdegvielas pārdošanas maksimums bija Tālajos Austrumos utt.

Vēl viena specifiska daudzdimensiju kubu iezīme ir izcelsmes noteikšanas grūtības. Piemēram, kā iestatīt punktu 0 kategorijai Produkts vai Reģioni? Šīs problēmas risinājums ir ieviest īpašu atribūtu, kas apvieno visus dimensijas elementus. Šis atribūts (izveidots automātiski) satur tikai vienu elementu - All. Vienkāršām apkopošanas funkcijām, piemēram, summa, elements Visi ir līdzvērtīgs visu elementu vērtību summai konkrētās dimensijas faktiskajā telpā.

Svarīgs jēdziens daudzdimensiju datu modelī ir apakštelpa jeb apakškubs. Apakškubs ir kuba pilnas telpas daļa kādas daudzdimensiju figūras formā kuba iekšpusē. Tā kā kuba daudzdimensiju telpa ir diskrēta un ierobežota, arī apakškubs ir diskrēts un ierobežots.

Darbības ar OLAP kubiem

Ar OLAP kubu var veikt šādas darbības:

  • šķēle;
  • rotācija;
  • konsolidācija;
  • detalizēti.
Šķēle(2. attēls) ir īpašs apakškuba gadījums. Šī ir procedūra daudzdimensiju datu masīva apakškopas veidošanai, kas atbilst vienai vai vairāku dimensiju elementu vērtībai, kas nav iekļauti šajā apakškopā. Piemēram, lai noskaidrotu, kā naftas produktu pārdošana laika gaitā progresējusi tikai noteiktā reģionā, proti, Urālos, elementā “Ural” ir jāfiksē dimensija “Produkti” un no kubs.
  • Rīsi. 2. OLAP kuba šķēle

    Rotācija(3. attēls) - atskaitē vai parādītajā lapā uzrādīto mērījumu atrašanās vietas maiņas darbība. Piemēram, rotācijas darbība var ietvert tabulas rindu un kolonnu pārkārtošanu. Turklāt, pagriežot datu kubu, tiek pārvietotas ārpus tabulas esošās dimensijas ar izmēriem parādītajā lapā un otrādi.

    OLAP (tiešsaistes analītiskā apstrāde) ir elektroniskas analītisko datu apstrādes metode, kas atspoguļo datu sakārtošanu hierarhiskās kategorijās, izmantojot iepriekš aprēķinātas kopsummas. OLAP dati ir sakārtoti hierarhiski un tiek glabāti kubos, nevis tabulās. OLAP kubi ir daudzdimensiju datu kopa ar asīm, kas satur parametrus, un šūnām, kas satur no parametriem atkarīgus apkopotus datus. Kubi ir paredzēti liela datu apjoma sarežģītai daudzdimensionālai analīzei, jo tie nodrošina tikai kopsavilkuma rezultātus ziņošanai, nevis lielu skaitu atsevišķu ierakstu.

    OLAP jēdzienu 1993. gadā aprakstīja slavenais datubāzu pētnieks un relāciju datu modeļa autors E. F. Kods. Pašlaik OLAP atbalsts ir ieviests daudzās DBVS un citos rīkos.

    OLAP kubā ir divu veidu dati:

    · kopējās vērtības, vērtības, kuras vēlaties apkopot, attēlot aprēķinātie datu lauki;

    · aprakstoša informācija mērījumi vai izmēriem. Aprakstošā informācija parasti ir sakārtota detalizētības līmeņos. Piemēram: “Gads”, “Ceturksnis”, “Mēnesis” un “Diena” kategorijā “Laiks”. Lauku kārtošana detalizācijas līmeņos ļauj ziņošanas lietotājiem izvēlēties, kādu detalizācijas līmeni viņi vēlas skatīt, sākot ar augsta līmeņa kopsavilkuma datiem un pēc tam padziļinot līdz detalizētākam skatam un otrādi.

    Microsoft Query rīki ļauj arī izveidot OLAP kubus no vaicājuma, kas ielādē relāciju datu bāzes datus, piemēram, Microsoft Access, šajā gadījumā lineārā tabula tiek pārveidota par strukturālo hierarhiju (kubu).

    OLAP kuba izveides vednis ir iebūvēts Microsoft Query rīks. Lai izveidotu OLAP kubu, pamatojoties uz relāciju datu bāzi, pirms vedņa palaišanas ir jāveic šādas darbības.

    1. Nosakiet datu avotu (skat. 6.1. attēlu).

    2. Izmantojot Microsoft Query, izveidojiet vaicājumu, iekļaujot tikai tos laukus, kas būs vai nu datu lauki, vai OLAP kuba dimensiju lauki; ja lauks kubā tiek izmantots vairāk nekā vienu reizi, tad tas ir jāiekļauj vaicājumā reižu skaitu.

    3. Vaicājuma izveides vedņa pēdējā darbībā iestatiet slēdzi uz vienuma OLAP kuba izveide no no šī pieprasījuma (skat. 6.2. att.) vai pēc pieprasījuma izveidošanas, izmantojot izvēlni Vaicājums tieši Fails izvēlieties komandu Izveidojiet OLAP kubu, pēc kura tiks palaists OLAP kuba izveides vednis.

    OLAP kuba izveides vednis sastāv no trim darbībām.

    Pirmajā vedņa darbībā (sk. 6.6. att.) datu lauki– aprēķinātie lauki, kuriem jānosaka kopējās vērtības.



    Rīsi. 6.6. Datu lauku definēšana

    Vednis ievieto paredzamos aprēķinātos laukus (parasti ciparu laukus) saraksta augšdaļā, pārbauda tos un nosaka šo lauku iegūto funkciju, parasti - Summa. Atlasot datu laukus, vismaz viens lauks ir jāatlasa kā aprēķinātais lauks un vismaz viens lauks jāatstāj neatzīmēts, lai noteiktu dimensiju.

    Veidojot OLAP kubu, varat izmantot četras kopsavilkuma funkcijas − Summa, Numurs(vērtību skaits), Minimums, Maksimums ciparu laukiem un vienai funkcijai Numurs visām pārējām jomām. Ja vienam laukam vēlaties izmantot vairākas dažādas kopsavilkuma funkcijas, šis lauks ir jāiekļauj vaicājumā nepieciešamo reižu skaitu.

    Aprēķinātā lauka nosaukumu var mainīt kolonnā Datu lauka nosaukums.

    Otrajā vedņa darbībā tiek noteikti aprakstošie dati un to izmēri (sk. 6.7. att.). Lai atlasītu mērījumu lauku, tas ir jānorāda sarakstā Avota lauki velciet vajadzīgo izmēru lauku augstākais līmenis uz sarakstu Mērījumi uz apgabalu, kas atzīmēts kā Velciet laukus šeit, lai izveidotu izmērus. Lai izveidotu OLAP kubu, ir jādefinē vismaz viena dimensija. Tajā pašā vedņa darbībā, izmantojot konteksta izvēlne Varat mainīt dimensijas vai līmeņa lauka nosaukumu.

    Rīsi. 6.7. Dimensiju lauku definēšana

    Laukus, kuros ir izolēti vai diskrēti dati un kas nepieder kādai hierarhijai, var definēt kā viena līmeņa dimensijas. Tomēr kubs būs efektīvāks, ja daži lauki ir sakārtoti līmeņos. Lai izveidotu līmeni kā dimensijas daļu, velciet lauku no saraksta Avota lauki laukā, kas ir dimensija vai līmenis. Lauki, kas satur detalizētāku informāciju, jānovieto zemākos līmeņos. Piemēram, 6.7. attēlā lauks Amata nosaukums ir lauka līmenis Nodaļas nosaukums.

    Lai pārvietotu lauku uz zemāku vai augstāku līmeni, tas ir jāvelk uz zemāku vai augstāku lauku dimensijā. Lai parādītu vai paslēptu līmeņus, izmantojiet attiecīgi pogas vai.

    Ja kā augstākā līmeņa dimensiju izmantojat datuma vai laika laukus, OLAP kuba vednis automātiski izveido līmeņus šīm dimensijām. Pēc tam lietotājs var izvēlēties, kuri līmeņi jāparādās pārskatos. Piemēram, varat atlasīt nedēļas, ceturkšņus un gadus vai mēnešus (sk. 6.7. attēlu).

    Atcerieties, ka vednis automātiski izveido līmeņus datuma un laika laukiem tikai tad, kad veidojat augstākā līmeņa dimensiju; Pievienojot šos laukus kā dimensijas apakšlīmeņus, automātiskie līmeņi netiek izveidoti.

    Vedņa trešajā solī tiek noteikts vedņa izveidotā kuba tips, ar iespējamiem trim variantiem (sk. 6.8. att.).

    Rīsi. 6.8. Veidojamā kuba veida izvēle vedņa trešajā darbībā

    · Pirmās divas iespējas ietver kuba izveidi katru reizi, kad atverat atskaiti (ja kubs tiek skatīts programmā Excel, tad runa ir par rakurstabulu). Šajā gadījumā pieprasījuma fails un fails kubu definīcijas *.oqy, kurā ir instrukcijas kuba izveidošanai. *.oqy failu var atvērt Excel programma lai izveidotu atskaites, pamatojoties uz kubu, un, ja nepieciešams veikt izmaiņas kubā, varat atvērt vaicājumu, lai vēlreiz palaistu kuba izveides vedni.

    Pēc noklusējuma kuba definīcijas faili, kā arī vaicājumu faili tiek saglabāti lietotāja profila mapē, kas atrodas Application Data\Microsoft\Que-ries. Saglabājot *.oqy failu standarta mapē, cilnē tiek parādīts kuba definīcijas faila nosaukums OLAP kubi atverot jaunu vaicājumu programmā Microsoft Query vai atlasot komandu Izveidojiet pieprasījumu(izvēlne Dati, apakšizvēlne Ārējo datu importēšana) programmā Microsoft Excel.

    · Izvēloties trešo kuba tipa variantu Saglabā kuba failu, kurā ir visi kuba dati, tiek izgūti visi kuba dati un lietotāja norādītā vietā tiek izveidots kuba fails ar paplašinājumu * .kub, kurā šie dati tiek glabāti. Radīšana šo failu nenotiek uzreiz pēc pogas nospiešanas Gatavs; fails tiek izveidots, kad failā saglabājat kuba definīciju vai veidojat atskaiti, pamatojoties uz kubu.

    Kuba veida izvēli nosaka vairāki faktori: kubā ietverto datu apjoms; to atskaišu veids un sarežģītība, kuras tiks veidotas, pamatojoties uz kubu; sistēmas resursi (atmiņa un vieta diskā) utt.

    Atsevišķs *.cub kuba fails ir jāizveido šādos gadījumos:

    1) bieži mainītām interaktīvajām atskaitēm, ja diskā ir pietiekami daudz vietas;

    2) kad nepieciešams saglabāt kubu tīkla serverī, lai nodrošinātu piekļuvi tam citiem lietotājiem, veidojot atskaites. Kuba fails var nodrošināt konkrētus datus no avota datu bāzes, vienlaikus izlaižot sensitīvus vai sensitīvus datus, kuriem vēlaties neļaut citiem lietotājiem piekļūt.



  • 
    Tops