Excel හි olap කියුබ් යනු කුමක්ද? SSAS ව්‍යාපෘතියක් නිර්මාණය කිරීම. විශ්ලේෂණය යනු කුමක්ද සහ එය අවශ්ය වන්නේ ඇයි?

බරපතල ව්යවසායක තොරතුරු පද්ධති, රීතියක් ලෙස, දත්ත සංකීර්ණ විශ්ලේෂණය සඳහා නිර්මාණය කර ඇති යෙදුම්, ඒවායේ ගතිකත්වය, ප්රවණතා ආදිය අඩංගු වේ. ඒ අනුව ඉහළ කළමනාකාරිත්වය විශ්ලේෂණ ප්‍රතිඵලවල ප්‍රධාන පාරිභෝගිකයන් බවට පත්වේ. එවැනි විශ්ලේෂණයක් අවසානයේ දී තීරණ ගැනීම සඳහා සහාය වීමට අදහස් කෙරේ. තවද ඕනෑම කළමනාකරණ තීරණයක් ගැනීම සඳහා, අවශ්ය තොරතුරු, සාමාන්යයෙන් ප්රමාණාත්මකව තිබිය යුතුය. මෙය සිදු කිරීම සඳහා, මෙම දත්ත සියල්ලන්ගෙන් එකතු කිරීම අවශ්ය වේ තොරතුරු පද්ධතිව්යවසායන්, ඒවා පොදු ආකෘතියකට ගෙන ඒවා විශ්ලේෂණය කරන්න. මේ සඳහා දත්ත ගබඩා නිර්මාණය කර ඇත.

දත්ත ගබඩාවක් යනු කුමක්ද?

සාමාන්යයෙන් - විශ්ලේෂණාත්මක වටිනාකමක් ඇති සියලුම තොරතුරු රැස් කරන ස්ථානය. එවැනි ගබඩා සඳහා වන අවශ්යතා OLAP හි සම්භාව්ය නිර්වචනයට අනුරූප වන අතර පහත විස්තර කෙරේ.

සමහර විට ගබඩාවට තවත් ඉලක්කයක් ඇත - සියලුම ව්‍යවසාය දත්ත ඒකාබද්ධ කිරීම, සියලු තොරතුරු පද්ධති තුළ තොරතුරුවල අඛණ්ඩතාව සහ අදාළත්වය පවත්වා ගැනීම. එම. ගබඩාව විශ්ලේෂණාත්මක පමණක් නොව, සියලුම තොරතුරු පාහේ රැස් කරන අතර, එය වෙනත් පද්ධති වෙත නැවත නාමාවලි ආකාරයෙන් ලබා දිය හැක.

සාමාන්‍ය දත්ත ගබඩාවක් සාමාන්‍යයෙන් සාමාන්‍ය සම්බන්ධතා දත්ත ගබඩාවකට වඩා වෙනස් වේ. පළමුව, සාමාන්‍ය දත්ත සමුදායන් සැලසුම් කර ඇත්තේ පරිශීලකයින්ට එදිනෙදා වැඩ කිරීමට උපකාර වන අතර දත්ත ගබඩා සැලසුම් කර ඇත්තේ තීරණ ගැනීම සඳහා ය. උදාහරණයක් ලෙස, භාණ්ඩ විකිණීම සහ ඉන්වොයිසි නිකුත් කිරීම සිදු කරනු ලබන්නේ ගනුදෙනු සැකසීම සඳහා නිර්මාණය කර ඇති දත්ත සමුදායක් භාවිතයෙන් වන අතර, සැපයුම්කරුවන් සමඟ වැඩ සැලසුම් කිරීමට ඉඩ සලසන වසර කිහිපයක් පුරා විකුණුම් ගතිකතාවයන් විශ්ලේෂණය කිරීම දත්ත ගබඩාවක් භාවිතයෙන් සිදු කෙරේ.

දෙවනුව, සාම්ප්‍රදායික දත්ත සමුදායන් පරිශීලකයින් ක්‍රියා කරන විට නිරන්තර වෙනස්වීම් වලට යටත් වන අතර, දත්ත ගබඩාව සාපේක්ෂව ස්ථායී වේ: සාමාන්‍යයෙන් එහි දත්ත කාලසටහනකට අනුව යාවත්කාලීන වේ (උදාහරණයක් ලෙස, සතිපතා, දිනපතා හෝ පැයකට වරක්, අවශ්‍යතා අනුව). ඉතා මැනවින්, පොහොසත් කිරීමේ ක්‍රියාවලිය යනු දැනටමත් ගබඩාවේ ඇති පෙර තොරතුරු වෙනස් නොකර යම් කාලයක් තුළ නව දත්ත එකතු කිරීමයි.

තෙවනුව, නිත්‍ය දත්ත සමුදායන් බොහෝ විට ගබඩාවේ අවසන් වන දත්ත ප්‍රභවය වේ. ඊට අමතරව, ගබඩාව නැවත පිරවිය හැකිය බාහිර මූලාශ්ර, උදාහරණයක් ලෙස සංඛ්යාන වාර්තා.

ගබඩා පහසුකම් ගොඩනඟන්නේ කෙසේද?

ETL- මූලික සංකල්පය: අදියර තුනක්:
  • උපුටා ගැනීම - තේරුම් ගත හැකි ආකෘතියකින් බාහිර මූලාශ්රවලින් දත්ත උපුටා ගැනීම;
  • පරිවර්තනය - මූලාශ්‍ර දත්තවල ව්‍යුහය විශ්ලේෂණ පද්ධතියක් ගොඩනැගීමට පහසු ව්‍යුහයන් බවට පරිවර්තනය කිරීම;
අපි තවත් එක් අදියරක් එකතු කරමු - දත්ත පිරිසිදු කිරීම ( පිරිසිදු කිරීම) – සංඛ්‍යානමය හෝ විශේෂඥ ක්‍රම මත පදනම්ව අදාල නොවන හෝ වැරදි දත්ත නිවැරදි කිරීමේ ක්‍රියාවලිය. පසුව "20011 සඳහා විකුණුම්" වැනි වාර්තා උත්පාදනය නොකිරීමට.

අපි විශ්ලේෂණය වෙත ආපසු යමු.

විශ්ලේෂණය යනු කුමක්ද සහ එය අවශ්ය වන්නේ ඇයි?

විශ්ලේෂණය යනු තීරණ ගැනීමේ අරමුණින් දත්ත අධ්‍යයනය කිරීමයි. විශ්ලේෂණ පද්ධති තීරණ ආධාරක පද්ධති ලෙස හැඳින්වේ ( ඩීඑස්එස්).

මෙහිදී DSS සමඟ වැඩ කිරීම සහ සරල නියාමනය කළ සහ නියාමනය නොකළ වාර්තා අතර වෙනස පෙන්වා දීම වටී. DSS හි විශ්ලේෂණය සෑම විටම පාහේ අන්තර්ක්‍රියාකාරී සහ පුනරාවර්තන වේ. එම. විශ්ලේෂකයා දත්ත හාරා, විශ්ලේෂණාත්මක විමසුම් සකස් කිරීම සහ සකස් කිරීම සහ වාර්තා ලබා ගනී, එහි ව්‍යුහය කල්තියා නොදැන සිටිය හැකිය. අපි විමසුම් භාෂාව ගැන සාකච්ඡා කරන විට අපි මෙය වඩාත් විස්තරාත්මකව පහතින් යමු. MDX.

OLAP

තීරණ ආධාරක පද්ධති සාමාන්‍යයෙන් පරිශීලකයාට සංජානනය සහ විශ්ලේෂණය සඳහා පහසු ආකෘතියකින් මුල් කට්ටලයේ විවිධ සාම්පල සඳහා සමස්ත දත්ත ලබා දීමට හැකියාව ඇත (වගු, ප්‍රස්ථාර, ආදිය). මූලාශ්‍ර දත්ත ඛණ්ඩනය කිරීමේ සම්ප්‍රදායික ප්‍රවේශය, මූලාශ්‍ර දත්ත වලින් බහුමාන දත්ත කට්ටල එකක් හෝ කිහිපයක් (බොහෝ විට හයිපර්කියුබ් හෝ මෙටාකියුබ් ලෙස හැඳින්වේ), එහි අක්ෂවල ගුණාංග අඩංගු වන අතර සෛලවල එකතු කරන ලද ප්‍රමාණාත්මක දත්ත අඩංගු වේ. (එවැනි දත්ත සම්බන්ධතා වගු වලද ගබඩා කළ හැක, නමුත් මේ අවස්ථාවේ දී අපි කතා කරන්නේ දත්තවල තාර්කික සංවිධානය ගැන මිස ඒවායේ ගබඩාව භෞතිකව ක්‍රියාත්මක කිරීම ගැන නොවේ.) එක් එක් අක්ෂය ඔස්සේ, ගුණාංග ධුරාවලියේ ආකාරයෙන් සංවිධානය කළ හැකිය, ඔවුන්ගේ විස්තරයේ විවිධ මට්ටම් නියෝජනය කරයි. මෙම දත්ත ආකෘතියට ස්තූතියි, පරිශීලකයින්ට සංකීර්ණ විමසුම් සකස් කිරීමට, වාර්තා උත්පාදනය කිරීමට සහ දත්ත උප කුලක ලබා ගැනීමට හැකිය.

සංකීර්ණ බහුමාන දත්ත විශ්ලේෂණය සඳහා තාක්ෂණය OLAP (On-Line Analytical Processing) ලෙස හැඳින්වේ. OLAP යනු සාම්ප්‍රදායික දත්ත ගබඩාවේ ප්‍රධාන අංගයකි. OLAP සංකල්පය 1993 දී විස්තර කරන ලද්දේ කීර්තිමත් දත්ත සමුදා පර්යේෂකයෙකු සහ සම්බන්ධතා දත්ත ආකෘතියේ කර්තෘ වන Edgar Codd විසිනි. 1995 දී, Codd විසින් නියම කර ඇති අවශ්‍යතා මත පදනම්ව, බහුමාන විශ්ලේෂණය සඳහා වන යෙදුම් සඳහා පහත අවශ්‍යතා ඇතුළුව ඊනියා FASMI පරීක්ෂණය (බෙදාගත් බහුමාන තොරතුරුවල වේගවත් විශ්ලේෂණය) සකස් කරන ලදී:

  • අඩු සවිස්තරාත්මක විශ්ලේෂණයක පිරිවැයකින් වුවද, පරිශීලකයාට පිළිගත හැකි කාලයක (සාමාන්‍යයෙන් තත්පර 5 කට නොවැඩි) විශ්ලේෂණ ප්‍රතිඵල ලබා දීම;
  • ඕනෑම තාර්කික සහ සංඛ්‍යානමය විශ්ලේෂණ ලක්ෂණයක් සිදු කිරීමේ හැකියාව මෙම යෙදුම, සහ අවසාන පරිශීලකයාට ප්‍රවේශ විය හැකි පෝරමයකින් එය සුරැකීම;
  • සුදුසු අගුලු දැමීමේ යාන්ත්‍රණයන් සහ බලයලත් ප්‍රවේශ මාධ්‍යයන් සඳහා සහාය ඇතිව දත්ත වෙත බහු-පරිශීලක ප්‍රවේශය;
  • ඇතුළුව දත්තවල බහුමාන සංකල්පීය නිරූපණය සම්පූර්ණ සහයෝගයධූරාවලිය සහ බහු ධුරාවලිය සඳහා (මෙය OLAP හි ප්‍රධාන අවශ්‍යතාවයකි);
  • එහි පරිමාව සහ ගබඩා ස්ථානය නොසලකා ඕනෑම අවශ්‍ය තොරතුරු වෙත ප්‍රවේශ වීමේ හැකියාව.
OLAP ක්රියාකාරීත්වය ක්රියාත්මක කළ හැකි බව සටහන් කළ යුතුය විවිධ ක්රම, කාර්යාලීය යෙදුම්වල ඇති සරලම දත්ත විශ්ලේෂණ මෙවලම් වලින් ආරම්භ වන අතර සේවාදායක නිෂ්පාදන මත පදනම්ව බෙදා හරින ලද විශ්ලේෂණ පද්ධති වලින් අවසන් වේ. එම. OLAP යනු තාක්ෂණයක් නොවේ, නමුත් මතවාදය.

අපි විවිධ OLAP ක්‍රියාත්මක කිරීම් ගැන කතා කිරීමට පෙර, තාර්කික දෘෂ්ටි කෝණයකින් කියුබ් යනු කුමක්දැයි සමීපව බලමු.

බහුමාන සංකල්ප

OLAP මූලධර්ම නිදර්ශනය කිරීම සඳහා අපි Microsoft සමඟ ඇතුළත් කර ඇති Northwind දත්ත සමුදාය භාවිතා කරන්නෙමු. SQL සේවාදායකයසහ ආහාර තොග සැපයීමේ නියැලී සිටින සමාගමක වෙළඳ මෙහෙයුම් පිළිබඳ තොරතුරු ගබඩා කරන සාමාන්‍ය දත්ත ගබඩාවකි. එවැනි දත්තවලට සැපයුම්කරුවන්, සේවාදායකයින්, සපයන ලද භාණ්ඩ ලැයිස්තුවක් සහ ඒවායේ කාණ්ඩ, ඇණවුම් සහ ඇණවුම් කළ භාණ්ඩ පිළිබඳ දත්ත, සමාගම් සේවකයින්ගේ ලැයිස්තුවක් ඇතුළත් වේ.

කියුබ්

උදාහරණයක් ලෙස සමාගමේ ඇණවුම් අඩංගු Invoices1 වගුව ගනිමු. මෙම වගුවේ ඇති ක්ෂේත්ර පහත පරිදි වනු ඇත:
  • ඇණවුම් දිනය
  • රටක්
  • නගරය
  • පාරිභෝගිකයාගේ නම
  • බෙදාහැරීමේ සමාගම
  • නිෂ්පාදන නාමය
  • භාණ්ඩ ප්රමාණය
  • ඇණවුම් මිල
මෙම දසුනෙන් අපට ලබාගත හැකි සමස්ත දත්ත මොනවාද? සාමාන්‍යයෙන් මේවා මෙවැනි ප්‍රශ්නවලට පිළිතුරු වේ:
  • යම් රටකින් පාරිභෝගිකයන් විසින් කරන ලද ඇණවුම්වල මුළු වටිනාකම කොපමණද?
  • යම් රටක පාරිභෝගිකයන් විසින් කරන ලද සහ යම් සමාගමක් විසින් බෙදා හරින ලද ඇණවුම්වල මුළු වටිනාකම කොපමණද?
  • යම් රටක පාරිභෝගිකයන් විසින් දෙන ලද වර්ෂයකදී සහ යම් සමාගමක් විසින් බෙදා හරින ලද ඇණවුම්වල මුළු වටිනාකම කොපමණද?
සමූහගත කිරීම සමඟ ඉතා පැහැදිලි SQL විමසුම් භාවිතයෙන් මෙම සියලු දත්ත මෙම වගුවෙන් ලබා ගත හැක.

මෙම විමසුමේ ප්‍රතිඵලය සෑම විටම සංඛ්‍යා තීරුවක් සහ එය විස්තර කරන ගුණාංග ලැයිස්තුවක් වනු ඇත (උදාහරණයක් ලෙස, රට) - මෙය ඒකමාන දත්ත කට්ටලයක් හෝ ගණිතමය භාෂාවෙන් දෛශිකයකි.

සියලුම රටවලින් ඇණවුම්වල මුළු පිරිවැය සහ බෙදා හැරීමේ සමාගම් අතර බෙදා හැරීම පිළිබඳ තොරතුරු අපට ලබා ගැනීමට අවශ්‍ය යැයි සිතමු - අපට අංක වගුවක් (matrix) ලැබෙනු ඇත, එහිදී බෙදාහැරීමේ සමාගම් තීරු ශීර්ෂයන්, පේළියේ රටවල් ලැයිස්තුගත කරනු ඇත. ශීර්ෂයන්, සහ සෛල තුළ ඇණවුම් ප්‍රමාණයක් ඇත. මෙය ද්විමාන දත්ත අරාවකි. මෙම දත්ත කට්ටලය විවර්තන වගුවක් ලෙස හැඳින්වේ ( විවර්තන වගුව) හෝ crosstab.

අපට එකම දත්ත ලබා ගැනීමට අවශ්‍ය නම්, නමුත් වසර වන විට, තවත් වෙනසක් දිස්වනු ඇත, i.e. දත්ත කට්ටලය ත්‍රිමාන බවට පත්වනු ඇත (කොන්දේසි සහිත 3 වන අනුපිළිවෙල ටෙන්සරයක් හෝ 3-මාන "කියුබ්").

නිසැකවම, උපරිම මානයන් යනු අපගේ එකතු කළ දත්ත (ඇණවුම් ප්‍රමාණය, නිෂ්පාදන ගණන, ආදිය) විස්තර කරන සියලුම ගුණාංග (දිනය, රට, පාරිභෝගිකයා, ආදිය) ගණනයි.

බහුමානත්වය සහ එහි ප්‍රතිමූර්තිය යන සංකල්පයට අප පැමිණෙන්නේ මෙසේය. බහුමාන ඝනකයක්. අපි එවැනි මේසයක් අමතන්නෙමු " කරුණු වගුව" මානයන් හෝ කියුබ් අක්ෂ ( මාන) යනු කරුණු වගුවේ ඇති මෙම ගුණාංගවල තනි අගයන් මගින් ඛණ්ඩාංක ප්‍රකාශ කරන ගුණාංග වේ. එම. උදාහරණයක් ලෙස, 2003 සිට 2010 දක්වා පද්ධතියේ ඇණවුම් පිළිබඳ තොරතුරු පවත්වා ගෙන ගියේ නම්, මෙම වසරේ අක්ෂය අනුරූප ලක්ෂ්‍ය 8 කින් සමන්විත වේ. රටවල් තුනකින් ඇණවුම් පැමිණෙන්නේ නම්, රටේ අක්ෂයේ ලකුණු 3 ක් අඩංගු වේ. රට නාමාවලියට රටවල් කීයක් ඇතුළත් වුවත්. අක්ෂයක ඇති ලක්ෂ්‍ය එහි “සාමාජිකයින්” ලෙස හැඳින්වේ. සාමාජිකයින්).

මෙම අවස්ථාවේදී, එකතු කරන ලද දත්ත "මිනුම්" ලෙස හැඳින්වේ ( මනින්න) "මානයන්" සමඟ ව්‍යාකූල වීම වළක්වා ගැනීම සඳහා, දෙවැන්න වඩාත් සුදුසු වන්නේ "අක්ෂ" ලෙසිනි. මිනුම් කට්ටලය තවත් "මිනුම්" අක්ෂයක් සාදයි ( මිනුම්) කරුණු වගුවේ ඇති මිනුම් (සමූහගත තීරු) තරම් සාමාජිකයින් (ලකුණු) එහි ඇත.

මානයන් හෝ අක්ෂවල සාමාජිකයින් ධූරාවලියක් හෝ වැඩි ගණනකින් ඒකාබද්ධ කළ හැක ( ධුරාවලිය) ධූරාවලිය යනු කුමක්දැයි අපි උදාහරණයක් සමඟ පැහැදිලි කරමු: ඇණවුම් වලින් නගර දිස්ත්‍රික්කවලට, දිස්ත්‍රික්ක කලාපවලට, රටක කලාපවලට, රටවල් මහාද්වීපවලට හෝ වෙනත් ආයතනවලට ඒකාබද්ධ කළ හැකිය. එම. ධූරාවලි ව්‍යුහයක් ඇත - මහාද්වීපය- රට-කලාපය-දිස්ත්‍රික්-නගරය- මට්ටම් 5 ( මට්ටමින්) කලාපයක් සඳහා, එයට ඇතුළත් කර ඇති සියලුම නගර සඳහා දත්ත එකතු කරනු ලැබේ. සියලුම නගර ආදිය අඩංගු සියලුම දිස්ත්‍රික්ක හරහා කලාපයක් සඳහා. අපට බහු ධූරාවලියක් අවශ්‍ය වන්නේ ඇයි? උදාහරණයක් ලෙස, ඇණවුම් දින අක්ෂයේ අපට ලකුණු (එනම් දින) ධුරාවලියකට සමූහ කිරීමට අවශ්‍ය විය හැක. වසර-මාස-දිනයහෝ විසින් වසර-සතියේ-දිනය: අවස්ථා දෙකේදීම මට්ටම් තුනක් ඇත. පැහැදිලිවම, සතිය සහ මාසය දින වෙනස් ලෙස කාණ්ඩගත කරන්න. ධූරාවලිය ද ඇත, මට්ටම් ගණන නිර්ණය නොවන අතර දත්ත මත රඳා පවතී. උදාහරණයක් ලෙස, පරිගණක තැටියක ඇති ෆෝල්ඩර.

සම්මත ශ්‍රිත කිහිපයක් භාවිතයෙන් දත්ත එකතු කිරීම සිදුවිය හැක: එකතුව, අවම, උපරිම, සාමාන්‍යය, ගණන් කිරීම.

MDX

අපි බහුමාන දත්තවල විමසුම් භාෂාව වෙත යමු.
SQL භාෂාව මුලින් නිර්මාණය කර ඇත්තේ ක්‍රමලේඛකයින් සඳහා නොව, විශ්ලේෂකයින් සඳහා ය (එබැවින් ස්වාභාවික භාෂාවට සමාන වාක්‍ය ඛණ්ඩයක් ඇත). නමුත් කාලයත් සමඟ එය වඩ වඩාත් සංකීර්ණ වූ අතර දැන් විශ්ලේෂකයින් ස්වල්ප දෙනෙක් එය හොඳින් භාවිතා කරන්නේ කෙසේදැයි දනිති. එය ක්‍රමලේඛකයින් සඳහා මෙවලමක් බවට පත්ව ඇත. මයික්‍රොසොෆ්ට් හි වල් තුළ අපගේ හිටපු රටවැසියා වන මෝෂා (හෝ මෝෂා) පොසුමන්ස්කි විසින් සංවර්ධනය කරන ලද බවට කටකතා පැතිරෙන MDX විමසුම් භාෂාව ද මුලින් විශ්ලේෂකයින් ඉලක්ක කර ගැනීමට අදහස් කළ නමුත් එහි සංකල්ප සහ වාක්‍ය ඛණ්ඩය (එය නොපැහැදිලි ලෙස SQL සිහිපත් කරයි, සහ සම්පූර්ණයෙන්ම නිෂ්ඵලයි, එනම් එය ව්‍යාකූල වන නිසා), SQL වලට වඩා සංකීර්ණයි. කෙසේ වෙතත්, එහි මූලික කරුණු තවමත් තේරුම් ගැනීමට පහසුය.

සාමාන්‍ය XMLA ප්‍රොටෝකෝල ප්‍රමිතියේ රාමුව තුළ සම්මත තත්ත්වය ලබා ඇති එකම භාෂාව එය වන නිසාත්, දෙවනුව එය සමාගමෙන් මොන්ඩ්‍රියන් ව්‍යාපෘතියේ ස්වරූපයෙන් විවෘත මූලාශ්‍ර ක්‍රියාත්මක කිරීමක් ඇති නිසාත් අපි එය සවිස්තරාත්මකව බලමු. පෙන්ටහෝ. අනෙකුත් OLAP විශ්ලේෂණ පද්ධති (උදාහරණයක් ලෙස, Oracle OLAP විකල්පය) සාමාන්‍යයෙන් SQL වාක්‍ය ඛණ්ඩයේ තමන්ගේම දිගු භාවිතා කරයි, කෙසේ වෙතත්, ඔවුන් MDX සඳහා සහය ප්‍රකාශ කරයි.

විශ්ලේෂණාත්මක දත්ත කට්ටල සමඟ වැඩ කිරීම යනු ඒවා කියවීම පමණක් වන අතර ඒවා ලිවීමෙන් අදහස් නොවේ. එම. MDX දත්ත වෙනස් කිරීම සඳහා වගන්ති නොමැත, නමුත් එක් තේරීම් වගන්තියක් පමණි - තෝරන්න.

OLAP හි ඔබට බහුමාන කැට සෑදිය හැකිය පෙති- i.e. දත්ත අක්ෂ එකක් හෝ කිහිපයක් ඔස්සේ පෙරන විට, හෝ ප්රක්ෂේපණ- ඝනකයක් අක්ෂ එකක් හෝ කිහිපයක් ඔස්සේ "කඩා වැටෙන" විට, දත්ත එකතු කිරීම. උදාහරණයක් ලෙස, රටවලින් ලැබෙන ඇණවුම් ප්‍රමාණය සමඟ අපගේ පළමු උදාහරණය වන්නේ රටේ අක්ෂය මත ඝනකයේ ප්‍රක්ෂේපණයයි. මෙම නඩුව සඳහා MDX විමසුම මේ ආකාරයෙන් පෙනෙනු ඇත:

තෝරන්න ... සිට පේළි මත ළමුන්
මොකක්ද මෙතන තියෙන්නේ?

තෝරන්න- ප්‍රධාන වචනය වාක්‍ය ඛණ්ඩයට ඇතුළත් කර ඇත්තේ අලංකාරය සඳහා පමණි.
යනු අක්ෂයේ නමයි. MDX හි ඇති සියලුම නියම නම් හතරැස් වරහන් වලින් ලියා ඇත.
ධුරාවලියේ නම වේ. අපගේ නඩුවේදී, මෙය රට-නගර ධුරාවලියයි
- මෙය ධූරාවලියේ පළමු මට්ටමේ (එනම් රට) අක්ෂ සාමාජිකයාගේ නමයි - මෙය අක්ෂයේ සියලුම සාමාජිකයින් ඒකාබද්ධ කරන මෙටා සාමාජිකයෙකි. එක් එක් අක්ෂය තුළ එවැනි මෙටා-කාලීන පවතී. උදාහරණයක් ලෙස, වසර අක්ෂයේ "සියලු වසර" යනාදිය ඇත.
දරුවන්සාමාජික කාර්යයකි. සෑම සාමාජිකයෙකුටම කාර්යයන් කිහිපයක් තිබේ. දෙමාපියන් වැනි. මට්ටම, ධුරාවලිය, පිළිවෙලින් මුතුන් මිත්තන් ආපසු ලබා දීම, ධුරාවලියේ මට්ටම සහ මෙම නඩුවේ සාමාජිකයා අයත් වන ධුරාවලියම. ළමයින් - මෙම සාමාජිකයාගේ ළමා සාමාජිකයින් කට්ටලයක් ආපසු ලබා දෙයි. එම. අපේ නඩුවේ - රටවල්.
පේළි මත- ලැබෙන වගුවේ මෙම දත්ත සකසන්නේ කෙසේද යන්න සඳහන් කරයි. මෙම අවස්ථාවේදී - රේඛාවල ශීර්ෂයේ. මෙහි ඇති විය හැකි අගයන්: තීරු මත, පිටු මත, ඡේද මත, ආදිය. 0 සිට ආරම්භ වන දර්ශකය මගින් සරලව දැක්වීමට ද හැකිය.
සිට- මෙය තේරීම සිදු කරන ලද ඝනකයේ ඇඟවීමකි.

අපට සියලු රටවල් අවශ්‍ය නැතිනම්, විශේෂිත රටවල් කිහිපයක් පමණක් අවශ්‍ය නම් කුමක් කළ යුතුද? මෙය සිදු කිරීම සඳහා, ළමා ශ්‍රිතය භාවිතයෙන් සියල්ල තෝරාගැනීමට වඩා අපට අවශ්‍ය රටවල් ඉල්ලීමෙහි පැහැදිලිව සඳහන් කළ හැක.

සිට පේළි මත ( ..., ... ) තෝරන්න
මෙම නඩුවේ curly braces යනු කට්ටලයේ ප්රකාශයයි ( සකසන්න) කට්ටලයක් යනු ලැයිස්තුවක්, සාමාජිකයින්ගේ ගණනය කිරීමකි එක් අක්ෂයකින්.

දැන් අපි අපගේ දෙවන උදාහරණය සඳහා විමසුමක් ලියන්නෙමු - බෙදාහැරීමේ පුද්ගලයාගේ සන්දර්භය තුළ ප්‍රතිදානය:

තෝරන්න ... පේළි මත ළමුන් . සිට තීරු මත සාමාජිකයින්
මෙහි එකතු කර ඇත:
- අක්ෂය;
.සාමාජිකයින්- එය මත සියලු නියමයන් ආපසු ලබා දෙන අක්ෂ ශ්රිතයක්. ධූරාවලිය සහ මට්ටම එකම කාර්යයක් ඇත. නිසා මෙම අක්ෂයේ ඇත්තේ එක් ධුරාවලියක් පමණි, එවිට එහි ඇඟවීම මඟ හැරිය හැක, මන්ද මට්ටම සහ ධුරාවලිය ද සමාන වේ, එවිට ඔබට සියලුම සාමාජිකයින් එක් ලැයිස්තුවක පෙන්විය හැක.

අපගේ තුන්වන උදාහරණය සමඟ වසරින් වසර විස්තර සහිතව මෙය දිගටම කරගෙන යා හැකි ආකාරය දැනටමත් පැහැදිලි යැයි මම සිතමි. නමුත් අපි වසරින් වසර සරඹ නොකිරීමට වඩා හොඳය, නමුත් පෙරීම - i.e. පෙත්තක් සාදන්න මෙය සිදු කිරීම සඳහා, අපි පහත විමසුම ලියන්නෙමු:

තෝරන්න ..පේළිවල ළමයි .සාමාජිකයින් කොතැනින්ද (.)
මෙහි පෙරීම කොහෙද?

කොහෙද- මූල පදය
ධුරාවලියේ එක් සාමාජිකයෙකි . සියලුම නියමයන් ඇතුළුව සම්පූර්ණ නම වනුයේ: .. , නමුත් නිසා මෙම සාමාජිකයාගේ නම අක්ෂය තුළ අද්විතීය වන බැවින්, නමේ සියලු අතරමැදි පැහැදිලි කිරීම් මඟ හැරිය හැක.

දින පදය වරහන් තුළ ඇත්තේ ඇයි? වරහන් ටියුපල් ( tuple) Tuple යනු ඛණ්ඩාංක එකක් හෝ කිහිපයක් දිගේ විවිධඅක්ෂ උදාහරණයක් ලෙස, එකවර අක්ෂ දෙකක් ඔස්සේ පෙරීමට, වරහන් තුළ අපි පද දෙකක් ලැයිස්තුගත කරමු විවිධමිනුම් කොමාවෙන් වෙන් කර ඇත. එනම්, ටියුපල් ඝනකයේ "පෙත්තක්" (හෝ "පෙරහන", එවැනි පාරිභාෂිතය සමීප නම්) නිර්වචනය කරයි.

ටූපල් භාවිතා කරනුයේ පෙරීමට පමණක් නොවේ. Tuples පේළි/තීරු/පිටු ආදියෙහි ශීර්ෂකවලද තිබිය හැක.

උදාහරණයක් ලෙස, ද්විමාන වගුවක ත්‍රිමාණ විමසුමක ප්‍රතිඵලය පෙන්වීම සඳහා මෙය අවශ්‍ය වේ.

පේළි මත crossjoin(...ළමා, ..ළමා) තෝරන්න .කොතනින් (.) තීරු මත සාමාජිකයන්
Crossjoinකාර්යයකි. එය කට්ටල දෙකක කාටිසියානු නිෂ්පාදනයේ ප්‍රතිඵලයක් ලෙස ටියුපල් කට්ටලයක් (ඔව්, කට්ටලයක ටියුපල් අඩංගු විය හැක!) ආපසු ලබා දෙයි. එම. ප්‍රතිඵලයක් ලෙස ලැබෙන කට්ටලයේ රටවල් සහ වසරවල හැකි සියලුම සංයෝජන අඩංගු වේ. පේළි ශීර්ෂවල මෙලෙස අගයන් යුගලයක් අඩංගු වේ: රට-වසර.

ප්‍රශ්නය නම්, කුමන සංඛ්‍යාත්මක ලක්ෂණ පෙන්විය යුතුද යන්න පිළිබඳ ඇඟවීම කොහේද? මෙම අවස්ථාවේදී, මෙම ඝනකය සඳහා අර්ථ දක්වා ඇති පෙරනිමි මිනුම භාවිතා වේ, i.e. ඇණවුම් මිල. අපට වෙනත් මිනුමක් ව්‍යුත්පන්න කිරීමට අවශ්‍ය නම්, මිනුම් මානයක සාමාජිකයන් බව අපට මතකයි මිනුම්. ඒ වගේම අපි අනෙක් අක්ෂයන් සමඟ හරියටම සමාන ලෙස ක්රියා කරමු. එම. එක් පියවරකින් විමසුමක් පෙරීම සෛල තුළ මෙම මිනුම හරියටම පෙන්වනු ඇත.

ප්‍රශ්නය: කොතැනක පෙරීම සහ පේළිවල අක්ෂ සාමාජිකයන් සඳහන් කිරීමෙන් පෙරීම අතර වෙනස කුමක්ද. පිළිතුර: ප්රායෝගිකව කිසිවක් නැත. ශීර්ෂ ගොඩනැගීමට සහභාගී නොවන එම අක්ෂය සඳහා පෙත්තක් දක්වා ඇති ස්ථානයේ සරලව. එම. එකම අක්ෂය බැහැඑම අවස්ථාවේදීම පැමිණ සිටින්න පේළි මත, සහ in කොහෙද.

ගණනය කළ සාමාජිකයින්

තවදුරටත් සංකීර්ණ විමසුම්ඔබට ගණනය කළ සාමාජිකයින් ප්‍රකාශ කළ හැකිය. ගුණාංග සහ මිනුම් අක්ෂ දෙකෙහිම සාමාජිකයන්. එම. නිදසුනක් වශයෙන්, ඔබට මුළු ඇණවුම් ප්‍රමාණයට එක් එක් රටෙහි දායකත්වය පෙන්වන නව පියවරක් ප්‍රකාශ කළ හැකිය:

සාමාජිකයා සමඟ. '.CurrentMember / ..' ලෙස, FORMAT_STRING='0.00%' තෝරන්න ... පේළිවල සිටින ළමයින් කොහෙන්ද .
ගණනය කිරීම සිදු වන්නේ එහි සියලුම ඛණ්ඩාංක ගුණාංග දන්නා සෛලයක සන්දර්භය තුළ ය. එක් එක් ඝන අක්ෂ සඳහා CurrentMember ශ්‍රිතය මඟින් අනුරූප ඛණ්ඩාංක (සාමාජිකයින්) ලබා ගත හැක. ප්‍රකාශනය බව මෙහිදී අප තේරුම් ගත යුතුය .වත්මන් සාමාජික/..’ එක් පදයක් තවත් පදයකින් බෙදන්නේ නැත, නමුත් බෙදයි අදාළ එකතු කළ දත්තකැට පෙති! එම. වත්මන් භූමිය සඳහා වන පෙත්ත සියලුම ප්‍රදේශ සඳහා පෙත්තකට බෙදනු ඇත, i.e. සියලුම ඇණවුම් වල මුළු වටිනාකම. FORMAT_STRING - අගයන් පෙන්වීම සඳහා ආකෘතිය සකසයි, i.e. %.

ගණනය කළ සාමාජිකයෙකුගේ තවත් උදාහරණයක්, නමුත් වසර අක්ෂය මත:

සාමාජිකයා සමඟ. පරිදි '. -.’
නිසැකවම, වාර්තාවේ ඒකකයක් අඩංගු නොවනු ඇත, නමුත් අනුරූප කොටස්වල වෙනස, i.e. මෙම වසර දෙක තුළ ඇණවුම් ප්රමාණයේ වෙනස.

ROLAP හි සංදර්ශකය

OLAP පද්ධති යනු එක් ආකාරයකින් හෝ වෙනත් ආකාරයක දත්ත ගබඩා කිරීම සහ සංවිධාන පද්ධතිය මත පදනම් වේ. කවදා ද අපි කතා කරන්නේ RDBMS ගැන, පසුව ඔවුන් ROLAP ගැන කතා කරයි (අපි MOLAP සහ HOLAP අත්හැර දමමු ස්වයං අධ්‍යයනය) ROLAP - සම්බන්ධතා දත්ත ගබඩාවක OLAP, i.e. සාමාන්ය ද්විමාන වගු ආකාරයෙන් විස්තර කර ඇත. ROLAP පද්ධති MDX විමසුම් SQL බවට පරිවර්තනය කරයි. දත්ත සමුදායන් සඳහා ඇති ප්‍රධාන පරිගණක ගැටලුව වන්නේ වේගවත් එකතු කිරීමයි. වේගයෙන් එකතු කිරීම සඳහා, දත්ත සමුදායේ දත්ත සාමාන්‍යයෙන් ඉතා සාමාන්‍යකරණය වී ඇත, i.e. තැටි අවකාශය ලබා ගැනීම සහ දත්ත සමුදා අඛණ්ඩතාව නිරීක්ෂණය කිරීම සම්බන්ධයෙන් ඉතා කාර්යක්ෂමව ගබඩා කර නොමැත. ප්ලස් ඒවාට අමතර වශයෙන් අර්ධ වශයෙන් එකතු කළ දත්ත ගබඩා කරන සහායක වගු අඩංගු වේ. එබැවින්, OLAP සඳහා, වෙනම දත්ත සමුදා සැලැස්මක් සාමාන්‍යයෙන් සාදනු ලබන අතර, එය නාමාවලි අනුව මුල් ගනුදෙනු දත්ත සමුදායේ ව්‍යුහය අර්ධ වශයෙන් පමණක් ප්‍රතිනිර්මාණය කරයි.

සංචාලනය

බොහෝ OLAP පද්ධති දැනටමත් ජනනය කර ඇති විමසුමක් (සහ ඒ අනුව තෝරාගත් දත්ත) සඳහා අන්තර්ක්‍රියාකාරී සංචාලන මෙවලම් පිරිනමයි. මෙම අවස්ථාවේදී, ඊනියා "විදුම්" හෝ "විදුම්" භාවිතා වේ. රුසියානු භාෂාවට වඩා ප්රමාණවත් පරිවර්තනයක් වනුයේ "ගැඹුරු කිරීම" යන වචනයයි. නමුත් මෙය රසය පිළිබඳ කාරණයකි, සමහර පරිසරවල “විදුම්” යන වචනය ඇලී තිබේ.

සරඹ- මෙය වෙනත් අක්ෂයක් (හෝ අක්ෂ කිහිපයක්) ඔස්සේ පෙරීම සමඟ ඒකාබද්ධව දත්ත එකතු කිරීමේ මට්ටම අඩු කිරීමෙන් විස්තර කරන වාර්තාවකි. විදුම් වර්ග කිහිපයක් තිබේ:

  • සරඹ-පහළ- තෝරාගත් පෙරීමේ සාමාජිකයාගේ ධුරාවලිය තුළ පැවත එන්නන් පිළිබඳ සවිස්තරාත්මක තොරතුරු සංදර්ශනය සමඟ වාර්තාවේ එක් මූලාශ්‍ර අක්ෂයක් ඔස්සේ පෙරීම. උදාහරණයක් ලෙස, රටවල් සහ වසර අනුව බිඳ දැමූ ඇණවුම් බෙදා හැරීම පිළිබඳ වාර්තාවක් තිබේ නම්, 2007 වර්ෂය මත ක්ලික් කිරීමෙන් එම රටවල් සහ 2007 මාසවල බිඳ දැමූ වාර්තාවක් පෙන්වනු ඇත.
  • සරඹ පැත්ත- තෝරාගත් අක්ෂ එකක් හෝ කිහිපයක් යටතේ පෙරීම සහ වෙනත් අක්ෂ එකක් හෝ කිහිපයක් ඔස්සේ එකතු කිරීම ඉවත් කිරීම. උදාහරණයක් ලෙස, රටවල් සහ වසර අනුව බිඳ දැමූ ඇණවුම් බෙදා හැරීම පිළිබඳ වාර්තාවක් තිබේ නම්, 2007 වර්ෂය මත ක්ලික් කිරීමෙන්, 2007 වන විට පෙරීම සහිත රටවල් සහ සැපයුම්කරුවන් විසින් බිඳ දැමූ තවත් වාර්තාවක් පෙන්වනු ඇත.
  • සරඹ-අල- සියලුම අක්ෂයන්හි එකතු කිරීම ඉවත් කිරීම සහ ඒවා ඔස්සේ එකවර පෙරීම - වාර්තාවේ අගය ලබා ගත් කරුණු වගුවෙන් මූලාශ්‍ර දත්ත බැලීමට ඔබට ඉඩ සලසයි. එම. ඔබ සෛල අගයක් මත ක්ලික් කළ විට, මෙම මුදල ලබා දුන් සියලුම ඇණවුම් සමඟ වාර්තාවක් දර්ශනය වේ. ඝනකයේ "ගැඹුර" තුළට ක්ෂණිකව සිදුරු කිරීමකි.
එච්චරයි. දැන්, ඔබ ව්‍යාපාර බුද්ධිය සහ OLAP සඳහා කැපවීමට තීරණය කරන්නේ නම්, බැරෑරුම් සාහිත්‍ය කියවීම ආරම්භ කිරීමට කාලයයි.

ටැග්: ටැග් එකතු කරන්න

මම බොහෝ කලක සිට Habr හි පදිංචිව සිටිමි, නමුත් මාතෘකාව ඉතා සිත්ගන්නාසුළු වන අතර සෑම දිනකම වඩ වඩාත් අදාළ වන නමුත් බහුමාන කැට, OLAP සහ MDX යන මාතෘකාව පිළිබඳ ලිපි මම කිසි විටෙකත් කියවා නැත.
දත්ත සමුදායන්, විද්‍යුත් ගිණුම්කරණය සහ මාර්ගගත පද්ධති සංවර්ධනය වූ එම කෙටි කාලය තුළ දත්ත විශාල ප්‍රමාණයක් එකතු වී ඇති බව නොරහසකි. දැන්, ලේඛනාගාරය පිළිබඳ සම්පූර්ණ විශ්ලේෂණයක් සහ සමහර විට අනාගතයේ දී සමාන ආකෘති සඳහා තත්ත්වයන් පුරෝකථනය කිරීමට උත්සාහ කිරීම ද උනන්දුවකි.
අනෙක් අතට, විශාල සමාගම්, වසර කිහිපයක්, මාස හෝ සති පවා, ඔවුන්ගේ මූලික විශ්ලේෂණයට පවා අසාමාන්‍ය ප්‍රවේශයන් සහ දැඩි දෘඩාංග අවශ්‍යතා අවශ්‍ය වන තරම් විශාල දත්ත ප්‍රමාණයක් රැස් කර ගත හැකිය. මේවා බැංකු ගනුදෙනු සැකසුම් පද්ධති, විනිමය නියෝජිතයන්, දුරකථන ක්රියාකරුවන්ආදිය
දත්ත සමුදා නිර්මාණය සඳහා විවිධ ප්‍රවේශයන් 2ක් ගැන සෑම දෙනාම හොඳින් දන්නා බව මම සිතමි: OLTP සහ OLAP. පළමු ප්‍රවේශය (මාර්ගගත ගනුදෙනු සැකසීම - තත්‍ය කාලීන ගනුදෙනු සැකසීම) සැලසුම් කර ඇත්තේ තත්‍ය කාලීන කාර්යක්ෂම දත්ත රැස් කිරීම සඳහා වන අතර දෙවැන්න (මාර්ගගත විශ්ලේෂණ සැකසුම් - තත්‍ය කාලීන විශ්ලේෂණ සැකසුම්) විශේෂයෙන් ඉලක්ක කර ඇත්තේ දත්ත වඩාත් කාර්යක්ෂමව නියැදීම සහ සැකසීමයි. ආකාරය.

නවීන OLAP කැටවල ප්‍රධාන හැකියාවන් සහ ඒවා විසඳන ගැටළු මොනවාදැයි බලමු (විශ්ලේෂණ සේවා 2005/2008 පදනම ලෙස ගනු ලැබේ):

  • වේගවත් ප්රවේශයදත්ත වෙත
  • පූර්ව එකතු කිරීම
  • ධුරාවලිය
  • කාලය සමඟ වැඩ කිරීම
  • බහුමාන දත්ත ප්රවේශ භාෂාව
  • KPI (ප්‍රධාන කාර්ය සාධන දර්ශක)
  • දින කැණීම
  • බහු මට්ටමේ හැඹිලිගත කිරීම
  • බහුභාෂා සහාය
ඉතින්, අපි OLAP කියුබ් වල හැකියාවන් ටිකක් විස්තරාත්මකව බලමු.

හැකියාවන් ගැන තව ටිකක්

දත්ත වෙත ඉක්මන් ප්රවේශය
ඇත්ත වශයෙන්ම, අරාවේ විශාලත්වය නොසලකා දත්ත වෙත වේගවත් ප්‍රවේශය OLAP පද්ධතිවල පදනම වේ. මෙය ප්‍රධාන අවධානය යොමු කරන බැවින්, දත්ත ගබඩාවක් සාමාන්‍යයෙන් ගොඩනගා ඇත්තේ සම්බන්ධතා දත්ත සමුදායන්ට වඩා වෙනස් මූලධර්ම මත ය.
මෙහිදී, සරල දත්ත ලබා ගැනීමේ කාලය තත්පරයක භාග වලින් මනිනු ලබන අතර, තත්පර කිහිපයක් ඉක්මවන විමසුමකට බොහෝ විට ප්‍රශස්තකරණය අවශ්‍ය වේ.

පූර්ව එකතු කිරීම
පවතින දත්ත ඉක්මනින් ලබා ගැනීමට අමතරව, එය "බොහෝ විට භාවිතා කිරීමට ඉඩ ඇති" අගයන් පූර්ව එකතු කිරීමේ හැකියාව ද සපයයි. උදාහරණයක් ලෙස, යම් භාණ්ඩයක විකුණුම් පිළිබඳ දෛනික වාර්තා අප සතුව තිබේ නම්, පද්ධතිය සමහර විටඅපට මාසික සහ ත්‍රෛමාසික විකුණුම් ප්‍රමාණයන් ද පූර්ව එකතු කළ හැක, එයින් අදහස් වන්නේ අප දත්ත මාසිකව හෝ කාර්තුමය වශයෙන් ඉල්ලා සිටියහොත් පද්ධතිය ක්ෂණිකව ප්‍රතිඵලය අපට ලබා දෙන බවයි. පෙර-එකතු කිරීම සැමවිටම සිදු නොවන්නේ ඇයි - න්‍යායාත්මකව භාණ්ඩ/කාලය/යනාදී සංයෝජන නිසා. විශාල සංඛ්‍යාවක් තිබිය හැකිය, එයින් අදහස් කරන්නේ එකතු කිරීම ගොඩනඟන්නේ කුමන අංග සඳහාද සහ එසේ නොවේද යන්න පිළිබඳව ඔබට පැහැදිලි නීති තිබිය යුතුය. පොදුවේ ගත් කල, මෙම රීති සැලකිල්ලට ගැනීමේ මාතෘකාව සහ එකතු කිරීම් වල සැබෑ සැලසුම තරමක් පුළුල් වන අතර එය වෙනම ලිපියක් ලැබිය යුතුය.

ධුරාවලිය
දත්ත විශ්ලේෂණය කිරීමේදී සහ අවසාන වාර්තා ගොඩනඟන විට, මාස දින වලින් සමන්විත වන අතර, ඒවා විසින්ම නිල නිවාස සාදමින්, කලාපවල හෝ රටවල කොටසක් වන ප්‍රදේශවලට නගර ඇතුළත් වන බව සැලකිල්ලට ගත යුතු බව ස්වාභාවිකය. . ශුභාරංචිය එයයි OLAP කැටමුලින් ධූරාවලියේ දෘෂ්ටි කෝණයෙන් දත්ත සලකා බලන්න සහ එකම ආයතනයේ වෙනත් පරාමිතීන් සමඟ සම්බන්ධතා, එබැවින් ඝනකවල ධූරාවලිය ගොඩනැගීම සහ භාවිතා කිරීම ඉතා සරල කාරණයකි.

කාලය සමඟ වැඩ කිරීම
දත්ත විශ්ලේෂණය ප්‍රධාන වශයෙන් කාල පරාසයන් තුළ සිදු වන බැවින්, OLAP පද්ධති තුළ කාලයට විශේෂ වැදගත්කමක් ලබා දී ඇත, එනම් අපට මෙහි කාලය ඇති පද්ධතිය සඳහා සරලව අර්ථ දැක්වීමෙන්, අනාගතයේදී ඔබට වසරින් දිනය, මාසය සිට අද දක්වා වැනි කාර්යයන් පහසුවෙන් භාවිතා කළ හැකිය. (වසරේ/මාසයේ ආරම්භයේ සිට වත්මන් දිනය දක්වා කාලය), සමාන්තර කාල පරිච්ඡේදය (එකම දිනයේ හෝ මාසයේ, නමුත් පසුගිය වසරේ) ආදිය.

බහුමාන දත්ත ප්‍රවේශ භාෂාව
MDX(බහුමාන ප්‍රකාශන) - බහුමාන දත්ත ව්‍යුහයන් වෙත සරල සහ කාර්යක්ෂම ප්‍රවේශය සඳහා විමසුම් භාෂාවකි. ඒ සියල්ල කියයි - පහත උදාහරණ කිහිපයක් ඇත.

ප්රධාන කාර්ය සාධන දර්ශක (KPI)
ප්රධාන කාර්ය සාධන දර්ශකමූලෝපායික අරමුණු සාක්ෂාත් කර ගැනීම තීරණය කිරීමට සංවිධානයට උපකාර වන මූල්‍ය හා මූල්‍ය නොවන මිනුම් පද්ධතියකි. ප්‍රධාන කාර්ය සාධන දර්ශක OLAP පද්ධතිවල සරලව අර්ථ දැක්විය හැකි අතර වාර්තා වල භාවිතා කළ හැක.

පතල් කැණීමේ දිනය
දත්ත කැණීම(Data Mining) - මූලික වශයෙන්, විශාල දත්ත කට්ටලවල විචල්‍යයන් අතර සැඟවුණු රටා හෝ සම්බන්ධතා හඳුනා ගැනීම.
"Data Mining" යන ඉංග්‍රීසි යෙදුමට රුසියානු භාෂාවට නොපැහැදිලි පරිවර්තනයක් නොමැත (දත්ත කැණීම, දත්ත කැණීම, තොරතුරු කැණීම, දත්ත/තොරතුරු උපුටා ගැනීම) එබැවින් බොහෝ අවස්ථාවලදී එය මුල් පිටපතෙහි භාවිතා වේ. වඩාත්ම සාර්ථක වක්ර පරිවර්තනය වන්නේ "දත්ත කැණීම" (DMA) යන යෙදුමයි. කෙසේ වෙතත්, මෙය සලකා බැලීම සඳහා වෙනම, අඩු රසවත් මාතෘකාවකි.

බහු මට්ටමේ හැඹිලිගත කිරීම
ඇත්ත වශයෙන්ම, දත්ත ප්‍රවේශයේ ඉහළම වේගය සහතික කිරීම සඳහා, උපක්‍රමශීලී දත්ත ව්‍යුහයන් සහ පෙර එකතු කිරීම් වලට අමතරව, OLAP පද්ධති බහු මට්ටමේ හැඹිලි සඳහා සහය දක්වයි. සරල විමසුම් හැඹිලියට අමතරව, ගබඩාවෙන් කියවන දත්ත කොටස්, එකතු කළ අගයන් සහ ගණනය කළ අගයන් ද හැඹිලිගත කර ඇත. මේ අනුව, ඔබ OLAP ඝනකයක් සමඟ වැඩි කාලයක් වැඩ කරන තරමට, එය වේගයෙන් වැඩ කිරීමට පටන් ගනී. “හැඹිලිය උණුසුම් කිරීම” යන සංකල්පය ද ඇත - විශේෂිත වාර්තා, විමසුම් හෝ සියල්ල ඒකාබද්ධව වැඩ කිරීම සඳහා OLAP පද්ධතිය සකස් කරන මෙහෙයුමකි.

බහුභාෂා සහාය
ඔව් ඔව් ඔව්. අවම වශයෙන්, විශ්ලේෂණ සේවා 2005/2008 (ව්‍යවසාය සංස්කරණය වුවද) ස්වදේශිකව බහුභාෂාවාදයට සහය දක්වයි. ඔබගේ දත්තවල තන්තු පරාමිතිවල පරිවර්තනයක් සැපයීම ප්රමාණවත් වන අතර, ඔහුගේ භාෂාව සඳහන් කළ සේවාදායකයාට දේශීය දත්ත ලැබෙනු ඇත.

බහුමාන කැට

ඉතින් මේ බහුමාන කැට මොනවාද?
කාලය, නිෂ්පාදන සහ පාරිභෝගිකයින් යන අක්ෂයන් වන ත්‍රිමාන අවකාශයක් සිතමු.
එවැනි අවකාශයක ලක්ෂ්‍යයක්, ගැනුම්කරුවන්ගෙන් එක් අයෙකු යම් මාසයක නිශ්චිත නිෂ්පාදනයක් මිලදී ගත් බව පෙන්නුම් කරයි.

ඇත්ත වශයෙන්ම, ගුවන් යානය (හෝ එවැනි සියලු ලක්ෂ්යවල කට්ටලය) ඝනකයක් වනු ඇත, ඒ අනුව, කාලය, නිෂ්පාදන සහ පාරිභෝගිකයින් එහි මානයන් වනු ඇත.
සිව්මාන හෝ වැඩි ඝනකයක් සිතීම (සහ ඇඳීම) ටිකක් අපහසු වේ, නමුත් සාරය වෙනස් නොවේ, සහ වඩාත්ම වැදගත් දෙය නම්, OLAP පද්ධති සඳහා ඔබ කොපමණ මානයන් ක්‍රියා කරයිද යන්න කිසිසේත්ම වැදගත් නොවේ (සාධාරණ තුළ සීමාවන්, ඇත්ත වශයෙන්ම).

MDX ටිකක්

ඉතින්, MDX හි අලංකාරය කුමක්ද? හරියටම මොකක්දඅපට අවශ්යයි.
උදාහරණ වශයෙන්,
තෝරන්න
(.) තීරු මත,
(., .) පේළි මත
සිට
කොහෙද (., .)

ඒ කියන්නේ මට ජූනි සහ ජූලි මාසවල මොසැම්බික් වල විකුණන iPhone ගණන අවශ්‍යයි.
ඒ සමගම මම විස්තර කරමි කුමනමේ මට අවශ්‍ය දත්ත සහ කෙසේදමට ඒවා වාර්තාවෙන් බලන්න ඕන.
ලස්සනයි නේද?

මෙන්න ටිකක් සංකීර්ණයි:

සාමාජිකයන් සමඟ සාමාන්‍ය වියදම් AS
. / .
තෝරන්න
(සාමාන්‍ය වියදම්) තීරු මත,
( .., .. ) පේළි මත
සිට
කොහෙද (.)

* මෙම මූල කේතය Source Code Highlighter සමඟින් උද්දීපනය කරන ලදී.

ඇත්ත වශයෙන්ම, මුලින්ම අපි "සාමාන්ය මිලදී ගැනීමේ ප්රමාණය" ගණනය කිරීම සඳහා සූත්රය තීරණය කරන අතර, Apple වෙළඳසැලට එක් සංචාරයකදී වැඩි මුදලක් වියදම් කරන්නේ කවුරුන්ද (කුමන ස්ත්රී පුරුෂ භාවය) සංසන්දනය කිරීමට උත්සාහ කරන්න.

භාෂාව අධ්‍යයනය කිරීමට සහ භාවිතා කිරීමට අතිශයින්ම සිත්ගන්නා සුළු වන අතර සමහර විට බොහෝ සාකච්ඡා කිරීමට සුදුසුය.

නිගමනය

ඇත්ත වශයෙන්ම, මෙම ලිපිය මූලික සංකල්ප පවා ඉතා සුළු ආවරණය කරයි; මම එය "ආහාර රුචිය" ලෙස හඳුන්වමි - මෙම මාතෘකාව පිළිබඳව හබ්රා ප්‍රජාව උනන්දු කරවීමට සහ එය තවදුරටත් වර්ධනය කිරීමට අවස්ථාවක්. සංවර්ධනය සම්බන්ධයෙන් ගත් කල, මෙහි විශාල නොකෙරුණු ක්ෂේත්‍රයක් ඇති අතර, ඔබගේ සියලු ප්‍රශ්නවලට පිළිතුරු දීමට මම සතුටු වෙමි.

පී.එස්.මෙය OLAP පිළිබඳ මගේ පළමු පළ කිරීම සහ Habré හි පළමු ප්‍රකාශනයයි - නිර්මාණාත්මක ප්‍රතිපෝෂණ සඳහා මම ඉතා කෘත ful වෙමි.
යාවත්කාලීන:මම එය SQL වෙත මාරු කළෙමි, ඔවුන් මට නව බ්ලොග් නිර්මාණය කිරීමට ඉඩ දුන් වහාම මම එය OLAP වෙත මාරු කරමි.

ටැග්: ටැග් එකතු කරන්න

මෙම කාර්යයේ කොටසක් ලෙස, පහත සඳහන් ගැටළු සලකා බලනු ලැබේ:

  • OLAP කියුබ් යනු කුමක්ද?
  • මිනුම්, මානයන්, ධූරාවලිය යනු කුමක්ද?
  • OLAP කැට මත කුමන ආකාරයේ මෙහෙයුම් සිදු කළ හැකිද?
OLAP ඝනකයක් පිළිබඳ සංකල්පය

OLAP හි ප්‍රධාන උපකල්පනය වන්නේ දත්ත ඉදිරිපත් කිරීමේ බහුමානත්වයයි. OLAP පාරිභාෂිතයේ දී, ඝනකයක් හෝ හයිපර්කියුබ් සංකල්පය බහුමාන විවික්ත දත්ත අවකාශයක් විස්තර කිරීමට භාවිතා කරයි.

කියුබ්පරිශීලක විශ්ලේෂකයාට තොරතුරු විමසිය හැකි බහුමාන දත්ත ව්‍යුහයකි. කැට නිර්මාණය කර ඇත්තේ කරුණු සහ මානයන් මගිනි.

දත්ත- මෙය විශ්ලේෂණයට යටත් වන සමාගමේ වස්තූන් සහ සිදුවීම් පිළිබඳ දත්ත වේ. එකම ආකාරයේ කරුණු මිනුම් ආකෘති. මිනුමක් යනු ඝනක සෛලයක ඇති අගයයි.

මිනුම්- මේවා කරුණු විශ්ලේෂණය කරන දත්ත මූලද්‍රව්‍ය වේ. එවැනි මූලද්‍රව්‍යවල එකතුවක් මාන ගුණාංගයක් සාදයි (උදාහරණයක් ලෙස, සතියේ දිනවල කාල මාන ගුණාංගයක් සෑදිය හැක). වාණිජ ව්යවසායන් සඳහා ව්යාපාර විශ්ලේෂණ කාර්යයන් වලදී, මානයන් බොහෝ විට "කාලය", "විකුණුම්", "නිෂ්පාදන", "පාරිභෝගිකයින්", "සේවකයින්", "භූගෝලීය පිහිටීම" වැනි කාණ්ඩ ඇතුළත් වේ. මිනුම් බොහෝ විට වේ ධූරාවලි ව්යුහයන්, පරිශීලකයාට සත්‍ය දත්ත විශ්ලේෂණය කළ හැකි තාර්කික කාණ්ඩ වේ. සෑම ධුරාවලියකටම මට්ටම් එකක් හෝ කිහිපයක් තිබිය හැක. මේ අනුව, "භූගෝලීය පිහිටීම" මානයෙහි ධුරාවලියට මට්ටම් ඇතුළත් විය හැකිය: "රට - කලාපය - නගරය". කාල ධූරාවලිය තුළ, අපට පහත මට්ටම් අනුපිළිවෙල වෙන්කර හඳුනාගත හැකිය: මානයකට ධූරාවලිය කිහිපයක් තිබිය හැකිය (එක් මානයක සෑම ධුරාවලියකටම මාන වගුවේ එකම ප්‍රධාන ගුණාංගය තිබිය යුතුය).

කියුබ් එකක කරුණු වගු එකකින් හෝ වැඩි ගණනකින් සත්‍ය දත්ත අඩංගු විය හැකි අතර බොහෝ විට බහු මානයන් අඩංගු වේ. ඕනෑම ඝනකයක් සාමාන්යයෙන් විශ්ලේෂණය සඳහා නිශ්චිත අවධානයක් ඇත.

කලාපය අනුව යම් සමාගමක් විසින් ඛනිජ තෙල් නිෂ්පාදන අලෙවිය විශ්ලේෂණය කිරීම සඳහා නිර්මාණය කර ඇති ඝනකයක උදාහරණයක් රූප සටහන 1 හි දැක්වේ. මෙම ඝනකයට මාන තුනක් (කාලය, නිෂ්පාදන සහ කලාපය) සහ එක් මිනුමක් (මුදල් අනුව ප්‍රකාශිත විකුණුම් පරිමාව) ඇත. මිනුම් අගයන් ඝනකයේ අනුරූප සෛල තුළ ගබඩා කර ඇත. සෑම සෛලයක්ම ටියුපල් ලෙස හඳුන්වනු ලබන එක් එක් මානයන්හි සාමාජිකයින් සමූහයක් විසින් අනන්‍ය ලෙස හඳුනාගෙන ඇත. උදාහරණයක් ලෙස, ඝනකයේ පහළ වම් කෙළවරේ පිහිටා ඇති සෛලය (වටිනාකම $98399 අඩංගු වේ) tuple [ජූලි 2005, Far East, Diesel] මගින් නියම කර ඇත. මෙහි $98,399 අගය පෙන්නුම් කරන්නේ 2005 ජූලි මාසය සඳහා ඈත පෙරදිග ඩීසල්වල විකුණුම් පරිමාව (මුදල් වශයෙන්) ය.

සමහර සෛලවල කිසිදු අගයක් නොමැති බව ද සඳහන් කිරීම වටී: සත්‍ය වගුවේ ඒවා සඳහා දත්ත අඩංගු නොවන නිසා මෙම සෛල හිස් ය.

සහල්. 1.විවිධ කලාපවල ඛනිජ තෙල් නිෂ්පාදන අලෙවිය පිළිබඳ තොරතුරු සහිත කියුබ්

එවැනි කැට නිර්මාණය කිරීමේ අවසාන ඉලක්කය වන්නේ සත්‍ය දත්ත වලින් අවශ්‍ය තොරතුරු උකහා ගන්නා විමසුම් සැකසීමේ කාලය අවම කිරීමයි. මෙම කාර්යය ඉටු කිරීම සඳහා, කැට සාමාන්‍යයෙන් හඳුන්වනු ලබන පූර්ව ගණනය කළ එකතුව අඩංගු වේ එකතු කිරීම්(එකතු කිරීම්). එම. ඝනකය සැබෑ එකට වඩා විශාල දත්ත අවකාශයක් ආවරණය කරයි - එහි තාර්කික, ගණනය කළ ලක්ෂ්ය ඇත. සත්‍ය අගයන් මත පදනම්ව තාර්කික අවකාශයේ ලක්ෂ්‍යවල අගයන් ගණනය කිරීමට එකතු කිරීමේ ශ්‍රිත ඔබට ඉඩ සලසයි. සරලම එකතු කිරීමේ කාර්යයන් වන්නේ SUM, MAX, MIN, COUNT ය. උදාහරණයක් ලෙස, උදාහරණයක් ලෙස, MAX ශ්‍රිතය භාවිතා කරමින්, උදාහරණයේ දී ඇති කියුබ් සඳහා, ඈත පෙරදිග ඩීසල් අලෙවියේ උච්චතම අවස්ථාව සිදු වූ විට ඔබට හඳුනාගත හැකිය.

බහුමාන කැට වල තවත් විශේෂිත ලක්ෂණයක් වන්නේ සම්භවය තීරණය කිරීමේ දුෂ්කරතාවයයි. උදාහරණයක් ලෙස, ඔබ නිෂ්පාදන හෝ කලාප මානය සඳහා ලක්ෂ්‍යය 0 සකසන්නේ කෙසේද? මෙම ගැටලුවට විසඳුම වන්නේ මානයන්හි සියලුම අංග ඒකාබද්ධ කරන විශේෂ ගුණාංගයක් හඳුන්වා දීමයි. මෙම ගුණාංගය (ස්වයංක්‍රීයව සාදනු ලැබේ) අඩංගු වන්නේ එක් මූලද්‍රව්‍යයක් පමණි - සියල්ල. එකතුව වැනි සරල එකතු කිරීමේ ශ්‍රිත සඳහා, සියලු මූලද්‍රව්‍යය දෙන ලද මානයක සැබෑ අවකාශයේ ඇති සියලුම මූලද්‍රව්‍යවල අගයන්ගේ එකතුවට සමාන වේ.

බහුමාන දත්ත ආකෘතියක වැදගත් සංකල්පයක් වන්නේ උප අවකාශය හෝ උප ඝනකයයි. සබ්කියුබ් යනු ඝනකයේ අභ්‍යන්තරයේ ඇති බහුමාන රූපයක ආකාරයේ ඝනකයක සම්පූර්ණ අවකාශයේ කොටසකි. ඝනකයක බහුමාන අවකාශය විවික්ත හා සීමිත බැවින්, උපකියුබ් ද විවික්ත සහ සීමිත වේ.

OLAP කියුබ් මත මෙහෙයුම්

OLAP ඝනකයක් මත පහත මෙහෙයුම් සිදු කළ හැක:

  • පෙත්තක්;
  • භ්රමණය;
  • ඒකාබද්ධ කිරීම;
  • විස්තර කිරීම.
පෙත්තක්(රූපය 2) යනු උපකියුබ් එකක විශේෂ අවස්ථාවකි. මෙය මෙම උප කුලකයට ඇතුළත් නොවන මාන මූලද්‍රව්‍ය එකක හෝ වැඩි ගණනක තනි අගයකට අනුරූප වන බහුමාන දත්ත අරාවක උප කුලකයක් සෑදීමේ ක්‍රියා පටිපාටියකි. උදාහරණයක් ලෙස, පෙට්‍රෝලියම් නිෂ්පාදන අලෙවිය යම් කලාපයක, එනම් යූරල් වල පමණක් කාලයත් සමඟ ප්‍රගතියක් ලැබුවේ කෙසේදැයි දැන ගැනීමට, ඔබ “යුරල්” මූලද්‍රව්‍යයේ “නිෂ්පාදන” මානය සවි කර අනුරූප උප කුලකය (උපකියුබ්) උපුටා ගත යුතුය. ඝනකයක්.
  • සහල්. 2. OLAP කියුබ් පෙත්ත

    භ්රමණය(රූපය 3) - වාර්තාවක හෝ ප්රදර්ශනය කරන ලද පිටුවෙහි ඉදිරිපත් කර ඇති මිනුම්වල පිහිටීම වෙනස් කිරීමේ මෙහෙයුම. උදාහරණයක් ලෙස, භ්‍රමණ මෙහෙයුමකට වගුවක පේළි සහ තීරු නැවත සකස් කිරීම ඇතුළත් විය හැකිය. අතිරේකව, දත්ත ඝනකයක් භ්‍රමණය කිරීමෙන් වගු වලින් පිටත මානයන් ප්‍රදර්ශනය වන පිටුවේ ඇති මානයන් සමඟ ස්ථානයට ගෙන යයි, සහ අනෙක් අතට.

    සාමාන්යයෙන්, සෑම විශේෂඥයෙක්ම අද OLAP යනු කුමක්දැයි දනී. අවම වශයෙන්, "OLAP" සහ "බහුමාන දත්ත" යන සංකල්ප අපගේ මනසෙහි ස්ථිරව සම්බන්ධ වේ. එසේ වුවද, මෙම මාතෘකාව නැවත මතු කිරීම, බහුතර පාඨකයින් විසින් අනුමත කරනු ඇතැයි මම බලාපොරොත්තු වෙමි, මන්ද යමක් පිළිබඳ අදහස කාලයත් සමඟ යල් පැන නොයාම සඳහා, ඔබ වරින් වර සන්නිවේදනය කළ යුතුය. බුද්ධිමත් මිනිසුන්නැත්නම් හොඳ ප්‍රකාශනයක ලිපි කියවන්න...

    දත්ත ගබඩා (OLAP හි ස්ථානය තොරතුරු ව්යුහයව්යවසාය)

    "OLAP" යන යෙදුම "දත්ත ගබඩාව" (දත්ත ගබඩාව) යන පදය සමඟ වෙන් කළ නොහැකි ලෙස සම්බන්ධ වේ.

    දත්ත ගබඩාවේ "ආරම්භක පියා" වන බිල් ඉන්මොන් විසින් සකස් කරන ලද නිර්වචනය මෙන්න: "දත්ත ගබඩාවක් යනු කළමනාකරණ තීරණ ගැනීමට සහාය වීම සඳහා වසම්-විශේෂිත, කාලානුරූපී, වෙනස් කළ නොහැකි දත්ත එකතුවකි."

    ගබඩාවේ දත්ත පැමිණෙන්නේ ව්‍යාපාරික ක්‍රියාවලීන් ස්වයංක්‍රීය කිරීමට සැලසුම් කර ඇති මෙහෙයුම් පද්ධති (OLTP පද්ධති) මගිනි. ඊට අමතරව, සංඛ්‍යාලේඛන වාර්තා වැනි බාහිර මූලාශ්‍රවලින් ගබඩාව නැවත පිරවිය හැක.

    දත්ත ගබඩාවන් ගොඩනඟන්නේ ඇයි - සියල්ලට පසු, දත්ත සමුදායන් හෝ මෙහෙයුම් පද්ධති ගොනු තුළ දැනටමත් "ජීවත් වන" අතිරික්ත තොරතුරු ඒවායේ අඩංගුද? පිළිතුර කෙටි විය හැකිය: මෙහෙයුම් පද්ධති වලින් දත්ත සෘජුව විශ්ලේෂණය කිරීම කළ නොහැකි හෝ ඉතා අපහසු වේ. මෙය දත්ත ඛණ්ඩනය කිරීම, විවිධ DBMS ආකෘතිවල ගබඩා කිරීම සහ ආයතනික ජාලයේ විවිධ "කොනර්" ඇතුළු විවිධ හේතු නිසා වේ. නමුත් ව්‍යවසායයක් එහි සියලුම දත්ත මධ්‍යම දත්ත සමුදා සේවාදායකයක ගබඩා කළද (එය අතිශයින් දුර්ලභ ය), විශ්ලේෂකයෙකුට ඔවුන්ගේ සංකීර්ණ, සමහර විට ව්‍යාකූල ව්‍යුහයන් නිසැකවම නොතේරෙනු ඇත. මෙහෙයුම් පද්ධති වලින් “අමු” දත්ත සමඟ කුසගින්නෙන් පෙළෙන විශ්ලේෂකයින් “පෝෂණය” කිරීමට උත්සාහ කිරීමේ දුක්ඛිත අත්දැකීමක් කතුවරයාට ඇත - එය “ඔවුන්ට ඕනෑවට වඩා” විය.

    මේ අනුව, ගබඩාවේ අරමුණ වන්නේ විශ්ලේෂණය සඳහා "අමු ද්රව්ය" එක් ස්ථානයක සහ සරල, තේරුම්ගත හැකි ව්යුහයක් සැපයීමයි. රැල්ෆ් කිම්බල්, ඔහුගේ "දත්ත ගබඩා මෙවලම් කට්ටලය" පොතේ පෙරවදනෙහි ලියා ඇත්තේ, සම්පූර්ණ පොත කියවීමෙන් පසු, පාඨකයාට තේරෙන්නේ එක් දෙයක් පමණක් නම් - එනම්, ගබඩාවේ ව්යුහය සරල විය යුතු බවයි - කතුවරයා ඔහුගේ සලකා බලනු ඇත. කාර්යය සම්පූර්ණ කරන ලදී.

    වෙනම ගබඩාවක පෙනුම සාධාරණීකරණය කරන තවත් හේතුවක් තිබේ - සංකීර්ණ විශ්ලේෂණ විමසුම් මෙහෙයුම් තොරතුරුවේගය අඩු කරන්න වත්මන් වැඩසමාගම්, දිගු කාලයක් සඳහා වගු අවහිර කිරීම සහ සේවාදායක සම්පත් අත්පත් කර ගැනීම.

    මගේ මතය අනුව, ගබඩාවක් යනු යෝධ දත්ත සමුච්චය කිරීමක් අවශ්‍ය නොවේ - ප්‍රධාන දෙය නම් එය විශ්ලේෂණයට පහසු වීමයි. පොදුවේ ගත් කල, කුඩා ගබඩා පහසුකම් සඳහා වෙනම යෙදුමක් අදහස් කෙරේ - Data Marts (data kiosk), නමුත් අපගේ රුසියානු භාවිතයේදී ඔබට එය බොහෝ විට ඇසෙන්නේ නැත.

    OLAP - පහසු විශ්ලේෂණ මෙවලමක්

    මධ්‍යගත කිරීම සහ පහසු ව්‍යුහගත කිරීම විශ්ලේෂකයෙකුට අවශ්‍ය සියල්ල නොවේ. ඔහුට තවමත් තොරතුරු බැලීම සහ දෘශ්‍යමාන කිරීම සඳහා මෙවලමක් අවශ්‍ය වේ. සාම්ප්‍රදායික වාර්තා, තනි ගබඩාවක් මත ගොඩනැගුණු ඒවා වුවද, එක් දෙයක් නොමැත - නම්‍යශීලී බව. දත්තවල අපේක්ෂිත දර්ශනය ලබා ගැනීම සඳහා ඒවා "ඇඹරීමට", "පුළුල් කිරීමට" හෝ "කඩා වැටීමට" නොහැකිය. ඇත්ත වශයෙන්ම, ඔබට ක්‍රමලේඛකයෙකු අමතන්න (ඔහුට පැමිණීමට අවශ්‍ය නම්), ඔහු (ඔහු කාර්යබහුල නොවේ නම්) ඉක්මනින් නව වාර්තාවක් සාදනු ඇත - කියන්න, පැයක් ඇතුළත (මම මෙය ලියන අතර මම විශ්වාස නොකරමි. එය මා - එය ජීවිතයේ වේගයෙන් සිදු නොවේ; අපි ඔහුට පැය තුනක් ලබා දෙමු. විශ්ලේෂකයෙකුට දිනකට අදහස් දෙකකට වඩා පරීක්ෂා කළ නොහැකි බව පෙනේ. තවද ඔහුට (ඔහු හොඳ විශ්ලේෂකයෙකු නම්) පැයකට එවැනි අදහස් කිහිපයක් ඉදිරිපත් කළ හැකිය. විශ්ලේෂකයා දකින දත්තවල “පෙති” සහ “කොටස්” වැඩි වන තරමට, ඔහු සතුව ඇති අදහස් වැඩි වන අතර, සත්‍යාපනය සඳහා වැඩි වැඩියෙන් “පෙති” අවශ්‍ය වේ. සරලව සහ පහසුවෙන් දත්ත පුළුල් කිරීමට සහ බිඳ දැමීමට ඔහුට හැකි මෙවලමක් ඔහුට තිබුනේ නම්! OLAP එවැනි මෙවලමක් ලෙස ක්රියා කරයි.

    OLAP යනු දත්ත ගබඩාවක අත්‍යවශ්‍ය ගුණාංගයක් නොවුවද, එය ගබඩාවේ එකතු වී ඇති තොරතුරු විශ්ලේෂණය කිරීමට වැඩි වැඩියෙන් භාවිතා වේ.

    සාමාන්‍ය ගබඩාවක ඇතුළත් කර ඇති සංරචක රූපයේ දැක්වේ. 1.

    සහල්. 1. දත්ත ගබඩා ව්යුහය

    මෙහෙයුම් දත්ත විවිධ ප්‍රභවයන්ගෙන් එකතු කර, පිරිසිදු කර, ඒකාබද්ධ කර, සම්බන්ධතා ගබඩාවක ගබඩා කර ඇත. එපමණක් නොව, විවිධ වාර්තාකරණ මෙවලම් භාවිතයෙන් විශ්ලේෂණය සඳහා ඒවා දැනටමත් පවතී. එවිට දත්ත (සම්පූර්ණ හෝ අර්ධ වශයෙන්) OLAP විශ්ලේෂණය සඳහා සූදානම් වේ. ඒවා විශේෂ OLAP දත්ත ගබඩාවකට පටවා හෝ සම්බන්ධක ගබඩාවේ ගබඩා කළ හැක. එහි වැදගත්ම අංගය පාර-දත්ත වේ, එනම් දත්තවල ව්‍යුහය, ස්ථානගත කිරීම සහ පරිවර්තනය පිළිබඳ තොරතුරු. ඔවුන්ට ස්තූතියි, විවිධ ගබඩා සංරචකවල ඵලදායී අන්තර් ක්රියාකාරීත්වය සහතික කෙරේ.

    සාරාංශගත කිරීම සඳහා, ගබඩාවක එකතු වන දත්ත බහුමාන විශ්ලේෂණය සඳහා මෙවලම් කට්ටලයක් ලෙස අපට OLAP අර්ථ දැක්විය හැක. න්‍යායාත්මකව, OLAP මෙවලම් ක්‍රියාකාරී දත්ත හෝ ඒවායේ නියම පිටපත් වලට කෙලින්ම යෙදිය හැක (මෙහෙයුම් පරිශීලකයින්ට බාධා නොවන පරිදි). නමුත් එමඟින් අපි දැනටමත් ඉහත විස්තර කර ඇති රාක්කය මතට නැගීමේ අවදානමක් ඇත, එනම්, විශ්ලේෂණයට සෘජුවම සුදුසු නොවන මෙහෙයුම් දත්ත විශ්ලේෂණය කිරීමට පටන් ගනිමු.

    OLAP හි අර්ථ දැක්වීම සහ මූලික සංකල්ප

    පළමුව, අපි විකේතනය කරමු: OLAP යනු මාර්ගගත විශ්ලේෂණ සැකසුම්, එනම් මෙහෙයුම් දත්ත විශ්ලේෂණයයි. OLAP හි නිර්වචන මූලධර්ම 12 1993 දී සම්බන්ධතා දත්ත සමුදායේ "නිපදවුම්කරු" වන E. F. Codd විසින් සකස් කරන ලදී. පසුව, එහි නිර්වචනය ඊනියා FASMI පරීක්ෂණයට නැවත සකස් කරන ලදී, OLAP යෙදුම බෙදාගත් බහුමාන තොරතුරු () ඉක්මනින් විශ්ලේෂණය කිරීමේ හැකියාව ලබා දීම අවශ්‍ය වේ.

    FASMI පරීක්ෂණය

    ඉක්මනින්(වේගවත්) - තොරතුරුවල සියලුම අංශ සම්බන්ධයෙන් සමානව ඉක්මනින් විශ්ලේෂණය සිදු කළ යුතුය. පිළිගත හැකි ප්‍රතිචාර කාලය තත්පර 5ක් හෝ ඊට අඩු වේ.

    විශ්ලේෂණය(විශ්ලේෂණය) - යෙදුම් සංවර්ධකයා විසින් පූර්ව නිර්වචනය කරන ලද හෝ පරිශීලකයා විසින් නිදහසේ නිර්වචනය කරන ලද මූලික ආකාරයේ සංඛ්‍යාත්මක සහ සංඛ්‍යානමය විශ්ලේෂණයන් සිදු කිරීමට හැකි විය යුතුය.

    බෙදාගෙන ඇත(බෙදාගත්) - බොහෝ පරිශීලකයින්ට දත්ත වෙත ප්‍රවේශය තිබිය යුතු අතර, රහස්‍ය තොරතුරු වෙත ප්‍රවේශය පාලනය කිරීම අවශ්‍ය වේ.

    බහුමාන(බහුමාන) යනු OLAP හි ප්‍රධාන, අත්‍යවශ්‍ය ලක්ෂණයයි.

    විස්තර(තොරතුරු) - යෙදුමට එහි පරිමාව සහ ගබඩා ස්ථානය කුමක් වුවත් අවශ්‍ය ඕනෑම තොරතුරක් වෙත ප්‍රවේශ වීමට හැකි විය යුතුය.

    OLAP = බහුමාන දසුන = කියුබ්

    OLAP ව්‍යාපාරික තොරතුරු වෙත ප්‍රවේශ වීම, බැලීම සහ විශ්ලේෂණය කිරීම සඳහා පහසු, වේගවත් මාධ්‍යයන් සපයයි. පරිශීලකයාට ස්වභාවික, අවබෝධාත්මක දත්ත ආකෘතියක් ලැබේ, ඒවා බහුමාන කැට (Cubes) ආකාරයෙන් සංවිධානය කරයි. බහුමාන ඛණ්ඩාංක පද්ධතියේ අක්ෂයන් විශ්ලේෂණය කරන ලද ව්‍යාපාර ක්‍රියාවලියේ ප්‍රධාන ගුණාංග වේ. උදාහරණයක් ලෙස, විකුණුම් සඳහා එය නිෂ්පාදන, කලාපය, ගැනුම්කරු වර්ගය විය හැකිය. කාලය මානයන්ගෙන් එකක් ලෙස භාවිතා වේ. අක්ෂවල මංසන්ධිවල - මානයන් (මාන) - ක්‍රියාවලිය ප්‍රමාණාත්මකව සංලක්ෂිත කරන දත්ත ඇත - මිනුම් (මිනුම්). මෙය කොටස් වශයෙන් හෝ මුල්‍යමය වශයෙන් විකුණුම් පරිමාවන්, කොටස් ශේෂයන්, පිරිවැය යනාදිය විය හැක. තොරතුරු විශ්ලේෂණය කරන පරිශීලකයාට කියුබ් එක "කපන්න" හැක. විවිධ දිශාවන්, සාරාංශය ලබා ගැනීම (උදාහරණයක් ලෙස, වසර අනුව) හෝ, අනෙක් අතට, සවිස්තරාත්මක (සතිය අනුව) තොරතුරු සහ විශ්ලේෂණ ක්‍රියාවලියේදී ඔහුගේ මනසට එන වෙනත් උපාමාරු සිදු කරන්න.

    රූපයේ දැක්වෙන ත්‍රිමාන ඝනකයේ මිනුම් ලෙස. 2, විකුණුම් ප්රමාණයන් භාවිතා කරනු ලබන අතර, කාලය, භාණ්ඩය සහ ගබඩාව මානයන් ලෙස භාවිතා කරයි. මිනුම් ඉදිරිපත් කරනු ලබන්නේ සමූහකරණයේ නිශ්චිත මට්ටම් වලිනි: නිෂ්පාදන වර්ගීකරණය, රට අනුව ගබඩා සහ මාසය අනුව ගනුදෙනු කාල දත්ත. මඳ වේලාවකට පසුව අපි කණ්ඩායම් (ධූරාවලිය) මට්ටම් වඩාත් විස්තරාත්මකව බලමු.


    සහල්. 2. කියුබ් උදාහරණය

    ඝනකයක් "කැපීම"

    ත්‍රිමාණ ඝනකයක් පවා පරිගණක තිරයක පෙන්වීමට අපහසු වන අතර එමඟින් උනන්දුවක් දක්වන මිනුම්වල අගයන් දෘශ්‍යමාන වේ. මාන තුනකට වඩා වැඩි කැට ගැන අපට කිව හැක්කේ කුමක්ද? ඝනකයක ගබඩා කර ඇති දත්ත දෘශ්‍යමාන කිරීම සඳහා, රීතියක් ලෙස, හුරුපුරුදු ද්විමාන, එනම් වගු, සංකීර්ණ ධූරාවලි පේළි සහ තීරු ශීර්ෂයන් සහිත දසුන් භාවිතා වේ.

    ඝනකයක ද්විමාන නිරූපණයක් අක්ෂ එකක් හෝ කිහිපයක් (මානයන්) හරහා "කපා දැමීමෙන්" ලබා ගත හැකිය: අපි දෙකක් හැර අනෙකුත් සියලුම මානයන් වල අගයන් සවි කරමු, අපට නිතිපතා ද්විමාන වගුවක් ලැබේ. වගුවේ තිරස් අක්ෂය (තීරු ශීර්ෂය) එක් මානයක් නියෝජනය කරයි, සිරස් අක්ෂය (පේළි ශීර්ෂය) තවත් මානයක් නියෝජනය කරයි, සහ වගු සෛල මිනුම්වල අගයන් නියෝජනය කරයි. මෙම අවස්ථාවෙහිදී, මිනුම් මාලාවක් ඇත්ත වශයෙන්ම මානයන්ගෙන් එකක් ලෙස සැලකේ - අපි එක්කෝ පෙන්වීමට එක් මිනුමක් තෝරා ගනිමු (ඉන්පසු අපට පේළියේ සහ තීරු ශීර්ෂයේ මානයන් දෙකක් තැබිය හැකිය), නැතහොත් මිනුම් කිහිපයක් පෙන්විය හැකිය (ඉන්පසු ඉන් එකක් වගු අක්ෂ මිනුම්වල නම් වලින් අල්ලා ගනු ඇත, සහ අනෙක් - එකම "නොකැපූ" මානයෙහි අගයන්).

    අත්තික්කා දෙස බලන්න. 3 - මෙන්න එක් මිනුමක් සඳහා ඝනකයේ ද්විමාන පෙත්තක් - ඒකක විකුණුම් (විකිණෙන කෑලි) සහ "නොකැපූ" මානයන් දෙකක් - ගබඩාව (ගබඩාව) සහ වේලාව (කාලය).


    සහල්. 3. එක් මිනුමක් සඳහා 2D ඝනක පෙත්තක්

    රූපයේ. රූප සටහන 4 පෙන්වන්නේ එක් "නොකැපූ" මානයක් පමණි - ගබඩාව, නමුත් එය පියවර කිහිපයක අගයන් පෙන්වයි - ඒකක විකුණුම් (විකුණුම් ඒකක), ගබඩා විකුණුම් (විකුණුම් මුදල) ​​සහ ගබඩා පිරිවැය (ගබඩා වියදම්).


    සහල්. 4. බහු මිනුම් සඳහා 2D ඝනක පෙත්තක්

    මාන දෙකකට වඩා "නොකැපූ" ලෙස පවතින විට ඝනකයක ද්විමාන නිරූපණයක් ද කළ හැකිය. මෙම අවස්ථාවේදී, "කපා" ඝනකයේ මානයන් දෙකක් හෝ වැඩි ගණනක් පෙති අක්ෂ (පේළි සහ තීරු) මත තබා ඇත - රූපය බලන්න. 5.


    සහල්. 5. එක් අක්ෂයක බහු මානයන් සහිත 2D ඝනක පෙත්තක්

    ටැග්

    මානයන් ඔස්සේ "තැබූ" අගයන් සාමාජිකයන් හෝ ලේබල් ලෙස හැඳින්වේ. කියුබ් එක "කපන්න" සහ තෝරාගත් දත්ත සීමා කිරීම (පෙරහන්න) යන දෙකම ලේබල් භාවිතා කරයි - "නොකැපූ" ලෙස පවතින මානයක අපි සියලු අගයන් ගැන උනන්දු නොවෙමු, නමුත් ඒවායේ උප කුලකයක, උදාහරණයක් ලෙස නගර තුනක් දුසිම් කිහිපයකින්. ලේබල් අගයන් 2D ඝනක දසුනේ පේළි සහ තීරු ශීර්ෂයන් ලෙස දිස්වේ.

    ධූරාවලිය සහ මට්ටම්

    ලේබල මට්ටම් එකක් හෝ වැඩි ගණනකින් සමන්විත ධුරාවලියකට ඒකාබද්ධ කළ හැක. උදාහරණයක් ලෙස, ගබඩා මානයෙහි ලේබල ස්වභාවිකව මට්ටම් සහිත ධුරාවලියකට කාණ්ඩගත කර ඇත:

    රට

    රජයේ

    නගරය

    ගබඩා කරන්න.

    සමස්ථ අගයන් ධුරාවලියේ මට්ටම් අනුව ගණනය කරනු ලැබේ, උදාහරණයක් ලෙස USA ("රට" මට්ටම) හෝ කැලිෆෝනියා ("ප්‍රාන්ත" මට්ටම) සඳහා විකුණුම් පරිමාව. එක් මානයක ධුරාවලියකට වඩා ක්‍රියාත්මක කළ හැකිය - කියන්න, කාලය සඳහා: (වසර, කාර්තුව, මාසය, දිනය) සහ (වසර, සතිය, දිනය).

    OLAP යෙදුම්වල ගෘහ නිර්මාණ ශිල්පය

    OLAP ගැන ඉහත කී සෑම දෙයක්ම අත්‍යවශ්‍යයෙන්ම දත්ත බහුමාන ඉදිරිපත් කිරීම හා සම්බන්ධ වේ. දත්ත ගබඩා කර ඇති ආකාරය, දළ වශයෙන් කථා කිරීම, අවසාන පරිශීලකයා හෝ සේවාදායකයා භාවිතා කරන මෙවලමෙහි සංවර්ධකයින් ගැන සැලකිලිමත් නොවේ.

    OLAP යෙදුම්වල බහුමානත්වය මට්ටම් තුනකට බෙදිය හැකිය:

    • බහුමාන දත්ත නිරූපණය - බහුමාන දෘශ්‍යකරණය සහ දත්ත හැසිරවීම සපයන අවසාන පරිශීලක මෙවලම්; ස්ථරය බහුමාන නියෝජනයදත්තවල භෞතික ව්‍යුහයෙන් වියුක්ත වන අතර දත්ත බහුමාන ලෙස වටහා ගනී.
    • බහුමාන සැකසුම් - බහුමාන විමසුම් සැකසීම සඳහා මෙවලමක් (භාෂාව) (සාම්ප්‍රදායික සම්බන්ධතා SQL භාෂාවමෙහි නුසුදුසු බව පෙනේ) සහ එවැනි ඉල්ලීමක් සැකසීමට සහ ක්‍රියාත්මක කිරීමට හැකියාව ඇති ප්‍රොසෙසරයකි.
    • බහුමාන ගබඩාව යනු බහුමාන විමසුම් කාර්යක්ෂමව ක්‍රියාත්මක කිරීම සහතික කරන දත්ත භෞතිකව සංවිධානය කිරීමේ මාධ්‍යයකි.

    සියලුම OLAP මෙවලම්වල පළමු මට්ටම් දෙක අනිවාර්ය වේ. බහුමාන නිරූපණයක් සඳහා දත්ත සාමාන්‍ය සම්බන්ධතා ව්‍යුහයන්ගෙන් ද උකහා ගත හැකි බැවින් තුන්වන මට්ටම, පුළුල්ව පැතිරී තිබුණද, අවශ්‍ය නොවේ; මෙම අවස්ථාවෙහි බහුමාන විමසුම් සකසනය බහුමාන විමසුම් සම්බන්ධතා DBMS මගින් ක්‍රියාත්මක කරන SQL විමසුම් බවට පරිවර්තනය කරයි.

    විශේෂිත OLAP නිෂ්පාදන, රීතියක් ලෙස, බහුමාන දත්ත නිරූපණ මෙවලමක්, OLAP සේවාදායකයෙක් (උදාහරණයක් ලෙස, Microsoft වෙතින් Excel 2000 හි Pivot Tables හෝ Knosys වෙතින් ProClarity) හෝ බහුමාන සේවාදායකයක් වන DBMS, OLAP සේවාදායකය (උදාහරණයක් ලෙස, Oracle Express Server හෝ Microsoft OLAP සේවා).

    බහුමාන සැකසුම් ස්තරය සාමාන්‍යයෙන් OLAP සේවාලාභියා සහ/හෝ OLAP සේවාදායකය තුළ ගොඩනගා ඇත, නමුත් Microsoft හි Pivot Table Service සංරචකය වැනි එහි පිරිසිදු ස්වරූපයෙන් හුදකලා කළ හැක.

    බහුමාන දත්ත ගබඩා කිරීමේ තාක්ෂණික අංශ

    ඉහත සඳහන් කළ පරිදි, OLAP විශ්ලේෂණ මෙවලම් වලට සම්බන්ධතා පද්ධති වලින් සෘජුවම දත්ත ලබා ගත හැක. ප්‍රමුඛ පෙළේ DBMS නිෂ්පාදකයින්ගේ මිල ලැයිස්තුවට OLAP සේවාදායකයන් ඇතුළත් නොවූ එම දිනවල මෙම ප්‍රවේශය වඩාත් ආකර්ෂණීය විය. නමුත් අද, Oracle, Informix සහ Microsoft විසින් අංග සම්පූර්ණ OLAP සේවාදායකයන් පිරිනමනු ලබන අතර, ඔවුන්ගේ ජාලවල විවිධ නිෂ්පාදකයින්ගෙන් මෘදුකාංග “සත්වෝද්‍යානයක්” නිර්මාණය කිරීමට අකමැති තොරතුරු තාක්ෂණ කළමනාකරුවන්ට පවා මිලදී ගත හැකිය (හෝ ඒ වෙනුවට, ඊට අනුරූප ඉල්ලීමක් කරන්න. සමාගම් කළමනාකාරිත්වය ) ප්‍රධාන දත්ත සමුදා සේවාදායකය ලෙස එකම සන්නාමයේ OLAP සේවාදායකය.

    OLAP සේවාදායකයන්, හෝ බහුමාන දත්ත සමුදා සේවාදායකයන්, ඔවුන්ගේ බහුමාන දත්ත විවිධ ආකාරවලින් ගබඩා කළ හැක. මෙම ක්රම සලකා බැලීමට පෙර, ගබඩා ඒකක වැනි වැදගත් අංගයක් ගැන කතා කළ යුතුය. කාරණය නම්, ඕනෑම දත්ත ගබඩාවක - සාමාන්‍ය සහ බහුමාන - මෙහෙයුම් පද්ධති වලින් ලබාගත් සවිස්තරාත්මක දත්ත සමඟ, සාරාංශ දර්ශක (සමස්ත දර්ශක, එකතු කිරීම්) ද ගබඩා කර ඇත, එනම් මාසය අනුව විකුණුම් පරිමාවේ එකතුව, භාණ්ඩ වර්ග අනුව යනාදිය. විමසුම් ක්‍රියාත්මක කිරීම වේගවත් කිරීමේ එකම අරමුණ සඳහා සමස්ථයන් පැහැදිලිව ගබඩා කර ඇත. සියල්ලට පසු, එක් අතකින්, රීතියක් ලෙස, ගබඩාවේ ඉතා විශාල දත්ත ප්රමාණයක් එකතු වී ඇති අතර, අනෙක් අතට, බොහෝ අවස්ථාවලදී විශ්ලේෂකයින් උනන්දු වන්නේ සවිස්තරාත්මකව නොව සාමාන්යකරණය කරන ලද දර්ශක සඳහාය. අවුරුද්දේ මුළු විකුණුම් ගණනය කිරීම සඳහා සෑම අවස්ථාවකදීම මිලියන ගණනක් තනි විකුණුම් එකතු කළ යුතු නම්, වේගය බොහෝ විට පිළිගත නොහැකි වනු ඇත. එබැවින්, බහුමාන දත්ත ගබඩාවකට දත්ත පැටවීමේදී, සියලු සම්පූර්ණ දර්ශක හෝ ඒවායේ කොටසක් ගණනය කර සුරකිනු ලැබේ.

    එහෙත්, ඔබ දන්නා පරිදි, ඔබ සියල්ල සඳහා ගෙවිය යුතුය. සාරාංශ දත්ත සඳහා ඉල්ලීම් සැකසීමේ වේගය සඳහා, දත්ත පරිමාවන් සහ ඒවා පැටවීම සඳහා කාලය වැඩි කිරීම සඳහා ඔබට ගෙවිය යුතුය. එපමනක් නොව, පරිමාව වැඩිවීම වචනාර්ථයෙන් ව්යසනකාරී විය හැකිය - ප්රකාශිත එකක සම්මත පරීක්ෂණමුල් දත්ත 10 MB සඳහා සම්පූර්ණ ගණනය කිරීම් සඳහා 2.4 GB අවශ්‍ය වේ, එනම් දත්ත 240 ගුණයකින් වර්ධනය විය! එකතු කිරීම් ගණනය කිරීමේදී දත්ත "ඉදිමීම" උපාධිය ඝනකයේ මානයන් සංඛ්යාව සහ මෙම මානයන්හි ව්යුහය මත රඳා පවතී, එනම්, විවිධ මිනුම් මට්ටම්වල "පියවරුන්" සහ "දරුවන්" සංඛ්යාවෙහි අනුපාතය. එකතු කිරීම් ගබඩා කිරීමේ ගැටළුව විසඳීම සඳහා, සමහර විට සංකීර්ණ යෝජනා ක්‍රම භාවිතා කරනු ලැබේ, එමඟින් හැකි සියලුම එකතු කිරීම් ගණනය කිරීමේදී විමසුම් කාර්ය සාධනයේ සැලකිය යුතු වැඩි වීමක් ලබා ගත හැකිය.

    දැන් තොරතුරු ගබඩා කිරීම සඳහා විවිධ විකල්ප ගැන. කැටිති දත්ත සහ සමස්ථයන් යන දෙකම සම්බන්ධක හෝ බහුමාන ව්‍යුහයන් තුළ ගබඩා කළ හැක. බහුමාන ආචයනය මඟින් ඔබට දත්ත බහුමාන අරාවක් ලෙස සැලකීමට ඉඩ සලසයි, එමඟින් සමස්ත දර්ශකවල සමාන වේගවත් ගණනය කිරීම් සහ ඕනෑම මානයක් ඔස්සේ විවිධ බහුමාන පරිවර්තනයන් සහතික කෙරේ. කලකට පෙර, OLAP නිෂ්පාදන සම්බන්ධතා හෝ බහුමාන ආචයනය සඳහා සහාය විය. අද, නීතියක් ලෙස, එකම නිෂ්පාදනයක් මෙම ගබඩා වර්ග දෙකම සපයයි, මෙන්ම තුන්වන වර්ගය - මිශ්ර. පහත සඳහන් නියමයන් අදාළ වේ:

    • MOLAP(Multidimensional OLAP) - සවිස්තරාත්මක දත්ත සහ සමස්ථ දෙකම බහුමාන දත්ත ගබඩාවක ගබඩා කර ඇත. මෙම අවස්ථාවෙහිදී, බහුමාන දත්ත සම්පූර්ණයෙන්ම සම්බන්ධතා දත්ත අඩංගු වන බැවින්, විශාලතම අතිරික්තය ලබා ගනී.
    • ROLAP(Relational OLAP) - සවිස්තරාත්මක දත්ත එය මුලින් “ජීවත් වූ” ස්ථානයේ පවතී - සම්බන්ධතා දත්ත ගබඩාවේ; සමස්ථයන් එකම දත්ත ගබඩාවේ විශේෂයෙන් සාදන ලද සේවා වගු වල ගබඩා කර ඇත.
    • HOLAP(දෙමුහුන් OLAP) - සවිස්තරාත්මක දත්ත (සම්බන්ධතා දත්ත ගබඩාවක) පවතින අතර, සමස්ථයන් බහුමාන දත්ත ගබඩාවක ගබඩා කර ඇත.

    මෙම සෑම ක්රමයක්ම එහි වාසි සහ අවාසි ඇති අතර කොන්දේසි මත පදනම්ව භාවිතා කළ යුතුය - දත්ත පරිමාව, සම්බන්ධතා DBMS බලය, ආදිය.

    බහුමාන ව්‍යුහවල දත්ත ගබඩා කිරීමේදී හිස් අගයන් ගබඩා කිරීම නිසා "බ්ලොට්" හි විභව ගැටළුවක් පවතී. සියල්ලට පසු, බහුමාන අරාවක ඉඩ ප්‍රමාණයේ සියලුම සංයෝජන සඳහා වෙන් කර ඇත්නම්, නමුත් ඇත්ත වශයෙන්ම පුරවා ඇත්තේ කුඩා කොටසක් පමණි (උදාහරණයක් ලෙස, නිෂ්පාදන ගණනාවක් අලෙවි කරනු ලබන්නේ කලාප කුඩා සංඛ්‍යාවක පමණි), එවිට බොහෝ අවකාශය අල්ලාගෙන සිටියද ඝනකයක් හිස් වනු ඇත. නවීන OLAP නිෂ්පාදන මෙම ගැටලුව සමඟ සාර්ථකව කටයුතු කළ හැකිය.

    ඉදිරියට පැවැත්වේ. අනාගතයේ දී, අපි ප්රමුඛ නිෂ්පාදකයින් විසින් නිෂ්පාදනය කරනු ලබන විශේෂිත OLAP නිෂ්පාදන ගැන කතා කරමු.

    04/07/2011 ඩෙරෙක් කොමින්ගෝර්

    ඔබ තාක්‍ෂණයට සම්බන්ධ ඕනෑම ක්ෂේත්‍රයක වැඩ කර ඇත්නම්, ඔබ "කියුබ්" යන යෙදුම අසා ඇති; කෙසේ වෙතත්, බොහෝ සාමාන්‍ය දත්ත සමුදා පරිපාලකයින් සහ සංවර්ධකයින් මෙම වස්තූන් සමඟ වැඩ කළේ නැත. Cubes බහුමාන තොරතුරු ඉක්මනින් එකතු කිරීම සඳහා ප්‍රබල දත්ත නිර්මාණ ශිල්පයක් සපයයි. ඔබේ සංවිධානයට විශාල දත්ත පරිමාවක් විශ්ලේෂණය කිරීමට අවශ්‍ය නම්, එසේ නම් කදිම විසඳුමක්එය ඝනකයක් වනු ඇත

    ඝනකයක් යනු කුමක්ද?

    කාර්ය සාධනය සහ දත්ත අඛණ්ඩතාව පවත්වා ගනිමින් සමගාමී ගනුදෙනු දහස් ගණනක් හැසිරවීමට සම්බන්ධතා දත්ත සමුදායන් නිර්මාණය කර ඇත. සැලසුම් අනුව, විශාල දත්ත ප්‍රමාණයක් එකතු කිරීමට සහ සෙවීමේදී සම්බන්ධතා දත්ත සමුදායන් කාර්යක්ෂම නොවේ. විශාල දත්ත ප්‍රමාණයක් එකතු කිරීමට සහ ආපසු ලබා දීමට, සම්බන්ධක දත්ත ගබඩාවකට කුලක පාදක විමසුමක් ලැබිය යුතුය, ඒ සඳහා තොරතුරු පියාසර කරන විට එකතු කර එකතු කරනු ලැබේ. එවැනි සම්බන්ධතා විමසීම් ඉතා මිල අධික වන්නේ ඒවා බහු සම්බන්ධ කිරීම් මත රඳා පවතින බැවිනි සමස්ථ කාර්යයන්; විශාල දත්ත ප්‍රමාණයක් සමඟ වැඩ කරන විට සමූහ සම්බන්ධතා විමසුම් විශේෂයෙන් අකාර්යක්ෂමයි.

    කියුබ් යනු සාපේක්ෂ දත්ත සමුදායේ මෙම අඩුපාඩුව විසඳීම සඳහා නිර්මාණය කර ඇති බහුමාන ආයතන වේ. ඝනකයක් භාවිතා කිරීමෙන්, ඔබට විශාල එකතු කිරීමේ පරිමාවක් සහිත විමසුම් සඳහා වේගවත් ප්‍රතිචාරයක් සපයන දත්ත ව්‍යුහයක් පරිශීලකයින්ට ලබා දිය හැක. කියුබ් මෙම “එකතු කිරීමේ මැජික්” සිදු කරන්නේ පළමුව බහු මානයන් හරහා දත්ත (මාන) එකතු කිරීමෙනි. ඝනකයේ පූර්ව එකතු කිරීම සාමාන්යයෙන් සැකසීමේදී සිදු කෙරේ. ඔබ ඝනකයක් සකසන විට, ඔබ තැටියේ ද්විමය ආකාරයෙන් ගබඩා කර ඇති පූර්ව පරිගණිත දත්ත එකතු කිරීම් නිෂ්පාදනය කරයි.

    කියුබ් යනු කේන්ද්‍රීය දත්ත ව්‍යුහයයි මෙහෙයුම් පද්ධතිය SQL Server Analytical Services (SSAS) OLAP දත්ත විශ්ලේෂණය. කියුබ් සාමාන්‍යයෙන් ගොඩනගා ඇත්තේ මාන ආකෘතියක් ලෙස හැඳින්වෙන යටින් පවතින සම්බන්ධතා දත්ත ගබඩාවකින් වන නමුත් ඒවා වෙනම තාක්ෂණික ආයතන වේ. තාර්කිකව, ඝනකයක් යනු මානයන් (මාන) සහ මිනුම් (මිනුම්) වලින් සමන්විත දත්ත ගබඩාවකි. මානයන්හි විස්තරාත්මක විශේෂාංග සහ ධූරාවලිය අඩංගු වන අතර මානයන් යනු ඔබ මානයන්හි විස්තර කරන කරුණු වේ. මානයන් මාන කණ්ඩායම් ලෙස හඳුන්වන තාර්කික සංයෝජන වලට කාණ්ඩ කර ඇත. ඔබ ලක්ෂණයක් මත පදනම්ව මිනුම් කණ්ඩායම් වෙත මානයන් සම්බන්ධ කරයි - විස්තරයේ උපාධිය.

    තුල ගොනු පද්ධතියඝනකයක් සම්බන්ධිත ද්විමය ගොනු අනුපිළිවෙලක් ලෙස ක්රියාත්මක වේ. ඝනකයේ ද්විමය ගෘහනිර්මාණ ශිල්පය බහුමාන දත්ත විශාල පරිමාවක් ඉක්මනින් ලබා ගැනීමට පහසුකම් සපයයි.

    මම සඳහන් කළේ කියුබ් ගොඩනඟා ඇත්තේ මාන ආකෘතියක් ලෙස හැඳින්වෙන යටින් පවතින සම්බන්ධතා දත්ත ගබඩාවකින් බවයි. මාන ආකෘතිය එය ඝනක ආයතනවලට සම්බන්ධ කරන සම්බන්ධතා වගු (කරුණු සහ මානය) අඩංගු වේ. කරුණු වගු වල විකුණන ලද භාණ්ඩයක ප්‍රමාණය වැනි මානයන් අඩංගු වේ. මාන වගු නිෂ්පාදන නම්, දිනයන් සහ සේවක නම් වැනි විස්තරාත්මක ගුණාංග ගබඩා කරයි. සාමාන්‍යයෙන්, කරුණු වගු සහ මාන වගු සම්බන්ධ වන්නේ ප්‍රාථමික ආගන්තුක යතුරු සීමාවන් හරහා වන අතර, කරුණු වගුවේ පිහිටා ඇති විදේශීය යතුරු සමඟ (මෙම සම්බන්ධතා සම්බන්ධතාවය ඉහත සාකච්ඡා කර ඇති කියුබ් කැටිති ගුණාංගයට සම්බන්ධ වේ). මාන වගු සෘජුව කරුණු වගුවකට සම්බන්ධ කළ විට, තරු ක්‍රමය සෑදේ. මාන වගු සත්‍ය වගුවකට සෘජුව සම්බන්ධ නොකළ විට, ප්‍රතිඵලය වන්නේ හිම පියලි ක්‍රමයකි.

    මාන ආකෘති යෙදුම අනුව වර්ගීකරණය කර ඇති බව කරුණාවෙන් සලකන්න. දත්ත ගබඩාවක් යනු විකුණුම් හෝ ඉන්වෙන්ටරි කළමනාකරණය වැනි තනි ව්‍යාපාර ක්‍රියාවලියක් සඳහා නිර්මාණය කර ඇති මාන ආකෘතියකි. දත්ත ගබඩාවක් යනු හරස් ව්‍යාපාර ක්‍රියාවලි විශ්ලේෂණ සඳහා පහසුකම් සැලසෙන පරිදි සංරචක ව්‍යාපාර ක්‍රියාවලීන් ග්‍රහණය කර ගැනීම සඳහා නිර්මාණය කර ඇති මාන ආකෘතියකි.

    මෘදුකාංග අවශ්යතා

    දැන් ඔබට කියුබ් යනු මොනවාද සහ ඒවා වැදගත් වන්නේ ඇයිද යන්න පිළිබඳ මූලික අවබෝධයක් ඇති බැවින්, මම ගියර් ක්‍රියාත්මක කර SSAS භාවිතයෙන් ඔබේ පළමු කියුබය තැනීමේ පියවරෙන් පියවර චාරිකාවකට ඔබව රැගෙන යන්නෙමි. මූලික සංරචක කිහිපයක් තිබේ මෘදුකාංග, ඔබට අවශ්‍ය වනු ඇත, එබැවින් ඔබ ඔබේ පළමු ඝනකය තැනීමට පෙර, ඔබේ පද්ධතිය අවශ්‍යතා සපුරාලන බවට වග බලා ගන්න.

    මගේ උදාහරණ අන්තර්ජාල විකුණුම් ඝනකය AdventureWorksDW 2005 පරීක්ෂණ දත්ත ගබඩාවෙන් ගොඩනගනු ඇත, මම අන්තර්ජාල විකුණුම් දත්ත විශ්ලේෂණය කිරීමට ප්‍රයෝජනවත් වන පරීක්ෂණ දත්ත ගබඩාවේ ඇති වගු වල උප කුලකයකින් පරීක්ෂණ ඝනකය ගොඩනඟමි. රූප සටහන 1 මඟින් දත්ත සමුදා වගු වල මූලික සැකැස්ම පෙන්වයි. මම 2005 අනුවාදය භාවිතා කරන බැවින්, ඔබට SQL Server 2005 හෝ SQL Server 2008 භාවිතා කර මගේ උපදෙස් අනුගමනය කළ හැක.

    Figure 1. Adventure Works අන්තර්ජාල විකුණුම් දත්ත ගබඩාවේ උප කුලකය

    Adventure WorksDW 2005 පුහුණු දත්ත සමුදාය CodePlex වෙබ් අඩවියෙන් සොයා ගත හැක: msftdbprodsamples.codeplex.com. "SQL Server 2005 නිෂ්පාදන නියැදි දත්ත සමුදායන් තවමත් පවතී" යන සබැඳිය සොයා ගන්න (http://codeplex.com/MSFTDBProdSamples/Release/ProjectReleases.aspx?ReleaseId=4004). පුහුණු දත්ත සමුදාය AdventureWorksBI.msi (http://msftdbprodsamples.codeplex.com/releases/view/4004#DownloadId=11755) ගොනුවේ අඩංගු වේ.

    සඳහන් කළ පරිදි, ඔබට SSAS සහ Business Intelligence Development Studio (BIDS) සංරචක ඇතුළුව SQL Server 2008 හෝ 2005 සඳහා ප්‍රවේශය තිබිය යුතුය. මම SQL Server 2008 භාවිතා කරමි, එබැවින් ඔබ SQL Server 2005 භාවිතා කරන්නේ නම් ඔබට සියුම් වෙනස්කම් දැකිය හැක.

    SSAS ව්‍යාපෘතියක් නිර්මාණය කිරීම

    ඔබ කළ යුතු පළමු දෙය නම් ලංසු භාවිතා කර SSAS ව්‍යාපෘතියක් නිර්මාණය කිරීමයි. ආරම්භක මෙනුවේ සහ පසුව මෙනුවේ BIDS සොයන්න Microsoft SQL Server 2008/2005 උප අයිතම SQL Server ව්‍යාපාර බුද්ධි සංවර්ධන චිත්‍රාගාරය. මෙම බොත්තම ක්ලික් කිරීමෙන් පෙරනිමි ස්ප්ලෑෂ් තිරය සමඟ BIDS දියත් කෙරේ. නිර්මාණය කරන්න නව ව්යාපෘතියගොනුව, නව, ව්‍යාපෘතිය තේරීමෙන් SSAS. ඔබට නව ව්‍යාපෘති සංවාද කොටුව පෙනෙනු ඇත, එය රූප සටහන 1 මඟින් විශ්ලේෂණ සේවා ව්‍යාපෘති ෆෝල්ඩරය තෝරන්න සහ ව්‍යාපෘති විස්තරය SQLMAG_MyFirstCube ලෙස සකසන්න. හරි ක්ලික් කරන්න.

    ව්යාපෘතිය නිර්මාණය කළ පසු, Solution Explorer හි එය මත දකුණු-ක්ලික් කර තෝරන්න සන්දර්භය මෙනුවදේපල අයිතමය. දැන් SQLMAG_MyFirstCube: Property Pages සංවාද කොටුවේ වම් පැත්තේ යෙදවුම් කොටස තෝරන්න සහ ඉලක්කගත සේවාදායකය සහ දත්ත සමුදාය සැකසීම් සමාලෝචනය කරන්න, ඔබ බෙදා හරින ලද SQL සේවාදායක පරිසරයක වැඩ කරන්නේ නම්, ඔබට සුදුසුකම් ලැබිය යුතුය ඔබ යෙදවීමට යන සේවාදායකයේ නම සහිත ඉලක්ක සේවාදායක දේපල. මෙම SSAS ව්‍යාපෘතිය සඳහා යෙදවීමේ සිටුවම් ගැන ඔබ සතුටු වන විට හරි ක්ලික් කරන්න.

    දත්ත මූලාශ්රය නිර්වචනය කිරීම

    ඔබ නිර්මාණය කිරීමට අවශ්ය පළමු වස්තුව දත්ත මූලාශ්රය වේ. දත්ත මූලාශ්‍ර වස්තුවක් ඝනකයට සම්බන්ධ සහ එහි පාදයේ ඇති වස්තූන් තැනීමට භාවිතා කරන ක්‍රම සහ දත්ත සපයයි. BIDS හි දත්ත මූලාශ්‍ර වස්තුවක් සෑදීමට, Source Wizard භාවිතා කරන්න දත්තමූලාශ්ර විශාරද.

    Solution Explorer පැනලයේ ඇති දත්ත මූලාශ්‍ර ෆෝල්ඩරය මත දකුණු-ක්ලික් කර නව දත්ත මූලාශ්‍රය තේරීමෙන් දත්ත මූලාශ්‍ර විශාරද ආරම්භ කරන්න. ලංසු තුළ SSAS වස්තූන් නිර්මාණය කිරීම සංවර්ධන ස්වභාවයක් ඇති බව ඔබට පෙනී යනු ඇත. විශාරදයා මුලින්ම ඔබව වස්තු නිර්මාණය කිරීමේ ක්‍රියාවලිය සහ සාමාන්‍ය සැකසුම් හරහා ගෙන යයි. එවිට ඔබ නිර්මාණකරු තුළ ඇති SSAS වස්තුව විවෘත කර අවශ්‍ය නම් එය විස්තරාත්මකව අභිරුචිකරණය කරන්න. ඔබ විමසුම් තිරය පසු කළ පසු, නව බොත්තම ක්ලික් කිරීමෙන් නව දත්ත සම්බන්ධතාවයක් නිර්වචනය කරන්න. ඔබට අවශ්‍ය එක වෙත යොමු කරමින් Native OLEDB\SQL Server Native Client 10 මත පදනම්ව නව සම්බන්ධතාවයක් තෝරා සාදන්න SQL සේවාදායකයඅපේක්ෂිත දත්ත සමුදා අවස්ථාව හිමි සේවාදායකය. ඔබගේ SQL Server පරිසර සැකසුම් මත පදනම්ව ඔබට Windows හෝ SQL Server සත්‍යාපනය භාවිතා කළ හැක. ඔබ දත්ත සමුදා සම්බන්ධතාවය නිවැරදිව හඳුනාගෙන ඇති බව සහතික කිරීමට පරීක්ෂණ සම්බන්ධතා බොත්තම ක්ලික් කරන්න, ඉන්පසු හරි ක්ලික් කරන්න.

    මීළඟට පැමිණෙන්නේ පුද්ගලාරෝපණය තොරතුරු, දත්ත ආශ්‍රය වැනි, SQL සේවාදායක පරිසරය ව්‍යුහගත වී ඇති ආකාරය මත රඳා පවතී. වරප්‍රසාද ණය ගැනීම යනු SSAS විසින් එහි වස්තු සැකසීමේදී රඳා පවතින ආරක්ෂක සන්දර්භයයි. ඔබ ප්‍රාථමික, තනි සේවාදායකයක් (හෝ ලැප්ටොප්) මත ඔබේ යෙදවීම කළමනාකරණය කරන්නේ නම්, මම බොහෝ පාඨකයින් උපකල්පනය කරන පරිදි, ඔබට සරලවම සේවා ගිණුම භාවිතා කරන්න විකල්පය තෝරාගත හැක. Data Source Wizard සම්පූර්ණ කිරීමට Next ක්ලික් කර AWDW2005 දත්ත මූලාශ්‍ර නාමය ලෙස සකසන්න. පරීක්ෂණ අරමුණු සඳහා ඔබට මෙම ක්‍රමය භාවිතා කළ හැකි වීම තරමක් පහසු ය, නමුත් සැබෑ නිෂ්පාදන පරිසරයක එය වඩාත්ම නොවේ හොඳම භාවිතය- සේවා ගිණුමක් භාවිතා කරන්න. වසම සඳහන් කිරීම වඩා හොඳය ගිණුම්දත්ත මූලාශ්‍රය වෙත SSAS සම්බන්ධතා හිමිකම් ණයට ගැනීමට.

    දත්ත මූලාශ්‍ර දසුන

    ඔබ නිර්වචනය කර ඇති දත්ත මූලාශ්‍රය සඳහා, SSAS ඝනක ගොඩනැගීමේ ක්‍රියාවලියේ ඊළඟ පියවර වන්නේ දත්ත මූලාශ්‍ර දසුනක් (DSV) නිර්මාණය කිරීමයි. DSV මඟින් ඔබේ කියුබය යටින් පවතින දත්ත ගබඩාවෙන් බලාපොරොත්තු වන ක්‍රමලේඛය වෙන් කිරීමේ හැකියාව සපයයි. එහි ප්‍රතිඵලයක් වශයෙන්, ඝනකයක් තැනීමේදී යටින් පවතින සම්බන්ධතා ක්‍රමය දිගු කිරීමට DSV භාවිතා කළ හැක. දත්ත මූලාශ්‍ර ක්‍රම ව්‍යාප්ත කිරීම සඳහා DSV හි ප්‍රධාන ලක්ෂණ සමහරක් නම් කරන ලද විමසුම්, වගු අතර තාර්කික සම්බන්ධතා සහ නම් කරන ලද ගණනය කළ තීරු ඇතුළත් වේ.

    අපි ඉදිරියට යමු සහ DSV ෆෝල්ඩරය මත දකුණු-ක්ලික් කර Create New DSV View විශාරද දියත් කිරීමට New Data Source View තෝරන්න. සංවාද කොටුව තුළ, දත්ත මූලාශ්‍රයක් තෝරන්න පියවරේදී, සම්බන්ධතා දත්ත සමුදා සම්බන්ධතාවයක් තෝරා ඊළඟ ක්ලික් කරන්න. FactInternetSales, DimProduct, DimTime, DimCustomer වගු තෝරන්න සහ මෙම වගු ඇතුළත් තීරුව වෙත ගෙන යාමට තනි දකුණු ඊතල බොත්තම ක්ලික් කරන්න. අවසාන වශයෙන්, Next ක්ලික් කර පෙරනිමි නම පිළිගෙන අවසන් ක්ලික් කිරීමෙන් විශාරද සම්පූර්ණ කරන්න.

    මෙම අවස්ථාවේදී, ඔබට Solution Explorer හි Data Source Views ෆෝල්ඩරය යටතේ DSV දසුනක් තිබිය යුතුය. DSV නිර්මාණකරු දියත් කිරීමට නව DSV මත දෙවරක් ක්ලික් කරන්න. රූප සටහන 2 හි පෙන්වා ඇති පරිදි, ඔබ ලබා දී ඇති DSV සඳහා වගු හතරම දැකිය යුතුය.

    දත්ත සමුදා මානයන් නිර්මාණය කිරීම

    මා ඉහත පැහැදිලි කළ පරිදි, මානයන් විස්තර මට්ටමට ඉහලින් එකතු කිරීම සක්‍රීය කිරීමට භාවිතා කරන මානයන් සහ ධුරාවලියේ විස්තරාත්මක ලක්ෂණ සපයයි. දත්ත සමුදා මානයක් සහ ඝනක මානයක් අතර වෙනස අවබෝධ කර ගැනීම වැදගත් වේ: දත්ත සමුදායේ මානයන් ඝනකයේ මානයන් කිහිපයක් සඳහා යටින් පවතින මාන වස්තු සපයන අතර එය ඝනකයක් තැනීමට භාවිතා කරයි.

    දත්ත සමුදාය සහ ඝනක මානයන් "භූමකාමී මානයන්" ලෙස හඳුන්වන සංකල්පයකට අලංකාර විසඳුමක් සපයයි. ඔබට ඝනකයක් තුළ තනි මානයක් කිහිප වතාවක් භාවිතා කිරීමට අවශ්‍ය වූ විට භූමිකා පාදක මානයන් භාවිතා වේ. මෙම කියුබ් අවස්ථාවෙහි දිනය කදිම නිදසුනකි: ඔබ තනි දින මානයක් ගොඩනගා ඔබට සබැඳි විකුණුම් විශ්ලේෂණය කිරීමට අවශ්‍ය සෑම දිනයක් සඳහාම එය එක් වරක් යොමු කරනු ඇත. දින දර්ශන දිනය ඔබ නිර්මාණය කරන පළමු මානය වනු ඇත. Solution Explorer හි Dimensions ෆෝල්ඩරය දකුණු-ක්ලික් කර Dimension Wizard දියත් කිරීමට New Dimension තෝරන්න. පවතින වගුව භාවිතා කරන්න තෝරන්න සහ නිර්මාණ ක්‍රමය තෝරන්න පියවරේ ඊළඟ ක්ලික් කරන්න. Specify Source Information පියවරේදී, ප්‍රධාන වගු පතන ලැයිස්තුවේ DimTime වගුව සඳහන් කර Next ක්ලික් කරන්න. දැන්, Select Dimension Attributes පියවරේදී, ඔබ කාල මානයෙහි ගුණාංග තෝරාගත යුතුය. රූප සටහන 3 පෙන්වා ඇති පරිදි, එක් එක් ගුණාංග තෝරන්න.

    Next ක්ලික් කරන්න. අවසාන පියවර ලෙස, නාම ක්ෂේත්‍රයේ අඳුරු දිනය ඇතුළත් කර Dimension Wizard සම්පූර්ණ කිරීමට Finish ක්ලික් කරන්න. ඔබ දැන් Solution Explorer හි Dimensions ෆෝල්ඩරය යටතේ ඇති නව අඳුරු දින මානය දැකිය යුතුය.

    ඉන්පසු නිෂ්පාදන සහ පාරිභෝගික මානයන් නිර්මාණය කිරීමට Dimension Wizard භාවිතා කරන්න. පෙර පරිදි මූලික මානය නිර්මාණය කිරීමට එම පියවර අනුගමනය කරන්න. Dimension Wizard සමඟ වැඩ කරන විට, Select Dimension Attributes පියවරේ ඇති සියලුම විභව ගුණාංග තෝරා ගැනීමට වග බලා ගන්න. අනෙකුත් සැකසුම් සඳහා පෙරනිමි අගයන් පරීක්ෂණ ඝනක අවස්ථාවක් සඳහා සුදුසු වේ.

    අන්තර්ජාල විකුණුම් කියුබ් නිර්මාණය කිරීම

    දැන් ඔබ දත්ත සමුදා මානයන් සකස් කර ඇති බැවින්, ඔබට කියුබ් තැනීම ආරම්භ කළ හැක. Solution Explorer හි, Cubes ෆෝල්ඩරය දකුණු-ක්ලික් කර Cube Wizard දියත් කිරීමට New Cube තෝරන්න. Select Creation Method කවුළුවෙහි, Use දැනට පවතින වගු විකල්පය තෝරන්න. Select Measure Group Tables පියවරේදී Measure Group සඳහා FactInternetSales වගුව තෝරන්න. ප්‍රවර්ධන යතුර, මුදල් යතුර, විකුණුම් ප්‍රදේශ යතුර සහ ප්‍රතිශෝධන අංක මානයන් තෝරන පියවරෙහි ඇති ප්‍රමාණයන් අසල ඇති කොටු ඉවත් කර ඊළඟ ක්ලික් කරන්න.

    පවතින මානයන් තෝරන්න තිරයේ, පවතින සියලුම දත්ත සමුදා මානයන් කියුබ් මානයන් ලෙස භාවිතා කිරීමට තෝරාගෙන ඇති බව සහතික කර ගන්න. මෙම ඝනකය හැකිතාක් සරලව තැබීමට මා කැමති නිසා, Select New Dimensions පියවරෙහි FactInternetSales මාණය තේරීම ඉවත් කරන්න. FactInternetSales මානය තෝරා ගැනීමෙන්, ඔබ සත්‍ය මානයක් හෝ පරිහානියට පත් වූ මානයක් ලෙස හඳුන්වන දේ නිර්මාණය කරයි. තත්‍ය මානයන් යනු සාම්ප්‍රදායික මාන වගුවකට ප්‍රතිවිරුද්ධව මූලික කරුණු වගුවක් භාවිතයෙන් නිර්මාණය කරන ලද මානයන් වේ.

    විශාරද සම්පූර්ණ කිරීමේ පියවර වෙත යාමට ඊළඟ ක්ලික් කරන්න සහ කියුබ් නාම ක්ෂේත්‍රයේ “මගේ පළමු කියුබ්” ඇතුළත් කරන්න. Create Cube Wizard ක්‍රියාවලිය සම්පූර්ණ කිරීමට Finish බොත්තම ක්ලික් කරන්න.

    ඝනකයක් පුළුල් කිරීම සහ සැකසීම

    දැන් ඔබ පළමු ඝනකය යෙදවීමට සහ සැකසීමට සූදානම්ය. Solution Explorer හි නව කියුබ් නිරූපකය දකුණු-ක්ලික් කර ක්‍රියාවලිය තෝරන්න. අන්තර්ගතය කල් ඉකුත් වී ඇති බව පෙනෙන පණිවිඩ පෙට්ටියක් ඔබට පෙනෙනු ඇත. නව ඝනකය ඉලක්කගත SSAS සේවාදායකය වෙත යෙදවීමට ඔව් ක්ලික් කරන්න. ඔබ ඝනකයක් යොදවන විට ඔබ යවයි XML ගොනුව Analisis (XMLA) සඳහා ඉලක්කගත SSAS සේවාදායකය වෙත, එය සේවාදායකයේම ඝනකයක් නිර්මාණය කරයි. සඳහන් කර ඇති පරිදි, ඝනකයක් සැකසීම මඟින් එහි ද්විමය ප්‍රධාන මූලාශ්‍රයෙන් ලැබෙන දත්ත මෙන්ම ඔබ එකතු කර ඇති අතිරේක පාරදත්ත (කියුබ් මානයන්, මානයන්, සහ සැකසීම්) සමඟ තැටියේ පුරවයි.

    යෙදවීමේ ක්‍රියාවලිය අවසන් වූ පසු, නව ක්‍රියාවලි කියුබ් සංවාද කොටුවක් දිස්වේ. ක්‍රියාවලි ප්‍රගති කවුළුව සමඟ විවෘත වන කියුබ් සැකසීම ආරම්භ කිරීමට ධාවන බොත්තම ක්ලික් කරන්න. සැකසීම සම්පූර්ණ වූ විට, කියුබ් යෙදවීම සහ සැකසීමේ ක්‍රියාවලීන් සම්පූර්ණ කිරීමට වසන්න (සංවාද කොටු දෙකම වැසීමට දෙවරක්) ක්ලික් කරන්න.

    ඔබ දැන් ඔබේ පළමු ඝනකය ගොඩනගා, යොදවා සහ සකසන ලදී. Solution Explorer කවුළුවෙහි එය මත දකුණු-ක්ලික් කර Browse තේරීමෙන් ඔබට මෙම නව ඝනකය නැරඹිය හැක. විවර්තන වගුවේ මැදට මානයන් ඇදගෙන යන්න සහ ඔබේ නව කියුබ් ගවේෂණය කිරීමට පේළි සහ තීරුවලට මාන ගුණාංග. කියුබ් විවිධ එකතු කිරීමේ විමසුම් කෙතරම් ඉක්මනින් ක්‍රියාවට නංවන්නේ දැයි බලන්න. දැන් ඔබට OLAP ඝනකයේ අසීමිත බලය සහ එබැවින් ව්‍යාපාරික වටිනාකම අගය කළ හැකිය.

    ඩෙරෙක් කොමින්ගෝර් ( [ඊමේල් ආරක්ෂිත]) යනු ව්‍යාපාර විශ්ලේෂණ ක්ෂේත්‍රයේ මයික්‍රොසොෆ්ට් හවුල්කාර තත්ත්වය ඇති B.I. හි ජ්‍යෙෂ්ඨ ගෘහ නිර්මාණ ශිල්පියෙකි. SQL Server MVP මාතෘකාව සහ Microsoft සහතික කිහිපයක් ඇත





  • 
    ඉහල