پردازش تحلیلی آنلاین که به اختصار OLAP گفته می شود، تکنولوژی است برای تحلیل پایگاه داده های کسب و کارهای بزرگ و نیز پشتیبانی از تحلیل های پیچیده، که می تواند برای کوئری های تحلیلی پیچیده بدون تاثیر منفی بر سیستم های تراکنشی (OLTP) .

پایگاه داده هایی را که یک کسب و کار برای ذخیره تمامی تراکنش ها و رکورد هایش استفاده می کند را Online Transaction Processing(OLTP) می نامند. این پایگاه داده ها اغلب دارای رکورد هایی می باشند که معمولا یک بار در طول زمان وارد می شوند. اغلب شامل حجم زیادی از اطلاعات هستند که برای سازمان ارزشمند می باشد. پایگاه داده هایی که برای OLTP استفاده می شوند، برای تحلیل طراحی نشده اند. بنابراین، باز یابی پاسخ ها از این پایگاه داده ها به زمان و تلاش زیادی نیاز دارد. سیستم های OLAP جهت کمک به استخراج  اطلاعات هوش تجاری از داده ها به روشی بسیار کارآمد طراحی شده اند. این امر به این دلیل است که پایگاه داده های OLAP بیشتر برای خواندن بهینه شده اند تا نوشتن.

مدل سازی معنایی

یک Data model یک مدل مفهومی است که به بیان معنی عناصر دیتا می پردازد. سازمان ها اغلب برای هر امور اصطلاحات خاص خود را دارند، گاه کلمه مترادف و گاه حتی معنی متفاوتی برای یک اصطلاح خاص به کار می برند. برای مثال یک پایگاه داده موجودی ممکن است یک قطعه تجهیزات را با شناسه دارایی و شماره سریال ردیابی کند، اما یک پایگاه داده فروش می تواند به شماره سریال به عنوان شناسه دارایی مراجعه کند. هیچ روش ساده ای برای ارتباط این مقادیر بدون وجود مدلی برای توضیح روابط وجود ندارد.

مدل سازی معنایی سطحی از انتزاع نسبت به Schema  پایگاه داده را فراهم می کند ، به طوری که کاربران نیازی به دانستن ساختارهای اصلی داده ندارند. این کار را برای کاربران جهت پرس و جو بر روی دیتا راحت تر می کند. همچنین معمولا ستون ها برای فهم بیشتر کاربران تغییر نام پیدا می کنند و بدین ترتیب فهم دیتا واضح تر می شود.

مدل سازی معنایی بیشتر در هوش تجاری و OLAP به نسبت سیستم های OLTP مورد استفاده قرار می گیرد.

دو نوع اولیه از مدل معنایی وجود دارد:

  • Tabular. این مدل از سازه های مدل سازی رابطه ای (مدل، جدول، ستون) استفاده می کند. ذاتا از Metadata را از مدل OLAP (مکعب، ابعاد و مقادیر) به ارث می برد.
  • Multidimensional. از سازه های مدل سازی سنتی OLAP استفاده می کند.( مکعب، ابعاد، مقادیر)

در این مقاله و مقاله بعدی که در سایت ما به آدرس www.Keysun-co.com (شرکت هوش تجاری کیسان) منتشر می شود، قصد داریم مراحل طراحی مکعب OLAP را در SSAS (SQL Server Analysis Services )

بیان کنیم.

مکعب OLAP چیست و چرا به آن نیاز پیدا می کنیم؟

  • یک مکعب OLAP تکنولوژی است که دیتا را با روشی بهینه، جهت پاسخگویی سریع به انواع متنوع و پیچیده Query ها با استفاده از ابعاد (Dimension) ها و مقادیر (Measures). بیشتر مکعب ها (Cube) محاسبات از پیش انجام شده از مقادیر را با ساختار ذخیره سازی ویژه خود برای پاسخگویی سریع به Query ها ذخیره میکنند.
  • گزارشات SSRS و Excel Power Pivot به عنوان نتیجه برای گزارش دهی و تحلیل بوسیله SSAS مورد استفاده قرار می گیرند.
  • SSAS یکی از ابزارهای Microsoft BI برای ایجاد پردازش های تحلیلی به روز و در نهایت Data mining می باشد.
  • ما باید زمانی که عملکرد نکته ای کلیدی محسوب می شود از OLAP Cube استفاده کنیم، تصمیم گیرندگان اصلی شرکت می توانند در هر زمانی از پایگاه داده بزرگ شما آماری از داده ها را بخواهند.
  • ما می توانیم انواع متفاوتی از تحلیل ها را بر روی دیتای ذخیره شده بر روی مکعب به دست آوریم، همچنین این امکان وجود دارد که ساختار Data mining را نیز بر روی دیتا پیاده سازی کنیم که برای تصمیم گیری و پیش بینی بسیار مفید خواهد بود.

تفاوت بین پایگاه داده های OLAP و OLTP

(Online Transaction Processing (OLTP (Online Analytical Processing (OLAP
Designed to support Daily DML Operations of your application Designed to hold historical data for analyses and forecast business needs
Holds daily Latest Transactional Data related to your application Data is consistent up to the last update that occurred in your Cube
Data stored in normalized format Data stored in denormalized format
Databases size is usually around 100 MB to 100 GB Databases size is usually around 100 GB to a few TB
Used by normal users Used by users who are associated with the decision making process, e.g., Managers, CEO.
CPU, RAM, HDD space requirement is less. CPU, RAM, HDD space requirement is higher.
Query response may be slower if the amount of data is very large, it can impact the reporting performance. Query Response is quicker, management can do Trend analysis on their data easily and generate quicker reports.
T-SQL language used for query MDX is used for querying on OLAP Cube

معماری اولیه

در نمونه ما، انبار داده به عنوان یک منبع دیتا برای Cube مورد استفاده قرار میگیرد. یک مکعب با دیتا آماده می شود، کاربران می توانند Query ها را بر روی مکعب ایجاد شده در SSAS اجرا کنند. ابزارهای گزارش ساز SSRS و Excel Pivoting/Power Pivot می توانند از مکعب به عنوان منبع دیتا به جای پایگاه داده های OLTP استفاده کنند.

پاسخ دهید