در این مقاله قصد داریم به بررسی دقیقتر ابعاد در Data Analysis بپردازیم.
برای کمک به فهم بهتر ابعاد، جدول مربوط به فروش ماهانه شرکت Adventure Works را به خاطر بیاورید. Data Analysis
در این گزارش، مجموع مقدار فروش توسط اعضای ویژگی ماه، تقسیم شده است. تعداد ماه ها _4_ تعداد مقادیر این گزارش را تعیین میکند. این شبیه محاسبه مسافت خطی در دنیای فیزیکی است: طول خط برابر با طول آن می باشد.
Table 1-1 Adventure Works Units sold by month
Apr 2011 | Mar 2011 | Feb 2011 | Jan 2011 |
25 | 27 | 14 | 4 |
جدول 1-2 گزارش فروش را بر اساس مدل و ماه نشان میدهد در این گزارش، مقادیر فروش ماهانه بوسیله اعضای ویژگی مدل نیز تقسیم بندی شده اند.
تعداد احتمالی مقادیر گزارش برابر است با تعداد اعضای ویژگی مدل ضرب در تعداد اعضای ویژگی ماه، بنابراین میدانید که باید حدود 12 مقدار در این گزارش داشته باشید. این مشابه محاسبه مساحت مستطیل در دنیای فیزیکی می باشد، این گزارش نیز به صورت مستطیل به نظر می آید.
Table 1-2 Adventure Works Units sold by model and month
Apr 2011 | Mar 2011 | Feb 2011 | Jan 2011 | |
6 | 6 | 8 | 3 | Mountain-500 |
16 | 15 | Road-750 | ||
3 | 6 | 6 | 1 | Hitch Rack |
مقایسه با مستطیل تنها براساس نحوه محاسبه تعداد مقادیر موجود در گزارش می باشد نه از نظر شکل گزارش. Data Analysis
به راحتی می توانید گزارش خود را مجدد با قرار دادن ویژگی ماه در سطرها طراحی کنید که مشابه جدول زیر می شود.
Table 1-3 Adventure Works Units sold by Model and Month
1 | Jan 2011 | Hitch Rack |
6 | Feb 2011 | Hitch Rack |
6 | Mar 2011 | Hitch Rack |
3 | Apr 2011 | Hitch Rack |
3 | Jan 2011 | Mountain-500 |
8 | Feb 2011 | Mountain-500 |
6 | Mar 2011 | Mountain-500 |
6 | Apr 2011 | Mountain-500 |
Jan 2011 | Road-750 | |
Feb 2011 | Road-750 | |
15 | Mar 2011 | Road-750 |
16 | Apr 2011 | Road-750 |
خواه مقادیر در گزارش شما به صورت مستطیلی مرتب شده باشند مانند شکل 1-2، خواه به صورت خطی در شکل 1-3، در صورت داشتن 4 عضو برای ویژگی ماه و سه عضو در ویژگی مدل، احتمال وجود 12 مقدار در گزارش شما وجود دارد، زیرا این تعداد به تعداد عناصر ویژگی ماه و تعداد عناصر ویژگی مدل وابسته است. هر مدل مقدار فروش خود را در هر ماه شامل می شود، حتی اگر این مقدار صفر باشد.
گزارش جدیدی را درنظر بگیرید.Data Analysis
فرض کنید که Adventure Works محصولاتی را در دو ایالت مختلف به فروش می رساند و دوست دارید تعداد هر مدل فروخته شده در هر ایالت را بدانید. همچنین، بعلاوه برای مشاهده این تعداد در ماه، باید یک مقدار جمع شده ای را برای هر ماه داشته باشید. برای ایجاد این گزارش، تحلیلگر شما ویژگی ایالت را به سطر ها اضافه میکند، و ویژگی ماه را با سلسله مراتب ماه جایگزین می کند. گزارش جدید به صورت زیر آماده می شود.
Table 1-4 Adventure Works Units sold by State, Model, and Month
Apr 2011 | Mar 2011 | Feb 2011 | Jan 2011 | All Months | ||
2 | 3 | 4 | 9 | Hitch Rack | WA | |
5 | 5 | 6 | 2 | 18 | Mountain-500 | |
10 | 9 | 19 | Road-750 | |||
1 | 3 | 2 | 1 | 7 | Hitch Rack | OR |
1 | 1 | 2 | 1 | 5 | Mountain-500 | |
6 | 6 | 12 | Road-750 |
اکنون گزارش دارای دو عضو برای ویژگی ایالت، سه عضو برای ویژگی مدل و پنج عضو برای سلسله مراتب ماه میباشد.
تعداد احتمالی مقادیر برابر است با 30 ، که از حاصلضرب تعداد ایالت ها در تعداد مدل ها در تعداد ماهها بدست می آید. این مشابه محاسبه حجم مکعب در دنیای فیزیکی میباشد: حجم مکعب برابر است با طول ضربدر عرض ضربدر ارتفاع.
واضح است که مقایسه این گزارش با مکعب تنها در محاسبه تعداد مقادیر احتمالی موجود می باشد نه در شکل فیزیکی گزارش.
مقادیر در جدول 1-4 به صورت مستطیل مرتب شده اند. جدول 1-5 سطرها را بدون سلسله مراتب ماه نشان می دهد که در آن همان مقادیر جدول 1-3 به صورت خطی مرتب سازی شده اند.
Table 1-5 Adventure Works Units sold by State, Model, and Month
9 | All Months | Hitch Rack | WA |
18 | All Months | Mountain-500 | WA |
19 | All Months | Road-750 | WA |
7 | All Months | Hitch Rack | OR |
5 | All Months | Mountain-500 | OR |
12 | All Months | Road-750 | OR |
Jan 2011 | Hitch Rack | WA | |
2 | Jan 2011 | Mountain-500 | WA |
Jan 2011 | Road-750 | WA | |
1 | Jan 2011 | Hitch Rack | OR |
1 | Jan 2011 | Mountain-500 | OR |
Jan 2011 | Road-750 | OR | |
4 | Feb 2011 | Hitch Rack | WA |
6 | Feb 2011 | Mountain-500 | WA |
Feb 2011 | Road-750 | WA | |
2 | Feb 2011 | Hitch Rack | OR |
2 | Feb 2011 | Mountain-500 | OR |
Feb 2011 | Road-750 | OR | |
3 | Mar 2011 | Hitch Rack | WA |
5 | Mar 2011 | Mountain-500 | WA |
9 | Mar 2011 | Road-750 | WA |
3 | Mar 2011 | Hitch Rack | OR |
1 | Mar 2011 | Mountain-500 | OR |
6 | Mar 2011 | Road-750 | OR |
2 | Apr 2011 | Hitch Rack | WA |
5 | Apr 2011 | Mountain-500 | WA |
10 | Apr 2011 | Road-750 | WA |
1 | Apr 2011 | Hitch Rack | OR |
1 | Apr 2011 | Mountain-500 | OR |
6 | Apr 2011 | Road-750 | OR |
به هر روشی که گزارش را آماده کنید، حالت، مدل و ماه سلسله مراتب ها و ویژگی های مستقل هستند، و مقادیر احتمالی کلی در گزارش برابر است با اعضای اولین ویژگی مستقل (دو ناحیه) ضربدر تعداد اعضای دومین ویژگی مستقل (سه مدل) ضربدر تعداد اعضای سلسله مراتب (5 ماه).
برای محاسبه طول، مساحت و حجم، طول اشیای ابعاد را در هم ضرب می کنیم. Data Analysis
برای محاسبه تعداد مقادیر احتمالی در گزارش، تعداد اعضای ویژگی های مستقل و سلسله مراتب ها را در هم ضرب می کنیم. ویژگی های مستقل و سلسله مراتب ها ابعاد گزارش می باشند، بنابراین توسعه دهندگان هوش تجاری اصطلاح بعد(Dimension) را از ریاضی قرض گرفته اند. ابعاد شامل ویژگی ها و سلسله مراتب ها هستند.
برای مثال، گزارش جدول 1-4 ویژگی (Attribute) ناحیه را نشان می دهد که به بعد مناطق جغرافیایی (Dim Geography) ، و ویژگی سلسله مراتبی ماه به بعد تاریخ تعلق دارد. هر چند که اصطلاح بعد از ریاضیات قرض گرفته شده است، لازم است توجه داشته باشید که تحلیل ابعاد دیتا با ابعاد فیزیکی متفاوت است. استفاده از اصطلاح بعد به نحوه قرارگیری سلسله مراتب ها و ویژگی ها در یک گزارش یا حتی به اینکه چطور دیتای چند بعدی باید در پایگاه داده ذخیره شود اشاره ای ندارد.
یک بعد ممکن است شامل بیش از یک ویژگی باشد، اما هر بعد تنها و تنها یک ستون ویژگی کلیدی ( Key Attribute ).
دیگر ویژگی ها که به Key Attribute مربوط هستند به بعد مشابهی تعلق دارند. به دلیل اینکه ویژگی ها به ابعاد تعلق دارند، اعضای ویژگی ها، اعضای ابعاد نیز می باشند. بنابراین برای مثال ستون Product
Key Attribute بعد Product می باشد. اگر یک مقدار از ستون Product را بدانید، ویژگی های مدل، رنگ و سایز را نیز خواهید دانست، بنابراین این ویژگی ها نیز به بعد Product تعلق دارند. Silver یک عضو ویژگی رنگ و 48 نیز عضو ویژگی سایز می باشد، بنابراین Silver و 48 نیز هر دو از اعضای بعد محصول می باشند.
همچنین ابعاد شامل سلسله مراتب ها نیز هستند. Data Analysis
همانطور که در مقاله قبل ( سلسله مراتب ها در Data Analysis ) به آن پرداختیم سلسله مراتب ها با مرتب سازی ویژگی ها در سطوح مختلف بوجود می آیند. ویژگی های استفاده شده برای ایجاد سلسله مراتب ها باید در یک بعد باشند.
در دنیای فیزیکی، شیئ مورد نظر شما بسته به تعداد ابعاد تغییر می کند. برای مثال، یک شیئ یک بعدی یک خط، یک شیئ دو بعدی یک مربع و یک شیئ سه بعدی یک مکعب است. یک مکعب یک شیئ کاملا متفاوت از یک شیئ مربع و یک شیئ خطی می باشد. در دنیای گزارش سازی اضافه کردن یک بعد یک راه مستقل برای ریز کردن مقادیر می باشد.
1 دیدگاه