در ادامه مقاله قبل با عنوان «سلسله مراتب در Data Analysis » (شرکت هوش تجاری کیسان www.keysun-co.com ) در این مقاله قصد داریم به بررسی دقیقتر ابعاد در Data Analysis بپردازیم.

برای کمک به فهم بهتر ابعاد، جدول مربوط به فروش ماهانه شرکت Adventure Works را به خاطر بیاورید. در این گزارش، مجموع مقدار فروش توسط اعضای ویژگی ماه، تقسیم شده است. تعداد ماه ها _۴_ تعداد مقادیر این گزارش را تعیین میکند. این شبیه محاسبه مسافت خطی در دنیای فیزیکی است: طول خط برابر با طول آن می باشد.

Table 1-1 Adventure Works Units sold by month

Apr 2011 Mar 2011 Feb 2011 Jan 2011
۲۵ ۲۷ ۱۴ ۴

جدول ۱-۲  گزارش فروش را بر اساس مدل و ماه نشان میدهد در این گزارش، مقادیر فروش ماهانه بوسیله اعضای ویژگی مدل نیز تقسیم بندی شده اند. تعداد احتمالی مقادیر گزارش برابر است با تعداد اعضای ویژگی مدل ضرب در تعداد اعضای ویژگی ماه، بنابراین میدانید که باید حدود ۱۲ مقدار در این گزارش داشته باشید. این مشابه محاسبه مساحت مستطیل در دنیای فیزیکی می باشد، این گزارش نیز به صورت مستطیل به نظر می آید.

Table 1-2 Adventure Works Units sold by model and month

Apr 2011 Mar 2011 Feb 2011 Jan 2011
۶ ۶ ۸ ۳ Mountain-500
۱۶ ۱۵ Road-750
۳ ۶ ۶ ۱ Hitch Rack

مقایسه با مستطیل تنها براساس نحوه محاسبه تعداد مقادیر موجود در گزارش می باشد نه از نظر شکل گزارش. به راحتی می توانید گزارش خود را مجدد با قرار دادن ویژگی ماه در سطرها طراحی کنید که مشابه جدول زیر می شود.

Table 1-3 Adventure Works Units sold by Model and Month

۱ Jan 2011 Hitch Rack
۶ Feb 2011 Hitch Rack
۶ Mar 2011 Hitch Rack
۳ Apr 2011 Hitch Rack
۳ Jan 2011 Mountain-500
۸ Feb 2011 Mountain-500
۶ Mar 2011 Mountain-500
۶ Apr 2011 Mountain-500
Jan 2011 Road-750
Feb 2011 Road-750
۱۵ Mar 2011 Road-750
۱۶ Apr 2011 Road-750

خواه مقادیر در گزارش شما به صورت مستطیلی مرتب شده باشند مانند شکل ۱-۲، خواه به صورت خطی در شکل ۱-۳، در صورت داشتن ۴ عضو برای ویژگی ماه و سه عضو در ویژگی مدل، احتمال وجود ۱۲ مقدار در گزارش شما وجود دارد، زیرا این تعداد به تعداد عناصر ویژگی ماه و تعداد عناصر ویژگی مدل وابسته است. هر مدل مقدار فروش خود را در هر ماه شامل می شود، حتی اگر  این مقدار صفر باشد.

گزارش جدیدی را درنظر بگیرید. فرض کنید که Adventure Works محصولاتی را در دو ایالت مختلف به فروش می رساند و دوست دارید تعداد هر مدل فروخته شده در هر ایالت را بدانید. همچنین، بعلاوه برای مشاهده این تعداد در ماه، باید یک مقدار جمع شده ای را برای هر ماه داشته باشید. برای ایجاد این گزارش، تحلیلگر شما ویژگی ایالت را به سطر ها اضافه میکند، و ویژگی ماه را با سلسله مراتب ماه جایگزین می کند. گزارش جدید به صورت زیر آماده می شود.

Table 1-4 Adventure Works Units sold by State, Model, and Month

Apr 2011 Mar 2011 Feb 2011 Jan 2011 All Months
۲ ۳ ۴ ۹ Hitch Rack WA
۵ ۵ ۶ ۲ ۱۸ Mountain-500
۱۰ ۹ ۱۹ Road-750
۱ ۳ ۲ ۱ ۷ Hitch Rack OR
۱ ۱ ۲ ۱ ۵ Mountain-500
۶ ۶ ۱۲ Road-750

اکنون گزارش دارای دو عضو برای ویژگی ایالت، سه عضو برای ویژگی مدل و پنج عضو برای سلسله مراتب ماه میباشد. تعداد احتمالی مقادیر برابر است با ۳۰ ، که از حاصلضرب تعداد ایالت ها در تعداد مدل ها در تعداد ماهها بدست می آید. این مشابه محاسبه حجم مکعب در دنیای فیزیکی میباشد: حجم مکعب برابر است با طول ضربدر عرض ضربدر ارتفاع.

واضح است که مقایسه این گزارش با مکعب تنها در محاسبه تعداد مقادیر احتمالی موجود می باشد نه در شکل فیزیکی گزارش. مقادیر در جدول ۱-۴ به صورت مستطیل مرتب شده اند. جدول ۱-۵ سطرها را بدون سلسله مراتب ماه نشان می دهد که در آن همان مقادیر جدول ۱-۳ به صورت خطی مرتب سازی شده اند.

Table 1-5 Adventure Works Units sold by State, Model, and Month

۹ All Months Hitch Rack WA
۱۸ All Months Mountain-500 WA
۱۹ All Months Road-750 WA
۷ All Months Hitch Rack OR
۵ All Months Mountain-500 OR
۱۲ All Months Road-750 OR
Jan 2011 Hitch Rack WA
۲ Jan 2011 Mountain-500 WA
Jan 2011 Road-750 WA
۱ Jan 2011 Hitch Rack OR
۱ Jan 2011 Mountain-500 OR
Jan 2011 Road-750 OR
۴ Feb 2011 Hitch Rack WA
۶ Feb 2011 Mountain-500 WA
Feb 2011 Road-750 WA
۲ Feb 2011 Hitch Rack OR
۲ Feb 2011 Mountain-500 OR
Feb 2011 Road-750 OR
۳ Mar 2011 Hitch Rack WA
۵ Mar 2011 Mountain-500 WA
۹ Mar 2011 Road-750 WA
۳ Mar 2011 Hitch Rack OR
۱ Mar 2011 Mountain-500 OR
۶ Mar 2011 Road-750 OR
۲ Apr 2011 Hitch Rack WA
۵ Apr 2011 Mountain-500 WA
۱۰ Apr 2011 Road-750 WA
۱ Apr 2011 Hitch Rack OR
۱ Apr 2011 Mountain-500 OR
۶ Apr 2011 Road-750 OR

به هر روشی که گزارش را آماده کنید، حالت، مدل و ماه سلسله مراتب ها و ویژگی های مستقل هستند، و مقادیر احتمالی کلی در گزارش برابر است با اعضای اولین ویژگی مستقل (دو ناحیه) ضربدر تعداد اعضای دومین ویژگی مستقل (سه مدل) ضربدر تعداد اعضای سلسله مراتب (۵ ماه).

برای محاسبه طول، مساحت و حجم، طول اشیای ابعاد را در هم ضرب می کنیم. برای محاسبه تعداد مقادیر احتمالی در گزارش، تعداد اعضای ویژگی های مستقل و سلسله مراتب ها را در هم ضرب می کنیم. ویژگی های مستقل و سلسله مراتب ها ابعاد گزارش می باشند، بنابراین توسعه دهندگان هوش تجاری اصطلاح بعد(Dimension) را از ریاضی قرض گرفته اند. ابعاد شامل ویژگی ها و سلسله مراتب ها هستند. برای مثال، گزارش جدول ۱-۴ ویژگی (Attribute) ناحیه را نشان می دهد که به بعد مناطق جغرافیایی (Dim Geography) ، و ویژگی سلسله مراتبی ماه به بعد تاریخ تعلق دارد. هر چند که اصطلاح بعد از ریاضیات قرض گرفته شده است، لازم است توجه داشته باشید که تحلیل ابعاد دیتا با ابعاد فیزیکی متفاوت است. استفاده از اصطلاح بعد به نحوه قرارگیری سلسله مراتب ها و ویژگی ها در یک گزارش یا حتی به اینکه چطور دیتای چند بعدی باید در پایگاه داده ذخیره شود اشاره ای ندارد.

یک بعد ممکن است شامل بیش از یک ویژگی باشد، اما هر بعد تنها و تنها یک ستون ویژگی کلیدی ( Key Attribute ). دیگر ویژگی ها که به Key Attribute مربوط هستند به بعد مشابهی تعلق دارند. به دلیل اینکه ویژگی ها به ابعاد تعلق دارند، اعضای ویژگی ها، اعضای ابعاد نیز می باشند. بنابراین برای مثال ستون Product

 Key Attribute بعد Product می باشد. اگر یک مقدار از ستون Product را بدانید، ویژگی های مدل، رنگ و سایز را نیز خواهید دانست، بنابراین این ویژگی ها نیز به بعد Product تعلق دارند. Silver یک عضو ویژگی رنگ و ۴۸ نیز عضو ویژگی سایز می باشد، بنابراین Silver و ۴۸ نیز هر دو از اعضای بعد محصول می باشند.

همچنین ابعاد شامل سلسله مراتب ها نیز هستند. همانطور که در مقاله قبل ( سلسله مراتب ها در Data Analysis ) به آن پرداختیم سلسله مراتب ها با مرتب سازی ویژگی ها در سطوح مختلف بوجود می آیند. ویژگی های استفاده شده برای ایجاد سلسله مراتب ها باید در یک بعد باشند.

در دنیای فیزیکی، شیئ مورد نظر شما بسته به تعداد ابعاد تغییر می کند. برای مثال، یک شیئ یک بعدی یک خط، یک شیئ دو بعدی یک مربع و یک شیئ سه بعدی یک مکعب است. یک مکعب یک شیئ کاملا متفاوت از یک شیئ مربع و یک شیئ خطی می باشد. در دنیای گزارش سازی اضافه کردن یک بعد یک راه مستقل برای ریز کردن مقادیر می باشد.

پاسخ دهید