امروزه با افزایش اطلاعات سازمانی و نیاز به تجزیه و تحلیل این اطلاعات برای مشخص نمودن وضعیت و عملکرد سازمان و همینطور جهت پیشبینی و اتخاذ تصمیمات دقیق امری ضروری میباشد و شرکتها و سازمانهای مختلف به این مهم واقف شدهاند. لذا جهت گردآوری و یکپارچهسازی این اطلاعات نیاز به راهاندازی انباره داده میباشد. تیم تحقیقاتی و پژوهشی شرکت هوش تجاری کیسان در این مقاله به روش راهاندازی یک انباره داده پرداخته است.
استخراج و یکپارچهسازی دادههای تراکنشی پایگاههای داده مختلف
یکی از اصول اساسی در راهاندازی انباره داده شناسایی منابع تولید کننده داده سازمان و استخراج دادههای ارزشمند میباشد.
تبدیل دادهها
باتوجه با اینکه دادههای سازمان به مرور زمان و در طی انجام پروژههای مختلف تولید میشود و نسبت به نیاز سازمان در پایگاههای داده مختلف مانند Microsoft Access ، Oracle ، Microsoft SQL Server و … ذخیرهسازی میشوند. همچنین اطلاعات توسط افراد مختلف در طول زمان تغییر شکل میدهند که تبدیل آنها به یک شکل استاندارد و یکسانسازی آنها امری ضروری میباشد.
ایجاد یک پایگاه داده چند بعدی و بارگزاری اطلاعات بروی آن
برخلاف پایگاههای دادهای که از اصول نرمالیزه استفاده میکنند مانند (سیستمهای OLTP) و دارای معماری رابطهای میباشد، طراحی انباره داده نیازی به نرمالیزاسیون ندارد به دلیل تکرار فیلدها در جاهای مختلف رابطه بین جداول کمتر است و این کار باعث افزایش سرعت پردازش و عملیات آماری میشود.
افزایش سرعت گزارشگیری
جهت تحقق این امر نیاز به تولید مقادیر از پیش محاسبه شده میباشد که توسط ابزارهای Microsoft SQL Server Analysis Services بصورت سادهتری انجام میپذیرد که این مرحله را تراکم نیز مینامند . انجام این مرحله بسیار زمانبر میباشد و نیاز به حافظه بالایی بروی سرور میباشد.
بکارگیری یک ابزار گزارش گیری
این مرحله باید توسط سازمان یا شرکت متقاضی تصمیمگیری شود که ابزار گزارشگیری را خریداری یا تولید نماید. البته باید در نظر داشت که هزینه تولید ابزار گزارشگیری بسیار بالاتر از خرید آن میباشد.
ویژگیهای اصلی دادههای انبار داده
به دلیل اجتماع دادهها از منابع مختلف مانند پایگاههای داده و منابع آماری که به لحاظ ساختاری و معنایی متفاوت هستند باید قبل از انجام یکپارچهسازی،استانداردسازی و همگن شوند. مقادیر دادهای باید بصورت صحیح وارد شده و همچنین ذخیرهسازی شوند . از طرفی در تحلیل روند سازمانی وجود دادههای تاریخی امری ضروری میباشد. دادهها در انباره داده بصورت ثابت مورد استفاده قرار میگیرد و فقط توسط اشخاص دارای مجوز میتوان نسبت با اصلاح دادهها اقدام نمود.پس دادهها برای ابزارهای گزارشگیری فقط خواندنی میباشد. دادههایی مانند دادههای فروش وجود دارند که به نام دادههای اشتقاق یافته (ِDerived Data)معرفی میشوند و بصورت صریح ذخیرهسازی نمیشوند و در حین بعضی عملیاتها ایجاد میشوند.
سیستمهای انباره داده (Data Warehouse)
سیستم انباره داده شامل دو بخش اصلی میشود:
-
انباره داده
انباره دادهها بخش مرکزی DWS را تشکیل میدهند.گاهی اوقات Data Mart ( حجم زیادی از اطلاعات در واحدهای منطقی کوچک) در انباره داده نگهداری میشوند.
-
مولفههایی که برای ساخت و دستیابی و نگهداری DWH استفاده میشوند:
مولفه آمادهسازی: این مولفهها مسئول دریافت دادهها میباشد که شامل برنامههایی است که دادهها را از منابع عملیاتی استخراج میکنند.
مولفههای دستیابی : برنامههای کاربردی مختلف که امکان استفاده از اطلاعات ذخیره شده در انباره داده را فراهم میکند شامل میشود.
Data Mart یا فرا داده: دادههای هستند که مفهوم دادهها را توصیف میکنند و انواع مختلف آن در انبار دادهها وجود دارد.
برای مثال:
- اطلاعاتی درباره ساختار دادههای موجود در DWH
- کارهایی که در حین ساخت، نگهداری و دستیابی به DWH انجام میپذیرد.
- منابع عملیاتی
نمونههایی از فرا دادهها هستند بنابراین نیاز به Data Martها در DWH ضروری میباشد.
انواع روشهای طراحی انباره دادهها امکان پردازش بهینه Query را بروی حجم زیادی از دادهها فراهم میکنند . نوع ویژهای از الگوی پایگاهداده Star نام دارد که در زمینه مدلسازی انبار دادههای چند بعدی کاربرد دارد . الگوی Star پایگاه دادهها از جداول مرکزی واقعیت(Fact) شامل میشود و جداول چند بعدی را تشکیل میدهد.
جدول واقعیت شامل Tableهایی است که نشان دهنده واقعیتهای کسب و کار مانند فروش یا عرضه هستند و همچنین هر Table جدول واقعیت به Tableهای جدول چند بعدی اشاره دارد.Tableهای جدول چند بعدی نشان دهنده فروشنده ، مشتریان ، محصولات و زمان است.
[…] مرکز فرآیند مدیریت دادهها در دهه 1980 تقویت کرد. ایده انبار داده در اواخر دهه 1980 شکل گرفت و پذیرندگان اولیه این مفهوم در […]
[…] را ساده میکند. برای آشنایی بیشتر با انبار داده و طراحی و پیاده سازی آن به مقاله مربوطه مراجعه […]