انباره داده و روش طراحی و پیاده سازی آن

امروزه با افزایش اطلاعات سازمانی و نیاز به تجزیه و تحلیل این اطلاعات برای مشخص نمودن وضعیت و عملکرد سازمان و همینطور جهت پیش‌بینی و اتخاذ تصمیمات دقیق امری ضروری می‌باشد و شرکت‌ها و سازمان‌های مختلف به این مهم واقف شده‌اند. لذا جهت گردآوری و یکپارچه‌سازی این اطلاعات نیاز به راه‌اندازی انباره داده می‌باشد. تیم تحقیقاتی و پژوهشی شرکت هوش تجاری کیسان در این مقاله به روش راه‌اندازی یک انباره داده پرداخته است.

استخراج و یکپارچه‌سازی داده‌های تراکنشی پایگاه‌های داده مختلف

 

یکی از اصول اساسی در راه‌اندازی انباره داده شناسایی منابع تولید کننده داده سازمان و استخراج داده‌های ارزشمند می‌باشد.

تبدیل داده‌ها

باتوجه با اینکه داده‌های سازمان به مرور زمان و در طی انجام پروژه‌های مختلف تولید می‌شود و نسبت به نیاز سازمان در پایگاه‌های داده مختلف مانند Microsoft Access ، Oracle  ، Microsoft SQL Server  و … ذخیره‌سازی می‌شوند. همچنین اطلاعات توسط افراد مختلف در طول زمان تغییر شکل می‌دهند که تبدیل آن‌ها به یک شکل استاندارد و یکسان‌سازی آنها امری ضروری می‌باشد.

ایجاد یک پایگاه داده چند بعدی و بارگزاری اطلاعات بروی آن

 ایجاد پایگاه داده چند بعدی

 

برخلاف پایگاه‌های داده‌ای که از اصول نرمالیزه استفاده می‌کنند مانند (سیستم‌های OLTP) و دارای معماری رابطه‌ای می‌باشد، طراحی انباره داده نیازی به نرمالیزاسیون ندارد به دلیل تکرار فیلدها در جاهای مختلف رابطه بین جداول کمتر است و این کار باعث افزایش سرعت پردازش و عملیات آماری می‌شود.

افزایش سرعت گزارش‌گیری

جهت تحقق این امر نیاز به تولید مقادیر از پیش محاسبه شده می‌باشد که توسط ابزارهای Microsoft SQL  Server  Analysis  Services بصورت ساده‌تری انجام می‌پذیرد که این مرحله را تراکم نیز می‌نامند . انجام این مرحله بسیار زمانبر می‌باشد و نیاز به حافظه بالایی بروی سرور می‌باشد.

بکارگیری یک ابزار گزارش گیری

 

ابزارهای گزارش گیری

این مرحله باید توسط سازمان یا شرکت متقاضی تصمیم‌گیری شود که ابزار گزارش‌گیری را خریداری یا تولید نماید. البته باید در نظر داشت که هزینه تولید ابزار گزارش‌گیری بسیار بالاتر از خرید آن می‌باشد.

 

ویژگیهای اصلی داده‌های انبار داده

به دلیل اجتماع داده‌ها از منابع مختلف مانند پایگاه‌های داده و منابع آماری که به لحاظ ساختاری و معنایی متفاوت هستند باید قبل از انجام یکپارچه‌سازی،استانداردسازی و همگن شوند. مقادیر  داده‌ای باید بصورت صحیح وارد شده و همچنین ذخیره‌سازی شوند . از طرفی در تحلیل روند سازمانی وجود داده‌های تاریخی امری ضروری می‌باشد. داده‌ها در انباره داده بصورت ثابت مورد استفاده قرار می‌گیرد و فقط توسط اشخاص دارای مجوز  می‌توان نسبت با اصلاح داده‌ها اقدام نمود.پس داده‌ها برای ابزارهای گزارش‌گیری فقط خواندنی می‌باشد. داده‌هایی  مانند داده‌های فروش وجود دارند که به نام داده‌های اشتقاق یافته (ِDerived Data)معرفی می‌شوند و بصورت صریح ذخیره‌سازی نمی‌شوند و در حین بعضی عملیات‌ها ایجاد می‌شوند.

سیستم‌های انباره داده (Data Warehouse)

انباره داده

سیستم انباره داده شامل دو بخش اصلی می‌شود:

  • انباره داده

انباره داده‌ها بخش مرکزی DWS را تشکیل می‌دهند.گاهی اوقات Data Mart ( حجم زیادی از اطلاعات در واحدهای منطقی کوچک) در انباره داده نگه‌داری می‌شوند.

  • مولفه‌هایی که برای ساخت و دستیابی و نگه‌داری DWH استفاده می‌شوند:

مولفه آماده‌سازی: این مولفه‎ها مسئول دریافت داده‌ها می‌باشد که شامل برنامه‌هایی است که داده‌ها را از منابع عملیاتی استخراج می‌کنند.

مولفه‌های دستیابی : برنامه‌های کاربردی مختلف که امکان استفاده از اطلاعات ذخیره شده در انباره داده را فراهم می‌کند شامل می‌شود.

Data Mart یا فرا داده: داده‌های هستند که مفهوم داده‌ها را توصیف می‌کنند و انواع مختلف آن در انبار داده‌ها وجود دارد.

برای مثال:

  • اطلاعاتی درباره ساختار داده‌های موجود در DWH
  • کارهایی که در حین ساخت، نگه‌داری و دستیابی به DWH انجام می‌پذیرد.
  • منابع عملیاتی

نمونه‌هایی از فرا داده‌ها هستند بنابراین نیاز به Data Martها در  DWH ضروری می‌باشد.

انواع روش‌های طراحی انباره داده‌ها امکان پردازش بهینه Query را بروی حجم زیادی از داده‌ها فراهم می‌کنند . نوع ویژه‌ای از الگوی پایگاه‌داده Star  نام دارد که در زمینه مدل‌سازی انبار داده‌های چند بعدی کاربرد دارد . الگوی Star  پایگاه داده‌ها از جداول مرکزی واقعیت(Fact) شامل می‌شود و جداول چند بعدی را تشکیل می‌دهد.

جدول واقعیت شامل Tableهایی است که نشان دهنده واقعیت‌های کسب و کار مانند فروش یا عرضه هستند و همچنین هر Table جدول واقعیت به Tableهای جدول چند بعدی اشاره دارد.Tableهای جدول چند بعدی نشان دهنده فروشنده ، مشتریان ، محصولات و زمان است.

نوشتهٔ پیشین
پیش‌بینی آینده جهان درباره هوش مصنوعی از زبان مدیرعامل شرکت بنز آقای دیتر زیچه
نوشتهٔ بعدی
مفاهیم انبار داده

2 دیدگاه. دیدگاه تازه ای بنویسید

برای نوشتن دیدگاه باید وارد بشوید.

آخرین مطالب


گوگل با معرفی مدل جدید زبان بزرگ خود (LLM)، Gemini…
گوگل بارد Bard یک چت بات، انقلابی برای هوش مصنوعی…
چگونه یک متخصص BI تبدیل؟ این یک مسیر خطی نیست،…
برنامه Microsoft Power BI خود را به عنوان یک ابزار…
Api‌های POWER BI REST (رابط‎‌های برنامه نویسی برنامه) یک مجموعه…
فهرست