Data Mart چیست؟

Data Mart بر روی یک ناحیه عملکردی واحد از یک سازمان متمرکز است و شامل زیرمجموعه‌ای از داده‌های ذخیره شده در یک Data Warehouse است. با استفاده از data mart ، تیم‌ها می توانند به داده‌ها دسترسی داشته باشند و بینش بیشتری کسب کنند ، زیرا آنها مجبور نیستند وقت خود را صرف جستجو در یک انبار داده پیچیده تر یا جمع آوری داده‌ها از منابع مختلف کنند.

كيسان در این مقاله به بررسی Data Mart در Data Warehouseمیپردازد. با ما همراه باشید.

چرا یک data mart ایجاد کنیم ؟

  • Data Mart به دلیل کاهش حجم داده به افزایش زمان پاسخگویی به کاربر کمک می‌کند.
  • دسترسی آسان به داده‌های درخواستی را فراهم می‌کند.
  • پیاده‌سازی Data mart در مقایسه با Datawarehouse ساده‌تر است. درعین‌حال، هزینه اجرای Data Mart در مقایسه با اجرای یک انبار داده کمتر است.
  • در مقایسه با Data Warehouse، دیتامارت سریع‌تر است. در صورت تغییر در مدل، دیتامارت به دلیل اندازه کوچک‌تر می‌تواند سریع‌تر ساخته شود.
  • داده‌ها پارتیشن‌بندی شده‌اند و اجازه دسترسی بسیار جزئی را می‌دهند.
  • داده‌ها را می‌توان بر روی پلتفرم‌های سخت‌افزاری و نرم‌افزاری مختلف تقسیم‌بندی و ذخیره کرد.

Data Mart

تفاوت Data mart با data lake

Data mart نیز با یکdata lake متفاوت است. data lake به عنوان مخازن مرکزی برای داده‌های خام ، غیر ساختاری ، نیمه ساختاری یا ساختاری که می‌توانند ذخیره شوند ، سپس دسترسی و پردازش شوند، عمل می‌کنند. در زمان تجزیه و تحلیل از schema-on-read استفاده می‌کند. داده‌های آن ممکن است انتخاب نشود ، به این معنی که کیفیت آن تضمین نشده است.

به طور معمو ، دانشمندان داده، توسعه دهندگان داده، مهندسان داده و معماران داده از data lake استفاده می‌کنند. کاربردهای معمول شامل یادگیری ماشین ، تجزیه و تحلیل اکتشافی ، تجزیه و تحلیل عملیاتی ، داده‌های بزرگ ، پروفایل‌سازی و کشف داده‌ها است.

انواعData mart

1.Dependent Data Mart:یک Data mart وابسته از یک انبار داده سازمانی موجود ایجاد می‌شود. این رویکرد از بالا به پایین است که با ذخیره تمام داده‌های کسب و کار در یک مکان مرکزی شروع می‌شود ، سپس استخراج بخش مشخصی از داده‌ها در صورت نیاز برای تجزیه و تحلیل است.
برای تشکیل یک انبار داده ، مجموعه‌ای خاص از داده‌ها جمع آوری می‌شوند (به یک خوشه تبدیل می‌شوند)، بازسازی می‌شوند، سپس به Data mart بارگذاری می‌شوند که در آن می‌توان آن را پرس و جو کرد.

2.Independent data marts:یک data mart مستقل یک سیستم مستقل است که بدون استفاده از انبار داده ایجاد شده است و بر روی یک موضوع یا عملکرد تجاری تمرکز دارد. داده‌ها از منابع داده داخلی یا خارجی (یا هر دو) استخراج می شوند ، پردازش می‌شوند ، سپس به مخزن data mart بارگذاری می‌شوند که در آن ذخیره می‌شود تا زمانی که برای تجزیه و تحلیل کسب و کار مورد نیاز باشد.

طراحی و توسعه Data mart مستقل دشوار نیست. آنها برای دستیابی به اهداف کوتاه مدت مفید هستند اما ممکن است مدیریت آنها،هر کدام با ابزار و منطق ETL خود دشوار شود زیرا نیازهای کسب و کار گسترش می‌یابد و پیچیده‌تر می‌شود.

2.Hybrid data marts:یک Data mart ترکیبی داده‌های یک انبار داده موجود و سایر سیستم‌های منبع عملیاتی را ترکیب می‌کند. این برنامه سرعت و تمرکز کاربر نهایی یک رویکرد از بالا به پایین را با مزایای ادغام سطح سازمانی روش از پایین به بالا ترکیب می‌کند.

مزایای Data mart

  • دیتا مارت شامل زیرمجموعه‌ای از داده‌های کل سازمان هستند. این داده برای گروه خاصی از افراد در یک سازمان ارزشمند است.
  • این یک جایگزین مقرون‌به‌صرفه برای یک انبار داده است که می‌تواند هزینه‌های زیادی که برای ساخت انبار داده می‌شود را از بین ببرد.
  • Data Mart امکان دسترسی سریع‌تر به داده‌ها را فراهم می‌کند.
  • استفاده از Data Mart آسان است زیرا به طور خاص برای نیازهای کاربران طراحی شده است؛ بنابراین یک دیتامارت می‌تواند فرایندهای تجاری را سریع‌تر کند.
  • Data Mart در مقایسه با سیستم‌های Data Warehouse به زمان پیاده‌سازی کمتری نیاز دارد. پیاده‌سازی Data Mart سریع‌تر است زیرا فقط باید زیرمجموعه داده‌ها را متمرکز کنید.

Data Mart

نتیجه‌گیری

Data mart نقش محوری در موفقیت یک اکوسیستم انبار داده دارد. آنها یک رویکرد هدفمند و کارآمد برای مدیریت داده‌ها ارائه می‌دهند ، به سازمان‌ها اجازه می‌دهد تا واحدهای تجاری  را با اطلاعاتی که برای تصمیم گیری استراتژیک نیاز دارند، توانمند کنند. همانطور که کسب و کارها همچنان در پیچیدگی‌های داده‌های بزرگ حرکت می‌کنند، هم‌افزایی بین انبار داده‌ها و Data mart ها بدون شک سنگ بنای پیگیری بینش‌های عملی و مزیت رقابتی خواهد بود.

منابع

https://www.talend.com

بدون دیدگاه

دیدگاهتان را بنویسید