مدیریت داده فرآیند ذخیره، سازماندهــی و نگهداری دادههای ایجاد شده و جمعآوری شده توسط یک سازمان است. مدیریت موثر دادهها بخش مهمی از استقرار سیستمهای فناوری اطلاعات است که برنامههای تجاری را اجرا میکند و اطلاعات تحلیلــی را برای کمک به تصمیمگیری عملیاتـی و برنامهریزی استراتژیک توسط مدیران شرکتها، مدیران کسب و کار و سایر کاربران نهایی کمک میکند.
فرایند مدیریت داده
فرایند مدیریت دادهها شامل ترکیبی از عملکردهای مختلف است که به طور جمعی هدف آنها اطمینان از صحت، در در دسترس بودن دادههای سیستمهای شرکتی است. بیشتر کارهای مورد نیاز توسط تیمهای مدیریت فناوری اطلاعات و دادهها انجام میشود، اما کاربران تجاری معمولاً در برخی از قسمتهای فرایند شرکت میکنند تا اطمینان حاصل کنند که دادهها نیازهای آنها را برآورده میکنند و آنها را با سیاستهای حاکم بر استفاده از آنها پیادهسازی میکنند.
این بخش از آموزشهای کیسان مدیریت دادهها را بیشتر توضیح میدهد و بینشهایی را در مورد رشتههای فردی، بهترین شیوههای مدیریت دادهها، چالشهایـی که سازمانها با آن روبرو هستند و مزایای تجاری یک استراتژی موفق مدیریت دادهها ارائه میدهد. همچنین نمای کلی ابزارها و تکنیکهای مدیریت دادهها را خواهید یافت. برای مطالعه در مورد روندهای مدیریت داده و دریافت مشاوره تخصصی در مورد مدیریت دادههای شرکت، و هوش تجاری با شماره 88178275-021 تماس حاصل نمایید.
تاریخچــه مدیریت و تحول
اولین شکوفایــی مدیریت دادهها عمدتاً توسط متخصصان فناوری اطلاعات انجام شد که بر حل مشکل زباله در اولین رایانهها متمرکز شده بودند، پس از تشخیص اینکه ماشینها به دلیل نادرست یا ناکافی بودن دادهها به نتایج نادرستی رسیدند. از دهه 1960، گروههای صنعتــی و انجمنهای حرفهای بهترین شیوهها را برای مدیریت دادهها، به ویژه در زمینه آموزش حرفهای و معیارهای کیفیت دادهها، ترویج کردند. پایگاههای داده سلسله مراتبی مبتنی بر پردازنده اصلی نیز در آن دهه در دسترس قرار گرفت.
پایگاه داده رابطهای در دهه 1970 ظاهر شد و سپس جای خود را در مرکز فرآیند مدیریت دادهها در دهه 1980 تقویت کرد. ایده انبار داده در اواخر دهه 1980 شکل گرفت و پذیرندگان اولیه این مفهوم در اواسط دهه 1990 شروع به استقرار انبارهای داده کردند. در اوایل دهه 2000، نرمافزارهای ارتباطی یک فناوری غالب بودند و قفل مجازی روی استقرار پایگاه داده داشتند.
اما نسخه اولیه Hadoop در سال 2006 در دسترس قرار گرفت و پس از آن موتور پردازش Spark و سایر فناوریهای بزرگ داده دنبال شد. طیف وسیعــی از پایگاههای داده NoSQL نیز در همان بازه زمانــی در دسترس قرار گرفت. در حالی که فناوری ارتباطی هنوز بیشترین سهم را دارد، ظهور دادههای بزرگ و جایگزینهای NoSQL و محیطهای جدید دریاچه دادهای که آنها فعال میکنند مجموعه وسیعتری از انتخابهای مدیریت داده را در اختیار سازمانها قرار داده است.
اهمیت مدیریت داده ها
دادهها به طور فزایندهای به عنوان یک دارایــی شرکت محسوب میشوند که میتواند برای تصمیمگیریهای تجاری آگاهانهتر، بهبود کمپینهای بازاریابی، بهینهسازی عملیات تجاری و کاهش هزینهها مورد استفاده قرار گیرد، همه اینها با هدف افزایش درآمد و سود است. اما فقدان مدیریت صحیح دادهها میتواند سازمانها را با سیلوهای دادههای ناسازگار، مجموعه دادههای ناسازگار و مشکلات کیفیت داده که توانایی آنها در اجرای هوش تجاری (BI) و برنامههای تحلیلــی را محدود میکند، یا بدتر از آن، به یافتههای نادرست منجر شود.
مدیریت دادهها نیز از آنجایی که مشاغل مشمول تعداد فزایندهای از الزامات رعایت مقررات از جمله قوانین مربوط به حریم خصوصی و حفاظت از دادهها مانند GDPR و قانون حفظ حریم خصوصی مصرف کنندگان در کالیفرنیا هستند، اهمیت یافته است. علاوه بر این، شرکتها حجم بیشتری از دادهها و انواع بیشتری از انواع دادهها را ضبط میکنند، که هر دو از ویژگیهای سیستمهای داده بزرگ هستند. بدون مدیریت خوب دادهها، چنین محیطهایــی ممکن است سخت و پیمایش ناپذیر شوند.
انواع توابع مدیریت داده
رشتههای جداگانهای که بخشی از فرایند کلی مدیریت داده ها هستند، مجموعهای از مراحل را شامل میشود، از پردازش و ذخیره داده تا مدیریت نحوه قالببندی و استفاده از دادهها در سیستمهای عملیاتـــی و تحلیلی. توسعه معماری دادهها اغلب اولین قدم است، به ویژه در سازمانهای بزرگ با دادههای زیادی برای مدیریت. یک معماری نقشهای برای پایگاههای داده و سایر پلتــفرمهای داده ارائه میدهد، از جمله فنآوریهای خاص برای متناسب با برنامههای فردی.
پایگاههای داده رایجترین پلتفرمــی است که برای نگهداری دادههای شرکت استفاده میشود. آنها حاوی مجموعهای از دادهها هستند که به گونهای سازماندهــی شدهاند که میتوان به آنها دسترسی، به روز و مدیریت کرد. آنها در هر دو سیستم پردازش تراکنش که دادههای عملیاتــی ایجاد میکنند، مانند سوابق مشتری و سفارشات فروش، و انبارهای داده ، که مجموعــه دادههای تلفیقی از سیستمهای تجاری را برای BI و تجزیه و تحلیل ذخیره میکنند، استفاده میشوند.
مدیریت پایگاه داده یک عملکرد اصلی مدیریت داده است. پس از راهاندازی پایگاههای داده، نظارت و تنظیم عملکــرد باید انجام شود تا زمان پاسخگویی قابل قبولی در مورد درخواستهای پایگاه داده که کاربران برای دریافت اطلاعات از دادههای ذخیره شده در آنها انجام میدهند، حفظ شود. سایر وظایف اداری شامل طراحــی پایگاه داده، پیکربندی، نصب و به روز رسانــی میباشد. امنیت دادهها؛ پشتیبانگیری و بازیابی پایگاه داده؛ و استفاده از ارتقاء نرمافزار و وصلههای امنیتی.
توابع مدیریت داده های اصلی
مدیریت داده شامل انواع مختلفــی از عملکردهای مرتبط است. فناوری اولیهای که برای استقرار و مدیریت پایگاههای داده استفاده میشود، سیستم مدیریت پایگاه داده (DBMS) است که نرمافزاری است که به عنوان رابط بین پایگاههای داده تحت کنترل و مدیران پایگاه داده، کاربران نهایی و برنامههای کاربردی که به آنها دسترسی دارند، عمل میکند.
پلتفرمهای جایگزین دادهها برای پایگاههای داده شامل سیستمهای فایل و خدمات ذخیرهسازی شیء ابری است. آنها دادهها را نسبت به پایگاههای داده اصلــی به شیوههای ساختیافتهتری ذخیره میکنند، که انعطافپذیری بیشتری در مورد انواع دادههای قابل ذخیره و نحوه قالببندی آنها ارائه میدهد. در نتیجه، هر چنــد، آنها برای برنامههای معاملاتی مناسب نیستند.
سایر رشتههای اساســی مدیریت داده شامل مدلسازی دادهها است که روابط بین عناصر داده و نحوه جریان دادهها در سیستمها را نمودار میکند. ادغام دادهها، که منابع دادههای مختلف را برای مصارف عملیاتــی و تحلیلی ترکیب میکند. حاکمیت دادهها، که سیاستها و رویههایی را برای اطمینان از سازگاری دادهها در سراسر یک سازمان تعیین میکند. و مدیریت کیفیت داده، که هدف آن رفع خطاها و ناسازگاریهای داده است.
ابزارها و تکنیکهای مدیریت داده ها
طیف گستردهای از فنآوریها، ابزارها و تکنیکها را میتوان به عنوان بخشــی از فرایند مدیریت داده به کار گرفت. این شامل گزینههای موجود زیر برای جنبههای مختلف مدیریت داده ها است.
سیستمهای مدیریت پایگاه داده رایجترین نوع DBMS، سیستم مدیریت پایگاه داده رابطهای است. پایگاههای داده رابطهای، دادهها را به جداول با سطرها و ستونهایی که حاوی سوابق پایگاه داده هستند، سازماندهی میکند. سوابق مرتبط در جداول مختلف را میتوان با استفاده از کلیدهای اصلی و خارجی متصل کرد، و از نیاز به ایجاد ورودیهای داده تکراری جلوگیری کرد.
با این حال، انواع دیگر فناوریهای DBMS به عنوان گزینههای مناسب برای انواع مختلف حجم کار داده شده است. بیشتر آنها به عنوان پایگاههای داده NoSQL طبقهبندی میشوند، که الزامات سختــی را بر مدلهای داده و طرحهای پایگاه داده تحمیل نمیکنند. در نتیجه، آنها میتوانند دادههای بدون ساختار و نیمه ساختار یافته، مانند دادههای حسگــر، سوابق جریان کلی اینترنت و گزارشات شبکه، سرور و برنامه را ذخیره کنند.
چهار نوع اصلــی از سیستمهای NoSQL وجود دارد:
- پایگاه دادههای اسناد که عناصر داده را در ساختارهای سند مانند ذخیره میکند
- پایگاههای داده کلیدی که کلیدهای منحصر به فرد و مقادیر مرتبط را جفت میکند
- فروشگاههای ستون گسترده با جداول که دارای تعداد زیادی ستون هستند
- پایگاه دادههای نمودار که اتصال عناصر داده مرتبط در قالب نمودار را دارند
نام NoSQL به یک نام اشتباه تبدیل شده است، در حالــی که پایگاههای داده NoSQL به SQL متکی نیستند، اکنون بسیاری از عناصر آن را پشتیبانی میکنند و تا حدی سطح مطابقت ACID را ارائه میدهند.
گزینههای اضافی پایگاه داده و DBMS شامل پایگاه دادههای داخل حافظه است که دادهها را به جای دیسک در حافظه سرور ذخیره میکند تا عملکرد I/O را تسریع کند و پایگاههای داده ستونــی که برای برنامههای تجزیه و تحلیل طراحــی شدهاند. پایگاههای داده سلسله مراتبی که بر روی پردازندههای اصلــی اجرا میشوند و قبل از توسعه سیستمهای رابطهای و NoSQL نیز هنوز برای استفاده در دسترس هستند.
کاربران میتوانند پایگاههای داده را در سیستمهای محلــی یا مبتنی بر ابر مستقر کنند. علاوه بر این، فروشندگان مختلف پایگاه داده خدمات مدیریت داده پایگاه داده ابری را ارائه میدهند، که در آن آنها استقرار، پیکربندی و مدیریت پایگاه داده را برای کاربران مدیریت میکنند. مدیریت دادههای بزرگ پایگاه دادههای NoSQL اغلب به دلیل توانایی ذخیره و مدیریت انواع مختلف دادهها در استقرار دادههای بزرگ مورد استفاده قرار میگیرند.
محیطهای داده بزرگ نیز معمولاً بر اساس فناوریهای منبع باز مانند Hadoop، یک چارچوب پردازش توزیع شده با یک سیستم فایل که در مجموعهای از سرورهای کالا اجرا میشود، ایجاد میشوند. پایگاه داده مرتبط آن HBase؛ موتور پردازش جرقه؛ و پلتفرمهای پردازش جریان کافکا، Flink و Storm. به طور فزایندهای، سیستمهای داده بزرگ در ابر استفاده میشوند، با استفاده از ذخیرهسازی اشیاء مانند سرویس ذخیرهسازی ساده آمازون (S3).
انبارهای داده و دریاچههای داده. دو مخزن جایگزیــن برای مدیریت داده های تجزیه و تحلیل، انبارهای داده و دریاچههای داده هستند. ذخیرهسازی دادهها روش سنتیتری است. یک انبار داده معمولاً بر اساس یک پایگاه داده رابطهای یا ستونی است و دادههای ساختار یافتهای را جمعآوری میکند که از سیستمهای عملیاتـی مختلف جمعآوری شده و برای تجزیه و تحلیل آماده شده است.
موارد اصلی استفاده از انبار دادهها عبارتند از:
- پرس و جو BI
- گزارش سازمانی
که تحلیلگران و مدیران تجاری را قادر میسازد تا فروش، مدیریت موجودی و سایر شاخصهای کلیدی عملکرد را تجزیه و تحلیل کنند. انبار دادههای سازمانــی شامل دادههای سیستمهای تجاری در سراسر یک سازمان است. در شرکتهای بزرگ، شرکتهای تابعه و واحدهای تجاری با استقلال مدیریت ممکن است انبارهای داده خود را بسازند. Data marts گزینه دیگری است؛ آنها نسخههای کوچکتری از انبارهای داده هستند که شامل زیر مجموعه دادههای یک سازمان برای بخشها یا گروههای خاصی از کاربران است.
از طرف دیگر، دریاچههای داده، مجموعهای از دادههای بزرگ را برای استفاده در مدل سازی پیشبینی، یادگیری ماشین و سایر برنامههای تجزیه و تحلیل پیشرفته ذخیره میکند. آنها اغلب بر روی خوشههای Hadoop ساخته میشوند، اگرچه استقرار دریاچه داده در پایگاههای داده NoSQL یا ذخیره سازی ابری اشیاء نیز انجام میشود. علاوه بر این، سیستم عاملهای مختلف را میتوان در یک محیط دریاچه توزیع داده ترکیب کرد.
ممکن است دادهها هنگام تجزیه و تحلیل پردازش شوند، اما یک دریاچه داده اغلب حاوی دادههای خام ذخیره شده به همان شکل است. در این مورد، دانشمندان داده و دیگر تحلیلگــران معمولاً کارهای آمادهسازی دادههای خود را برای استفادههای تحلیلی خاص انجام میدهند.
یکپارچهسازی دادهها
پرکاربردترین تکنیک یکپارچهسازی دادهها استخراج، تبدیل و بارگذاری (ETL) است که دادهها را از سیستمهای منبع خارج میکند، آنها را به فرمت ثابت تبدیل میکند و سپس دادههای یکپارچه را در انبار داده یا سیستم هدف دیگر بارگذاری میکند. با این حال، سیستم عاملهای یکپارچهسازی دادهها در حال حاضــر از انواع روشهای دیگر ادغام نیز پشتیبانــی میکنند. که شامل:
- استخراج
- بارگذاری
- تبدیل (ELT)
- تنوعی در ETL
که وقتی دادهها در پلتفرم مورد نظر بارگذاری میشوند، دادهها را به شکل اصلــی خود باقی میگذارد. ELT یک انتخاب رایج برای مشاغل یکپارچهسازی دادهها در دریاچههای داده و سایر سیستمهای داده بزرگ است.
تعریف ETL و ELT
ETL و ELT فرآیندهای یکپارچهسازی دستهای هستند که در فواصل زمانی مشخص اجرا میشوند. تیمهای مدیریت داده همچنین میتوانند یکپارچهسازی دادههای زمان واقعی را با استفاده از روشهایــی مانند تغییر ضبط دادهها، اعمال تغییرات در دادههای پایگاه داده در یک انبار داده یا سایر مخازن و یکپارچهسازی دادههای جریان، که جریان دادههای زمان واقعی را در آنها ادغام میکند، انجام دهند.
به طور مداوم مجازی سازی دادههــا یکی دیگر از گزینههای یکپارچهسازی است. از یک لایه انتزاعی برای ایجاد نمای مجازی از دادههای سیستمهای مختلف برای کاربران نهایی به جای بارگذاری فیزیکــی دادهها در یک انبار داده استفاده میکند.
حاکمیت دادهها، کیفیت دادهها و MDM
حاکمیت دادهها در درجه اول یک فرایند سازمانی است. محصولات نرمافزاری که میتوانند به مدیریت برنامههای حاکمیت داده کمک کنند در دسترس هستند، اما آنها یک عنصر اختیاری هستند. در حالی که برنامههای حکمرانــی ممکن است توسط متخصصان مدیریت داده، مدیریت شود، معمولاً شامل یک شورای حکمرانی دادهها از مدیران تجاری است که به طور جمعی در مورد تعاریف مشترک دادهها و استانداردهای شرکت برای ایجاد، قالببندی و استفاده از دادهها تصمیمگیری میکنند.
یکی دیگر از جنبههای کلیدی ابتکارات حکمرانی، سرپرستی دادهها است که شامل نظارت بر مجموعه دادهها و اطمینان از مطابقت کاربران نهایی با خط مشیهای داده تایید شده است. بسته به اندازه یک سازمان و محدوده برنامه حکمرانی آن، مباشر داده میتواند به صورت تمام وقت یا نیمه وقت باشد. مباشران داده همچنین میتوانند از عملیات تجاری و بخش فناوری اطلاعات باشند. در هر صورت، دانش نزدیک از دادههایــی که آنها تحت نظارت دارند به طور معمول یک پیش نیاز است.
حاکمیت دادهها ارتباط تنگاتنگی با تلاشهای بهبود کیفیت دادهها دارد. معیارهایــی که بهبود کیفیت دادههای یک سازمان را ثبت میکنند، برای نشان دادن ارزش تجاری برنامههای حکمرانــی، مرکزی هستند. تکنیکهای کیفیت داده شامل پروفایل داده است که مجموعه دادهها را برای شناسایی مقادیر دورتر که ممکن است خطا باشند، اسکن میکند. پاکسازی دادهها، همچنین به عنوان scrubbing data معروف است، که با اصلاح یا حذف دادههای بد، خطاهای داده را برطرف میکند. و اعتبار دادهها، که دادهها را با قوانین کیفیت از پیش تعیین شده بررسی میکند.
مدیریت دادههای اصلــی نیز به حکمرانی دادهها و کیفیت دادهها وابسته است، اگرچه MDM به طور گستردهای به عنوان دو عملکرد دیگر مدیریت داده مورد استفاده قرار نگرفته است. این تا حدودی به دلیل پیچیدگی برنامههای MDM است که بیشتر آنها را محدود به سازمانهای بزرگ میکند. MDM یک رجیستری مرکزی از دادههای اصلی برای حوزههای داده انتخاب شده ایجاد میکند. چیزی که اغلب یک رکورد طلایی نامیده میشود.
دادههای اصلی در یک مرکز MDM ذخیره میشود، که دادهها را برای گزارش و تجزیه و تحلیل سازمانــی به سیستمهای تحلیلی هدایت میکند. در صورت تمایل، هاب همچنین میتواند دادههای اصلی به روز شده را به سیستمهای منبع بازگرداند.
مدل سازی داده
مدل سازی دادهها مجموعهای از مدلهای دادهای مفهومی، منطقی و فیزیکــی را ایجاد میکنند که مجموعه دادهها و گردش کار را به صورت تصویری مستند میکند و آنها را برای نیازهای تجاری برای پردازش و تجزیه و تحلیل معاملات ترسیم میکند. تکنیکهای متداول برای مدل سازی دادهها شامل توسعه نمودارهای روابط موجودیت، نگاشت دادهها و طرحوارهها است. علاوه بر این، وقتی دادههای جدید اضافه میشوند یا اطلاعات یک سازمان نیاز به تغییر دارد، مدلهای داده باید به روز شوند.
بهترین شیوههای مدیریت داده
یک برنامه حکمرانی دادهها به خوبی طراحی شده است، جزء مهمی از استراتژیهای موثــر مدیریت دادهها است، به ویژه در سازمانهایــی با محیطهای داده توزیع شده که مجموعه متنوعی از سیستمها را شامل میشوند. تمرکز قوی بر کیفیت دادهها نیز ضروری است. در هر دو مورد، تیمهای فناوری اطلاعات و مدیریت داده نمیتوانند به تنهایی کار خود را انجام دهند. مدیران تجاری و کاربران باید مشارکت داشته باشند تا مطمئن شوند نیازهای داده آنها برآورده شده است و مشکلات کیفیت دادهها تداوم ندارد.
همین امر در مورد پروژههای مدل سازی دادهها نیز صدق میکند. همچنین، بسیاری از پایگاههای داده و دیگر بسترهای داده موجود برای استقرار نیازمند یک رویکرد دقیق هنگام طراحی معماری دادهها و ارزیابی و انتخاب فناوریها هستند. مدیران فناوری اطلاعات و دادهها باید مطمئن باشند سیستمهایــی که پیادهسازی میکنند برای هدف مورد نظر مناسب بوده و قابلیت پردازش دادهها و اطلاعات تجزیه و تحلیل مورد نیاز عملیات تجاری یک سازمان را ارائه میدهند.
DAMA International، سازمان حرفهای حاکمیت دادهها و سایر گروههای صنعتی برای پیشبرد درک رشتههای مدیریت داده و ارائه بهترین راهنماییها تلاش میکنند. به عنوان مثال، DAMA DAMA-DMBOK: Body Management of Knowledge of Body را منتشر کرده است، یک کتاب مرجع که سعی در تعریف یک دیدگاه استاندارد از توابع و روشهای مدیریت داده دارد. این کتاب که معمولاً به عنوان DMBOK نامیده میشود، اولین بار در سال 2009 منتشر شد. نسخه دوم DMBOK2 در سال 2017 منتشر شد.
خطرات و چالشهای مدیریت داده ها
اگر سازمانی از معماری دادهای با طراحی خوب برخوردار نباشد، میتواند به سیستمهای محصور شدهای برسد که ادغام و مدیریت آنها به صورت هماهنگ دشوار است. حتی در بودن محیطهای برنامهریزی شده، دانشمندان و دیگر تحلیلگــران را قادر میسازد تا به دادههای مربوطه دست یابند و به آنها دسترسی پیدا کنند، میتواند یک چالش باشد، به ویژه هنگامــی که دادهها در پایگاههای داده مختلف و سیستمهای داده بزرگ پخش شوند.
برای کمک به دسترسی بیشتر به دادهها، بسیاری از تیمهای مدیریت دادهها کاتالوگهای دادهای را ایجاد میکنند که آنچه در سیستمها موجود است را مستند میکند و معمولاً شامل واژهنامههای تجاری، دیکشنریهای داده مبتنی بر فراداده و سوابق دودمان داده است.
انتقال به ابر میتواند برخی از جنبههای کار مدیریت داده را آسان کند، اما چالشهای جدیدی را نیز ایجاد میکند. به عنوان مثال، مهاجرت به پایگاههای داده ابری و پلتفرمهای کلان داده میتواند برای سازمانهایــی که نیاز به انتقال دادهها و پردازش حجم کار از سیستمهای موجود داخلی دارند، پیچیده باشد. هزینهها یکی دیگــر از مسائل مهم در ابر است. استفاده از سیستمهای ابری و خدمات مدیریت شده باید به دقت کنترل شود تا مطمئن شوید صورتحسابهای پردازش دادهها از میزان بودجه فراتر نمیرود.
بسیاری از تیمهای مدیریت داده در حال حاضر در میان کارکنانی هستند که مسئول حفاظت از امنیت دادههای شرکتها و محدود کردن مسئولیتهای قانونی احتمالی در مورد نقض دادهها یا سوء استفاده از دادهها هستند. مدیران داده باید از رعایت مقررات دولتــی و صنعتی در زمینه امنیت دادهها، حریم خصوصی و استفاده اطمینان حاصل کنند. این امر با تصویب GDPR، قانون حفظ حریم خصوصی دادههای اتحادیه اروپا که در ماه مه 2018 اجرایی شد و قانون حفظ حریم خصوصــی مصرف کنندگان در کالیفرنیا، که در سال 2018 به امضاء رسید و قرار است در ابتدای سال جاری به اجرا در آید، به یک نگرانی فوری تبدیل شده است.
وظایف و نقشهای مدیریت داده
فرآیند مدیریت داده شامل طیف وسیعی از وظایف و مهارتها است. در سازمانهای کوچکتــر با منابع محدود، تک تک کارگران ممکن است چندین نقش را بر عهده بگیرند. اما به طور کلی، متخصصان مدیریت داده شامل معماران داده، مدلسازان داده، مدیران پایگاه داده (DBAs)، توسعه دهندگان پایگاه داده، تحلیلگران(BI) و مهندسان کیفیت دادهها، توسعه دهندگان یکپارچه سازی دادهها، مدیران حاکمیت دادهها، مباشران داده و مهندسین داده هستند که با تیمهای تجزیه و تحلیل همکاری میکنند.
جزئیــات اساسی در مورد حرفه مدیریت داده
دانشمندان داده و دیگر تحلیلگران داده نیز ممکن است برخــی از وظایف مدیریت داده را خود انجام دهند، به ویژه در سیستمهای داده بزرگ با دادههای خام که باید فیلتر شوند و برای مصارف خاص آماده شوند. به همین ترتیب، توسعه دهندگان برنامــه اغلب به استقرار و مدیریت محیطهای کلان داده کمک میکنند، که در مقایسه با سیستمهای پایگاه داده رابطهای به مهارتهای کلی نیاز دارد. در نتیجه، ممکن است سازمانها برای برآوردن نیازهای مدیریت دادههای بزرگ خود مجبور به استخدام کارگران جدید یا آموزش مجدد DBA شوند.
مزایای مدیریت خوب داده ها
یک استراتژی مدیریت داده به خوبی اجرا شده میتواند به شرکتها در دستیـــابی به مزایای رقابتی بالقوه نسبت به رقبای تجاری خود، هم با بهبود اثربخشی عملیاتی و هم با تصمیمگیری بهتر کمک کند. همچنین سازمانهایــی با دادههای خوب مدیریت شده میتوانند چابکتر شوند و این امر باعث میشود روند بازار را تشخیص داده و برای استفاده سریعتــر از فرصتهای تجاری جدید حرکت کنید.
مدیریت موثر دادهها همچنین میتواند به شرکتها در جلوگیــری از نقض دادهها، مسائــل مربوط به حریم خصوصی دادهها و مشکلات مربوط به رعایت مقررات که میتواند به شهرت آنها آسیب برساند، هزینههای غیرمنتظره اضافه کرده و آنها را در معرض خطر قانونی قرار دهد. در نهایت، بزرگتریــن مزیتی که یک رویکرد جامد در مدیریت داده ها میتواند ارائه دهد، عملکرد بهتر کسب و کار است.
منبع:
[…] دستکاری دادهها پشتیبانــی میکنند. پایگاه دادهها مدیریت دادهها را آسان میکند. اجازه دهید در مورد یک مثال پایگاه داده […]