مدیریت داده چیست؟ اهمیت و تاریخچــه آن

مدیریت داده فرآیند ذخیره، سازماندهــی و نگهداری داده‌های ایجاد شده و جمع‌آوری شده توسط یک سازمان است. مدیریت موثر داده‌ها بخش مهمی از استقرار سیستم‌های فناوری اطلاعات است که برنامه‌های تجاری را اجرا می‌کند و اطلاعات تحلیلــی را برای کمک به تصمیم‌گیری عملیاتـی و برنامه‌ریزی استراتژیک توسط مدیران شرکت‌ها، مدیران کسب و کار و سایر کاربران نهایی کمک می‌کند.

فرایند مدیریت داده

فرایند مدیریت داده‌ها شامل ترکیبی از عملکردهای مختلف است که به طور جمعی هدف آنها اطمینان از صحت، در در دسترس بودن داده‌های سیستم‌های شرکتی است. بیشتر کارهای مورد نیاز توسط تیم‌های مدیریت فناوری اطلاعات و داده‌ها انجام می‌شود، اما کاربران تجاری معمولاً در برخی از قسمت‌های فرایند شرکت می‌کنند تا اطمینان حاصل کنند که داده‌ها نیازهای آنها را برآورده می‌کنند و آنها را با سیاست‌های حاکم بر استفاده از آنها پیاده‌سازی می‌کنند.

این بخش از آموزش‌های کیسان مدیریت داده‌ها را بیشتر توضیح می‌دهد و بینش‌هایی را در مورد رشته‌های فردی، بهترین شیوه‌های مدیریت داده‌ها، چالش‌هایـی که سازمان‌ها با آن روبرو هستند و مزایای تجاری یک استراتژی موفق مدیریت داده‌ها ارائه می‌دهد. همچنین نمای کلی ابزارها و تکنیک‌های مدیریت داده‌ها را خواهید یافت. برای مطالعه در مورد روندهای مدیریت داده و دریافت مشاوره تخصصی در مورد مدیریت داده‌های شرکت، و هوش تجاری با شماره 88178275-021 تماس حاصل نمایید.

تاریخچــه مدیریت و تحول

اولین شکوفایــی مدیریت داده‌ها عمدتاً توسط متخصصان فناوری اطلاعات انجام شد که بر حل مشکل زباله در اولین رایانه‌ها متمرکز شده بودند، پس از تشخیص اینکه ماشین‌ها به دلیل نادرست یا ناکافی بودن داده‌ها به نتایج نادرستی رسیدند. از دهه 1960، گروه‌های صنعتــی و انجمن‌های حرفه‌ای بهترین شیوه‌ها را برای مدیریت داده‌ها‌، به ویژه در زمینه آموزش حرفه‌ای و معیارهای کیفیت داده‌ها، ترویج کردند. پایگاه‌های داده سلسله مراتبی مبتنی بر پردازنده اصلی نیز در آن دهه در دسترس قرار گرفت.

پایگاه داده رابطه‌ای در دهه 1970 ظاهر شد و سپس جای خود را در مرکز فرآیند مدیریت داده‌ها در دهه 1980 تقویت کرد. ایده انبار داده در اواخر دهه 1980 شکل گرفت و پذیرندگان اولیه این مفهوم در اواسط دهه 1990 شروع به استقرار انبارهای داده کردند. در اوایل دهه 2000، نرم‌افزارهای ارتباطی یک فناوری غالب بودند و قفل مجازی روی استقرار پایگاه داده داشتند.

اما نسخه اولیه Hadoop در سال 2006 در دسترس قرار گرفت و پس از آن موتور پردازش Spark و سایر فناوری‌های بزرگ داده دنبال شد. طیف وسیعــی از پایگاه‌های داده NoSQL نیز در همان بازه زمانــی در دسترس قرار گرفت. در حالی که فناوری ارتباطی هنوز بیشترین سهم را دارد، ظهور داده‌های بزرگ و جایگزین‌های NoSQL و محیط‌های جدید دریاچه داده‌ای که آنها فعال می‌کنند مجموعه وسیع‌تری از انتخاب‌های مدیریت داده را در اختیار سازمان‌ها قرار داده است.

اهمیت مدیریت داده ها

داده‌ها به طور فزاینده‌ای به عنوان یک دارایــی شرکت محسوب می‌شوند که می‌تواند برای تصمیم‌گیری‌های تجاری آگاهانه‌تر، بهبود کمپین‌های بازاریابی، بهینه‌سازی عملیات تجاری و کاهش هزینه‌ها مورد استفاده قرار گیرد، همه این‌ها با هدف افزایش درآمد و سود است. اما فقدان مدیریت صحیح داده‌ها می‌تواند سازمان‌ها را با سیلوهای داده‌های ناسازگار، مجموعه داده‌های ناسازگار و مشکلات کیفیت داده که توانایی آنها در اجرای هوش تجاری (BI) و برنامه‌های تحلیلــی را محدود می‌کند، یا بدتر از آن، به یافته‌های نادرست منجر شود.

مدیریت داده‌ها نیز از آنجایی که مشاغل مشمول تعداد فزاینده‌ای از الزامات رعایت مقررات از جمله قوانین مربوط به حریم خصوصی و حفاظت از داده‌ها مانند GDPR و قانون حفظ حریم خصوصی مصرف کنندگان در کالیفرنیا هستند، اهمیت یافته است. علاوه بر این، شرکت‌ها حجم بیشتری از داده‌ها و انواع بیشتری از انواع داده‌ها را ضبط می‌کنند، که هر دو از ویژگی‌های سیستم‌های داده بزرگ هستند. بدون مدیریت خوب داده‌ها، چنین محیط‌هایــی ممکن است سخت و پیمایش ناپذیر شوند.

انواع توابع مدیریت داده

رشته‌های جداگانه‌ای که بخشی از فرایند کلی مدیریت داده ها هستند، مجموعه‌ای از مراحل را شامل می‌شود، از پردازش و ذخیره داده تا مدیریت نحوه قالب‌بندی و استفاده از داده‌ها در سیستم‌های عملیاتـــی و تحلیلی. توسعه معماری داده‌ها اغلب اولین قدم است، به ویژه در سازمان‌های بزرگ با داده‌های زیادی برای مدیریت. یک معماری نقشه‌ای برای پایگاه‌های داده و سایر پلتــفرم‌های داده ارائه می‌دهد، از جمله فن‌آوری‌های خاص برای متناسب با برنامه‌های فردی.

پایگاه‌های داده رایج‌ترین پلتفرمــی است که برای نگهداری داده‌های شرکت استفاده می‌شود. آنها حاوی مجموعه‌ای از داده‌ها هستند که به گونه‌ای سازماندهــی شده‌اند که می‌توان به آنها دسترسی، به روز و مدیریت کرد. آنها در هر دو سیستم پردازش تراکنش که داده‌های عملیاتــی ایجاد می‌کنند، مانند سوابق مشتری و سفارشات فروش، و انبارهای داده ، که مجموعــه داده‌های تلفیقی از سیستم‌های تجاری را برای BI و تجزیه و تحلیل ذخیره می‌کنند، استفاده می‌شوند.

مدیریت پایگاه داده یک عملکرد اصلی مدیریت داده است. پس از راه‌اندازی پایگاه‌های داده، نظارت و تنظیم عملکــرد باید انجام شود تا زمان پاسخگویی قابل قبولی در مورد درخواست‌های پایگاه داده که کاربران برای دریافت اطلاعات از داده‌های ذخیره شده در آنها انجام می‌دهند، حفظ شود. سایر وظایف اداری شامل طراحــی پایگاه داده، پیکربندی، نصب و به روز رسانــی می‌باشد. امنیت داده‌ها؛ پشتیبان‌گیری و بازیابی پایگاه داده؛ و استفاده از ارتقاء نر‌م‌افزار و وصله‌های امنیتی.

توابع مدیریت داده های اصلی

مدیریت داده شامل انواع مختلفــی از عملکردهای مرتبط است. فناوری اولیه‌ای که برای استقرار و مدیریت پایگاه‌های داده استفاده می‌شود، سیستم مدیریت پایگاه داده (DBMS) است که نرم‌افزاری است که به عنوان رابط بین پایگاه‌های داده تحت کنترل و مدیران پایگاه داده، کاربران نهایی و برنامه‌های کاربردی که به آنها دسترسی دارند، عمل می‌کند.

پلتفرم‌های جایگزین داده‌ها برای پایگاه‌های داده شامل سیستم‌های فایل و خدمات ذخیره‌سازی شیء ابری است. آنها داده‌ها را نسبت به پایگاه‌های داده اصلــی به شیوه‌های ساخت‌یافته‌تری ذخیره می‌کنند، که انعطاف‌پذیری بیشتری در مورد انواع داده‌های قابل ذخیره و نحوه قالب‌بندی آنها ارائه می‌دهد. در نتیجه، هر چنــد، آنها برای برنامه‌های معاملاتی مناسب نیستند.

سایر رشته‌های اساســی مدیریت داده شامل مدل‌سازی داده‌ها است که روابط بین عناصر داده و نحوه جریان داده‌ها در سیستم‌ها را نمودار می‌کند. ادغام داده‌ها، که منابع داده‌های مختلف را برای مصارف عملیاتــی و تحلیلی ترکیب می‌کند. حاکمیت داده‌ها، که سیاست‌ها و رویه‌هایی را برای اطمینان از سازگاری داده‌ها در سراسر یک سازمان تعیین می‌کند. و مدیریت کیفیت داده، که هدف آن رفع خطاها و ناسازگاری‌های داده است.

ابزارها و تکنیک‌های مدیریت داده‌ ها

طیف گسترده‌ای از فن‌آوری‌ها، ابزارها و تکنیک‌ها را می‌توان به عنوان بخشــی از فرایند مدیریت داده به کار گرفت. این شامل گزینه‌های موجود زیر برای جنبه‌های مختلف مدیریت داده ها است.

سیستم‌های مدیریت پایگاه داده رایج‌ترین نوع DBMS، سیستم مدیریت پایگاه داده رابطه‌ای است. پایگاه‌های داده رابطه‌ای، داده‌ها را به جداول با سطرها و ستون‌هایی که حاوی سوابق پایگاه داده هستند، سازماندهی می‌کند. سوابق مرتبط در جداول مختلف را می‌توان با استفاده از کلیدهای اصلی و خارجی متصل کرد، و از نیاز به ایجاد ورودی‌های داده تکراری جلوگیری کرد.

با این حال، انواع دیگر فناوری‌های DBMS به عنوان گزینه‌های مناسب برای انواع مختلف حجم کار داده شده است. بیشتر آنها به عنوان پایگاه‌های داده NoSQL طبقه‌بندی می‌شوند، که الزامات سختــی را بر مدل‌های داده و طرح‌های پایگاه داده تحمیل نمی‌کنند. در نتیجه، آنها می‌توانند داده‌های بدون ساختار و نیمه ساختار یافته، مانند داده‌های حسگــر، سوابق جریان کلی اینترنت و گزارشات شبکه، سرور و برنامه را ذخیره کنند.

چهار نوع اصلــی از سیستم‌های NoSQL وجود دارد:

  • پایگاه داده‌های اسناد که عناصر داده را در ساختارهای سند مانند ذخیره می‌کند
  • پایگاه‌های داده کلیدی که کلیدهای منحصر به فرد و مقادیر مرتبط را جفت می‌کند
  • فروشگاه‌های ستون گسترده با جداول که دارای تعداد زیادی ستون هستند
  • پایگاه داده‌های نمودار که اتصال عناصر داده مرتبط در قالب نمودار را دارند

نام NoSQL به یک نام اشتباه تبدیل شده است، در حالــی که پایگاه‌های داده NoSQL به SQL متکی نیستند، اکنون بسیاری از عناصر آن را پشتیبانی می‌کنند و تا حدی سطح مطابقت ACID را ارائه می‌دهند.

گزینه‌های اضافی پایگاه داده و DBMS شامل پایگاه داده‌های داخل حافظه است که داده‌ها را به جای دیسک در حافظه سرور ذخیره می‌کند تا عملکرد I/O را تسریع کند و پایگاه‌های داده ستونــی که برای برنامه‌های تجزیه و تحلیل طراحــی شده‌اند. پایگاه‌های داده سلسله مراتبی که بر روی پردازنده‌های اصلــی اجرا می‌شوند و قبل از توسعه سیستم‌های رابطه‌ای و NoSQL نیز هنوز برای استفاده در دسترس هستند.

کاربران می‌توانند پایگاه‌های داده را در سیستم‌های محلــی یا مبتنی بر ابر مستقر کنند. علاوه بر این، فروشندگان مختلف پایگاه داده خدمات مدیریت داده پایگاه داده ابری را ارائه می‌دهند، که در آن آنها استقرار، پیکربندی و مدیریت پایگاه داده را برای کاربران مدیریت می‌کنند. مدیریت داده‌های بزرگ پایگاه داده‌های NoSQL اغلب به دلیل توانایی ذخیره و مدیریت انواع مختلف داده‌ها در استقرار داده‌های بزرگ مورد استفاده قرار می‌گیرند.

محیط‌های داده بزرگ نیز معمولاً بر اساس فناوری‌های منبع باز مانند Hadoop، یک چارچوب پردازش توزیع شده با یک سیستم فایل که در مجموعه‌ای از سرورهای کالا اجرا می‌شود، ایجاد می‌شوند. پایگاه داده مرتبط آن HBase؛ موتور پردازش جرقه؛ و پلتفرم‌های پردازش جریان کافکا، Flink و Storm. به طور فزاینده‌ای، سیستم‌های داده بزرگ در ابر استفاده می‌شوند، با استفاده از ذخیره‌سازی اشیاء مانند سرویس ذخیره‌سازی ساده آمازون (S3).

انبارهای داده و دریاچه‌های داده. دو مخزن جایگزیــن برای مدیریت داده های تجزیه و تحلیل، انبارهای داده و دریاچه‌های داده هستند. ذخیره‌سازی داده‌ها روش سنتی‌تری است. یک انبار داده معمولاً بر اساس یک پایگاه داده رابطه‌ای یا ستونی است و داده‌های ساختار یافته‌ای را جمع‌آوری می‌کند که از سیستم‌های عملیاتـی مختلف جمع‌آوری شده و برای تجزیه و تحلیل آماده شده است.

موارد اصلی استفاده از انبار داده‌ها عبارتند از:

  • پرس و جو BI 
  • گزارش سازمانی 

که تحلیلگران و مدیران تجاری را قادر می‌سازد تا فروش، مدیریت موجودی و سایر شاخص‌های کلیدی عملکرد را تجزیه و تحلیل کنند. انبار داده‌های سازمانــی شامل داده‌های سیستم‌های تجاری در سراسر یک سازمان است. در شرکت‌های بزرگ، شرکت‌های تابعه و واحدهای تجاری با استقلال مدیریت ممکن است انبارهای داده خود را بسازند. Data marts گزینه دیگری است؛ آنها نسخه‌های کوچکتری از انبارهای داده هستند که شامل زیر مجموعه داده‌های یک سازمان برای بخش‌ها یا گروه‌های خاصی از کاربران است.

از طرف دیگر، دریاچه‌های داده، مجموعه‌ای از داده‌های بزرگ را برای استفاده در مدل سازی پیش‌بینی، یادگیری ماشین و سایر برنامه‌های تجزیه و تحلیل پیشرفته ذخیره می‌کند. آنها اغلب بر روی خوشه‌های Hadoop ساخته می‌شوند، اگرچه استقرار دریاچه داده در پایگاه‌های داده NoSQL یا ذخیره سازی ابری اشیاء نیز انجام می‌شود. علاوه بر این، سیستم عامل‌های مختلف را می‌توان در یک محیط دریاچه توزیع داده ترکیب کرد.

ممکن است داده‌ها هنگام تجزیه و تحلیل پردازش شوند، اما یک دریاچه داده اغلب حاوی داده‌های خام ذخیره شده به همان شکل است. در این مورد، دانشمندان داده و دیگر تحلیلگــران معمولاً کارهای آماده‌سازی داده‌های خود را برای استفاده‌های تحلیلی خاص انجام می‌دهند.

یکپارچه‌سازی داده‌ها

پرکاربردترین تکنیک یکپارچه‌سازی داده‌ها استخراج، تبدیل و بارگذاری (ETL) است که داده‌ها را از سیستم‌های منبع خارج می‌کند، آنها را به فرمت ثابت تبدیل می‌کند و سپس داده‌های یکپارچه را در انبار داده یا سیستم هدف دیگر بارگذاری می‌کند. با این حال، سیستم عامل‌های یکپارچه‌سازی داده‌ها در حال حاضــر از انواع روش‌های دیگر ادغام نیز پشتیبانــی می‌کنند. که شامل:

  • استخراج
  • بارگذاری
  • تبدیل (ELT)
  • تنوعی در ETL

که وقتی داده‌ها در پلتفرم مورد نظر بارگذاری می‌شوند، داده‌ها را به شکل اصلــی خود باقی می‌گذارد. ELT یک انتخاب رایج برای مشاغل یکپارچه‌سازی داده‌ها در دریاچه‌های داده و سایر سیستم‌های داده بزرگ است.

تعریف ETL و ELT

ETL و ELT فرآیندهای یکپارچه‌سازی دسته‌ای هستند که در فواصل زمانی مشخص اجرا می‌شوند. تیم‌های مدیریت داده همچنین می‌توانند یکپارچه‌سازی داده‌های زمان واقعی را با استفاده از روش‌هایــی مانند تغییر ضبط داده‌ها، اعمال تغییرات در داده‌های پایگاه داده در یک انبار داده یا سایر مخازن و یکپارچه‌سازی داده‌های جریان، که جریان داده‌های زمان واقعی را در آنها ادغام می‌کند، انجام دهند.

به طور مداوم مجازی سازی داده‌هــا یکی دیگر از گزینه‌های یکپارچه‌سازی است. از یک لایه انتزاعی برای ایجاد نمای مجازی از داده‌های سیستم‌های مختلف برای کاربران نهایی به جای بارگذاری فیزیکــی داده‌ها در یک انبار داده استفاده می‌کند.

حاکمیت داده‌ها، کیفیت داده‌ها و MDM

حاکمیت داده‌ها در درجه اول یک فرایند سازمانی است. محصولات نرم‌افزاری که می‌توانند به مدیریت برنامه‌های حاکمیت داده کمک کنند در دسترس هستند، اما آنها یک عنصر اختیاری هستند. در حالی که برنامه‌های حکمرانــی ممکن است توسط متخصصان مدیریت داده، مدیریت شود، معمولاً شامل یک شورای حکمرانی داده‌ها از مدیران تجاری است که به طور جمعی در مورد تعاریف مشترک داده‌ها و استانداردهای شرکت برای ایجاد، قالب‌بندی و استفاده از داده‌ها تصمیم‌گیری می‌کنند.

یکی دیگر از جنبه‌های کلیدی ابتکارات حکمرانی، سرپرستی داده‌ها است که شامل نظارت بر مجموعه داده‌ها و اطمینان از مطابقت کاربران نهایی با خط مشی‌های داده تایید شده است. بسته به اندازه یک سازمان و محدوده برنامه حکمرانی آن، مباشر داده می‌تواند به صورت تمام وقت یا نیمه وقت باشد. مباشران داده همچنین می‌توانند از عملیات تجاری و بخش فناوری اطلاعات باشند. در هر صورت، دانش نزدیک از داده‌هایــی که آنها تحت نظارت دارند به طور معمول یک پیش نیاز است.

حاکمیت داده‌ها ارتباط تنگاتنگی با تلاش‌های بهبود کیفیت داده‌ها دارد. معیارهایــی که بهبود کیفیت داده‌های یک سازمان را ثبت می‌کنند، برای نشان دادن ارزش تجاری برنامه‌های حکمرانــی، مرکزی هستند. تکنیک‌های کیفیت داده شامل پروفایل داده است که مجموعه داده‌ها را برای شناسایی مقادیر دورتر که ممکن است خطا باشند، اسکن می‌کند. پاکسازی داده‌ها، همچنین به عنوان scrubbing data معروف است، که با اصلاح یا حذف داده‌های بد، خطاهای داده را برطرف می‌کند. و اعتبار داده‌ها، که داده‌ها را با قوانین کیفیت از پیش تعیین شده بررسی می‌کند.

مدیریت داده‌های اصلــی نیز به حکمرانی داده‌ها و کیفیت داده‌ها وابسته است، اگرچه MDM به طور گسترده‌ای به عنوان دو عملکرد دیگر مدیریت داده مورد استفاده قرار نگرفته است. این تا حدودی به دلیل پیچیدگی برنامه‌های MDM است که بیشتر آنها را محدود به سازمان‌های بزرگ می‌کند. MDM یک رجیستری مرکزی از داده‌های اصلی برای حوزه‌های داده انتخاب شده ایجاد می‌کند. چیزی که اغلب یک رکورد طلایی نامیده می‌شود.

داده‌های اصلی در یک مرکز MDM ذخیره می‌شود، که داده‌ها را برای گزارش و تجزیه و تحلیل سازمانــی به سیستم‌های تحلیلی هدایت می‌کند. در صورت تمایل، هاب همچنین می‌تواند داده‌های اصلی به روز شده را به سیستم‌های منبع بازگرداند.

مدل سازی داده‌

مدل سازی داده‌ها مجموعه‌ای از مدل‌های داده‌ای مفهومی، منطقی و فیزیکــی را ایجاد می‌کنند که مجموعه داده‌ها و گردش کار را به صورت تصویری مستند می‌کند و آنها را برای نیازهای تجاری برای پردازش و تجزیه و تحلیل معاملات ترسیم می‌کند. تکنیک‌های متداول برای مدل سازی داده‌ها شامل توسعه نمودارهای روابط موجودیت، نگاشت داده‌ها و طرحواره‌ها است. علاوه بر این، وقتی داده‌های جدید اضافه می‌شوند یا اطلاعات یک سازمان نیاز به تغییر دارد، مدل‌های داده باید به روز شوند.

بهترین شیوه‌های مدیریت داده

یک برنامه حکمرانی داده‌ها به خوبی طراحی شده است، جزء مهمی از استراتژی‌های موثــر مدیریت داده‌ها است، به ویژه در سازمان‌هایــی با محیط‌های داده توزیع شده که مجموعه متنوعی از سیستم‌ها را شامل می‌شوند. تمرکز قوی بر کیفیت داده‌ها نیز ضروری است. در هر دو مورد، تیم‌های فناوری اطلاعات و مدیریت داده نمی‌توانند به تنهایی کار خود را انجام دهند. مدیران تجاری و کاربران باید مشارکت داشته باشند تا مطمئن شوند نیازهای داده آنها برآورده شده است و مشکلات کیفیت داده‌ها تداوم ندارد.

همین امر در مورد پروژه‌های مدل سازی داده‌ها نیز صدق می‌کند. همچنین، بسیاری از پایگاه‌های داده و دیگر بسترهای داده موجود برای استقرار نیازمند یک رویکرد دقیق هنگام طراحی معماری داده‌ها و ارزیابی و انتخاب فناوری‌ها هستند. مدیران فناوری اطلاعات و داده‌ها باید مطمئن باشند سیستم‌هایــی که پیاده‌سازی می‌کنند برای هدف مورد نظر مناسب بوده و قابلیت پردازش داده‌ها و اطلاعات تجزیه و تحلیل مورد نیاز عملیات تجاری یک سازمان را ارائه می‌دهند.

DAMA International، سازمان حرفه‌ای حاکمیت داده‌ها و سایر گروه‌های صنعتی برای پیشبرد درک رشته‌های مدیریت داده و ارائه بهترین راهنمایی‌ها تلاش می‌کنند. به عنوان مثال، DAMA DAMA-DMBOK: Body Management of Knowledge of Body را منتشر کرده است، یک کتاب مرجع که سعی در تعریف یک دیدگاه استاندارد از توابع و روش‌های مدیریت داده دارد. این کتاب که معمولاً به عنوان DMBOK نامیده می‌شود، اولین بار در سال 2009 منتشر شد. نسخه دوم DMBOK2 در سال 2017 منتشر شد.

خطرات و چالش‌های مدیریت داده ها

اگر سازمانی از معماری داده‌ای با طراحی خوب برخوردار نباشد، می‌تواند به سیستم‌های محصور شده‌ای برسد که ادغام و مدیریت آنها به صورت هماهنگ دشوار است. حتی در بودن محیط‌های برنامه‌ریزی شده، دانشمندان و دیگر تحلیلگــران را قادر می‌سازد تا به داده‌های مربوطه دست یابند و به آنها دسترسی پیدا کنند، می‌تواند یک چالش باشد، به ویژه هنگامــی که داده‌ها در پایگاه‌های داده مختلف و سیستم‌های داده بزرگ پخش شوند.

برای کمک به دسترسی بیشتر به داده‌ها، بسیاری از تیم‌های مدیریت داده‌ها کاتالوگ‌های داده‌ای را ایجاد می‌کنند که آنچه در سیستم‌ها موجود است را مستند می‌کند و معمولاً شامل واژه‌نامه‌های تجاری، دیکشنری‌های داده مبتنی بر فراداده و سوابق دودمان داده است.

انتقال به ابر می‌تواند برخی از جنبه‌های کار مدیریت داده را آسان کند، اما چالش‌های جدیدی را نیز ایجاد می‌کند. به عنوان مثال، مهاجرت به پایگاه‌های داده ابری و پلتفرم‌های کلان داده می‌تواند برای سازمان‌هایــی که نیاز به انتقال داده‌ها و پردازش حجم کار از سیستم‌های موجود داخلی دارند، پیچیده باشد. هزینه‌ها یکی دیگــر از مسائل مهم در ابر است. استفاده از سیستم‌های ابری و خدمات مدیریت شده باید به دقت کنترل شود تا مطمئن شوید صورتحساب‌های پردازش داده‌ها از میزان بودجه فراتر نمی‌رود.

بسیاری از تیم‌های مدیریت داده در حال حاضر در میان کارکنانی هستند که مسئول حفاظت از امنیت داده‌های شرکت‌ها و محدود کردن مسئولیت‌های قانونی احتمالی در مورد نقض داده‌ها یا سوء استفاده از داده‌ها هستند. مدیران داده باید از رعایت مقررات دولتــی و صنعتی در زمینه امنیت داده‌ها، حریم خصوصی و استفاده اطمینان حاصل کنند. این امر با تصویب GDPR، قانون حفظ حریم خصوصی داده‌های اتحادیه اروپا که در ماه مه 2018 اجرایی شد و قانون حفظ حریم خصوصــی مصرف کنندگان در کالیفرنیا، که در سال 2018 به امضاء رسید و قرار است در ابتدای سال جاری به اجرا در آید، به یک نگرانی فوری تبدیل شده است.

وظایف و نقش‌های مدیریت داده

فرآیند مدیریت داده شامل طیف وسیعی از وظایف و مهارت‌ها است. در سازمان‌های کوچکتــر با منابع محدود، تک تک کارگران ممکن است چندین نقش را بر عهده بگیرند. اما به طور کلی، متخصصان مدیریت داده شامل معماران داده، مدلسازان داده، مدیران پایگاه داده (DBAs)، توسعه دهندگان پایگاه داده، تحلیلگران(BI) و مهندسان کیفیت داده‌ها، توسعه دهندگان یکپارچه سازی داده‌ها، مدیران حاکمیت داده‌ها، مباشران داده و مهندسین داده هستند که با تیم‌های تجزیه و تحلیل همکاری می‌کنند.

جزئیــات اساسی در مورد حرفه مدیریت داده

دانشمندان داده و دیگر تحلیلگران داده نیز ممکن است برخــی از وظایف مدیریت داده را خود انجام دهند، به ویژه در سیستم‌های داده بزرگ با داده‌های خام که باید فیلتر شوند و برای مصارف خاص آماده شوند. به همین ترتیب، توسعه دهندگان برنامــه اغلب به استقرار و مدیریت محیط‌های کلان داده کمک می‌کنند، که در مقایسه با سیستم‌های پایگاه داده رابطه‌ای به مهارت‌های کلی نیاز دارد. در نتیجه، ممکن است سازمان‌ها برای برآوردن نیازهای مدیریت داده‌های بزرگ خود مجبور به استخدام کارگران جدید یا آموزش مجدد DBA شوند.

مزایای مدیریت خوب داده ها

یک استراتژی مدیریت داده به خوبی اجرا شده می‌تواند به شرکت‌ها در دستیـــابی به مزایای رقابتی بالقوه نسبت به رقبای تجاری خود، هم با بهبود اثربخشی عملیاتی و هم با تصمیم‌گیری بهتر کمک کند. همچنین سازمان‌هایــی با داده‌های خوب مدیریت شده می‌توانند چابک‌تر شوند و این امر باعث می‌شود روند بازار را تشخیص داده و برای استفاده سریعتــر از فرصت‌های تجاری جدید حرکت کنید.

مدیریت موثر داده‌ها همچنین می‌تواند به شرکت‌ها در جلوگیــری از نقض داده‌ها، مسائــل مربوط به حریم خصوصی داده‌ها و مشکلات مربوط به رعایت مقررات که می‌تواند به شهرت آنها آسیب برساند، هزینه‌های غیرمنتظره اضافه کرده و آنها را در معرض خطر قانونی قرار دهد. در نهایت، بزرگتریــن مزیتی که یک رویکرد جامد در مدیریت داده ها می‌تواند ارائه دهد، عملکرد بهتر کسب و کار است.

منبع:

searchdatamanagement.techtarget.com

1 دیدگاه

دیدگاهتان را بنویسید