DATA

در محاسبات، DATAها اطلاعاتی هستند که به شکلی ترجمه شده‌اند که برای حرکت یا پردازش کارآمد است. نسبت به رایانه‌های امروزی و رسانه‌های انتقال، داده ها به شکل دیجیتال دو دویی تبدیل می‌شوند. قابل قبول است که DATAها به عنوان یک موضوع مفرد یا یک موضوع جمع استفاده شوند. داده‌ های خام اصطلاحی است که برای توصیف داده ها در ابتدایی‌ترین قالب دیجیتالی خود استفاده می‌شود.

مفهوم داده‏

مفهوم داده در زمینه محاسبات ریشه در کار کلود شانون، ریاضیدان آمریکایی معروف به پدر نظریه اطلاعات دارد. او مفاهیم دیجیتالی دودویی را بر اساس اعمال منطق بولی دو ارزشی برای مدارهای الکترونیکی مطرح کرد. فرمت‌های دو رقمی زیر بنای CPUها، حافظه‌های نیمه‌هادی و درایوهای دیسک، و همچنین بسیاری از دستگاه‌های جانبی رایج امروزه در محاسبات است. ورودی اولیه رایانه هم برای کنترل و هم برای DATA ها به صورت کارت‌های پانچ و سپس نوار مغناطیسی و هارد دیسک بود.

در اوایل، اهمیت DATA ها در محاسبات تجاری با محبوبیت اصطلاحات “پردازش داده” و “پردازش داده های الکترونیکی” آشکار شد که برای مدتی طیف وسیعی از آنچه امروزه به عنوان فناوری اطلاعات شناخته می‌شود را شامل می‌شود. در طول تاریخ محاسبات شرکتی، تخصص رخ داد و حرفه‌ای متمایز از دیتا ها همراه با رشد پردازش داده های شرکتی پدیدار شد.

نحوه ذخیره اطلاعات

کامپیوترها داده ها، از جمله ویدئو، تصاویر، صداها و متن را به عنوان مقادیر دودویی با استفاده از الگوهای عددی 1 و 0 نشان می‌دهند. بیت کوچکترین واحد دیتا است و فقط یک مقدار واحد را نشان می‌دهد. یک بایت هشت رقم دوتایی است. حافظه بر حسب مگابایت و گیگابایت اندازه‌گیری می‌شود.

با افزایش حجم داده های جمع‌آوری شده و ذخیره شده، واحدهای اندازه‌گیری داده ها همچنان در حال رشد هستند. به عنوان مثال، عبارت نسبتاً جدید “brontobyte” ذخیره داده است که برابر با 10 تا 27 قدرت بایت است.

داده ها را می‌توان در قالب‌های فایل ذخیره کرد، مانند سیستم‌های اصلی با استفاده از ISAM و VSAM. سایر فرمت‌های فایل برای ذخیره، تبدیل و پردازش داده ها شامل مقادیر جدا شده با کاما است. این فرمت‌ها همچنان در انواع مختلف ماشین‌ها کاربرد پیدا می‌کردند، حتی در حالی که رویکردهای ساختارمندتر داده محور در محاسبات شرکتی جای خود را پیدا کردند.

تخصص بیشتر به عنوان پایگاه داده، سیستم مدیریت پایگاه داده و سپس فناوری پایگاه داده رابطه‌ای برای سازماندهی اطلاعات ایجاد شد. محدوده اندازه‌گیری داده ها. دامنه داده های دیجیتالی در طول زمان از بیت و بایت به brontobytes تبدیل شده است، و اندازه‌گیری داده های بزرگتر در آینده در راه است.

انواع داده ها

رشد وب و تلفن‌های هوشمند در دهه گذشته منجر به افزایش ایجاد داده های دیجیتالی شد. در حال حاضر داده ها شامل متن، اطلاعات صوتی و تصویری و همچنین سوابق فعالیت و وب است. بیشتر اینها داده های بدون ساختار هستند.

اصطلاح کلان داده برای توصیف داده های محدوده پتابایت یا بیشتر استفاده شده است. با گسترش تجارت الکترونیکی مبتنی بر وب، مدل های تجاری بزرگ مبتنی بر داده تکامل یافته‌اند که داده ها را به خودی خود به عنوان یک دارایی تلقی می‌کنند. چنین روندهایی همچنین باعث نگرانی بیشتر در استفاده اجتماعی از داده ها و حریم خصوصی داده ها شده است.

داده ها فراتر از کاربرد آنها در محاسبات برنامه‌های کاربردی جهت پردازش داده ها دارای معنا هستند. به عنوان مثال، در اتصال الکترونیکی قطعات الکترونیکی و ارتباطات شبکه، اصطلاح داده اغلب از “اطلاعات کنترل” ، “بیت‌های کنترل” و اصطلاحات مشابه برای شناسایی محتوای اصلی یک واحد انتقال متمایز می‌شود. علاوه بر این، در علم، واژه داده برای توصیف مجموعه‌ای از حقایق استفاده می‌شود. این امر در زمینه‌هایی مانند امور مالی، بازاریابی، جمعیت شناسی و سلامت نیز صادق است.

مدیریت و استفاده از داده ها

با گسترش داده ها در سازمان‌ها، تأکید بیشتری بر اطمینان از کیفیت داده ها با کاهش تکراری و تضمین دقیق‌ترین سوابق جاری، شده است. بسیاری از مراحل مدیریت داده مدرن شامل پاکسازی داده ها، و همچنین استخراج، تبدیل و بارگذاری (ETL) فرآیندهای یکپارچه‌سازی داده ها است. داده های پردازش شده با فراداده ها، که گاهی اوقات به عنوان “داده در مورد داده ها” نیز شناخته می‌شوند، تکمیل می‌شود که به مدیران و کاربران در درک پایگاه داده و سایر داده ها کمک می‌کند.

تجزیه و تحلیل‌هایی که داده های ساختار یافته و بدون ساختار را ترکیب می‌کنند، مفید واقع شده‌اند، زیرا سازمان‌ها به دنبال استفاده از چنیــن اطلاعاتی هستند. سیستم‌های این گونه تجزیه و تحلیل‌ها به طور فزاینده‌ای برای عملکرد در زمان واقعی تلاش می‌کنند، بنابراین آنها برای مدیریت داده های ورودی مصرف شده با نرخ بالا و پردازش جریان داده برای استفاده فوری در عملیات ساخته شده‌اند.

با گذشت زمان، ایده پایگاه داده برای عملیات و معاملات به پایگاه داده برای گزارش و تجزیه و تحلیل داده های پیش‌بینی گسترش یافته است. نمونه اصلی انبار داده ها است که برای پردازش سوالات مربوط به عملیات برای تحلیلگران تجاری و رهبران تجاری بهینه شده است. تاکید روزافزون بر یافتن الگوها و پیش‌بینی نتایج کسب و کارها منجر به توسعه تکنیک‌های داده کاوی شده است.

پایگاه‌های داده

حرفـه مدیر یکی از شاخه‌های فناوری اطلاعات است. این کارشناسان پایگاه داده روی طراحی، تنظیم و نگهداری پایگاه داده کار می‌کنند. حرفه داده ها از آنجا که سیستم مدیریت پایگاه داده رابطه‌ای (RDBMS) در شرکت‌ها استفاده گسترده‌ای کرد، از دهه 1980 شروع به کار کرد. افزایش پایگاه داده رابطه‌ای تا حدی توسط زبان پرس و جو ساختار یافته (SQL) فعال شد. بعداً، پایگاه‌های داده غیر SQL، معروف به پایگاه‌های داده NoSQL، به عنوان جایگزینی برای RDBMSهای ایجاد شده پدیدار شدند.

امروزه، شرکت‌ها متخصصان مدیریت داده را استخدام می‌کنند یا وظیفه سرپرستی داده ها را به کارگران واگذار می‌کنند که شامل اجرای سیاست‌ها و امنیت داده ها در طرح‌های حاکمیت داده ها می‌شود. به نظر می‌رسد یک عنوان متمایز؛ دانشمند داده، برای توصیف متخصصان متمرکز بر داده کاوی و تجزیه و تحلیل است. بهره‌مندی از ارائه علم داده به شیوه‌ای تامل برانگیز حتی باعث ایجاد هنرمند داده شده است. یعنی فردی در نمودارسازی و تجسم داده ها به روش‌های خلاقانه فعالیت می‌کند.

منبع:

searchdatamanagement.techtarget.com

1 دیدگاه

دیدگاهتان را بنویسید