در محاسبات، DATAها اطلاعاتی هستند که به شکلی ترجمه شدهاند که برای حرکت یا پردازش کارآمد است. نسبت به رایانههای امروزی و رسانههای انتقال، داده ها به شکل دیجیتال دو دویی تبدیل میشوند. قابل قبول است که DATAها به عنوان یک موضوع مفرد یا یک موضوع جمع استفاده شوند. داده های خام اصطلاحی است که برای توصیف داده ها در ابتداییترین قالب دیجیتالی خود استفاده میشود.
مفهوم داده
مفهوم داده در زمینه محاسبات ریشه در کار کلود شانون، ریاضیدان آمریکایی معروف به پدر نظریه اطلاعات دارد. او مفاهیم دیجیتالی دودویی را بر اساس اعمال منطق بولی دو ارزشی برای مدارهای الکترونیکی مطرح کرد. فرمتهای دو رقمی زیر بنای CPUها، حافظههای نیمههادی و درایوهای دیسک، و همچنین بسیاری از دستگاههای جانبی رایج امروزه در محاسبات است. ورودی اولیه رایانه هم برای کنترل و هم برای DATA ها به صورت کارتهای پانچ و سپس نوار مغناطیسی و هارد دیسک بود.
در اوایل، اهمیت DATA ها در محاسبات تجاری با محبوبیت اصطلاحات “پردازش داده” و “پردازش داده های الکترونیکی” آشکار شد که برای مدتی طیف وسیعی از آنچه امروزه به عنوان فناوری اطلاعات شناخته میشود را شامل میشود. در طول تاریخ محاسبات شرکتی، تخصص رخ داد و حرفهای متمایز از دیتا ها همراه با رشد پردازش داده های شرکتی پدیدار شد.
نحوه ذخیره اطلاعات
کامپیوترها داده ها، از جمله ویدئو، تصاویر، صداها و متن را به عنوان مقادیر دودویی با استفاده از الگوهای عددی 1 و 0 نشان میدهند. بیت کوچکترین واحد دیتا است و فقط یک مقدار واحد را نشان میدهد. یک بایت هشت رقم دوتایی است. حافظه بر حسب مگابایت و گیگابایت اندازهگیری میشود.
با افزایش حجم داده های جمعآوری شده و ذخیره شده، واحدهای اندازهگیری داده ها همچنان در حال رشد هستند. به عنوان مثال، عبارت نسبتاً جدید “brontobyte” ذخیره داده است که برابر با 10 تا 27 قدرت بایت است.
داده ها را میتوان در قالبهای فایل ذخیره کرد، مانند سیستمهای اصلی با استفاده از ISAM و VSAM. سایر فرمتهای فایل برای ذخیره، تبدیل و پردازش داده ها شامل مقادیر جدا شده با کاما است. این فرمتها همچنان در انواع مختلف ماشینها کاربرد پیدا میکردند، حتی در حالی که رویکردهای ساختارمندتر داده محور در محاسبات شرکتی جای خود را پیدا کردند.
تخصص بیشتر به عنوان پایگاه داده، سیستم مدیریت پایگاه داده و سپس فناوری پایگاه داده رابطهای برای سازماندهی اطلاعات ایجاد شد. محدوده اندازهگیری داده ها. دامنه داده های دیجیتالی در طول زمان از بیت و بایت به brontobytes تبدیل شده است، و اندازهگیری داده های بزرگتر در آینده در راه است.
انواع داده ها
رشد وب و تلفنهای هوشمند در دهه گذشته منجر به افزایش ایجاد داده های دیجیتالی شد. در حال حاضر داده ها شامل متن، اطلاعات صوتی و تصویری و همچنین سوابق فعالیت و وب است. بیشتر اینها داده های بدون ساختار هستند.
اصطلاح کلان داده برای توصیف داده های محدوده پتابایت یا بیشتر استفاده شده است. با گسترش تجارت الکترونیکی مبتنی بر وب، مدل های تجاری بزرگ مبتنی بر داده تکامل یافتهاند که داده ها را به خودی خود به عنوان یک دارایی تلقی میکنند. چنین روندهایی همچنین باعث نگرانی بیشتر در استفاده اجتماعی از داده ها و حریم خصوصی داده ها شده است.
داده ها فراتر از کاربرد آنها در محاسبات برنامههای کاربردی جهت پردازش داده ها دارای معنا هستند. به عنوان مثال، در اتصال الکترونیکی قطعات الکترونیکی و ارتباطات شبکه، اصطلاح داده اغلب از “اطلاعات کنترل” ، “بیتهای کنترل” و اصطلاحات مشابه برای شناسایی محتوای اصلی یک واحد انتقال متمایز میشود. علاوه بر این، در علم، واژه داده برای توصیف مجموعهای از حقایق استفاده میشود. این امر در زمینههایی مانند امور مالی، بازاریابی، جمعیت شناسی و سلامت نیز صادق است.
مدیریت و استفاده از داده ها
با گسترش داده ها در سازمانها، تأکید بیشتری بر اطمینان از کیفیت داده ها با کاهش تکراری و تضمین دقیقترین سوابق جاری، شده است. بسیاری از مراحل مدیریت داده مدرن شامل پاکسازی داده ها، و همچنین استخراج، تبدیل و بارگذاری (ETL) فرآیندهای یکپارچهسازی داده ها است. داده های پردازش شده با فراداده ها، که گاهی اوقات به عنوان “داده در مورد داده ها” نیز شناخته میشوند، تکمیل میشود که به مدیران و کاربران در درک پایگاه داده و سایر داده ها کمک میکند.
تجزیه و تحلیلهایی که داده های ساختار یافته و بدون ساختار را ترکیب میکنند، مفید واقع شدهاند، زیرا سازمانها به دنبال استفاده از چنیــن اطلاعاتی هستند. سیستمهای این گونه تجزیه و تحلیلها به طور فزایندهای برای عملکرد در زمان واقعی تلاش میکنند، بنابراین آنها برای مدیریت داده های ورودی مصرف شده با نرخ بالا و پردازش جریان داده برای استفاده فوری در عملیات ساخته شدهاند.
با گذشت زمان، ایده پایگاه داده برای عملیات و معاملات به پایگاه داده برای گزارش و تجزیه و تحلیل داده های پیشبینی گسترش یافته است. نمونه اصلی انبار داده ها است که برای پردازش سوالات مربوط به عملیات برای تحلیلگران تجاری و رهبران تجاری بهینه شده است. تاکید روزافزون بر یافتن الگوها و پیشبینی نتایج کسب و کارها منجر به توسعه تکنیکهای داده کاوی شده است.
پایگاههای داده
حرفـه مدیر یکی از شاخههای فناوری اطلاعات است. این کارشناسان پایگاه داده روی طراحی، تنظیم و نگهداری پایگاه داده کار میکنند. حرفه داده ها از آنجا که سیستم مدیریت پایگاه داده رابطهای (RDBMS) در شرکتها استفاده گستردهای کرد، از دهه 1980 شروع به کار کرد. افزایش پایگاه داده رابطهای تا حدی توسط زبان پرس و جو ساختار یافته (SQL) فعال شد. بعداً، پایگاههای داده غیر SQL، معروف به پایگاههای داده NoSQL، به عنوان جایگزینی برای RDBMSهای ایجاد شده پدیدار شدند.
امروزه، شرکتها متخصصان مدیریت داده را استخدام میکنند یا وظیفه سرپرستی داده ها را به کارگران واگذار میکنند که شامل اجرای سیاستها و امنیت داده ها در طرحهای حاکمیت داده ها میشود. به نظر میرسد یک عنوان متمایز؛ دانشمند داده، برای توصیف متخصصان متمرکز بر داده کاوی و تجزیه و تحلیل است. بهرهمندی از ارائه علم داده به شیوهای تامل برانگیز حتی باعث ایجاد هنرمند داده شده است. یعنی فردی در نمودارسازی و تجسم داده ها به روشهای خلاقانه فعالیت میکند.
منبع:
[…] دیتا چیست؟ […]