تجسم دادهها، تمرین ترجمه اطلاعات به یک زمینه بصری مانند یک نقشه یا نمودار، برای ایجاد اطلاعات برای مغز انسان برای درک بیشتر است. هدف اصلی تجسم دادهها این است که شناسایی الگوها، روند غلط در مجموعه دادههای بزرگ را آسانتر کنیم. این اصطلاح اغلب به طور متناوب با دیگران، از جمله گرافیک اطلاعات، تجسم اطلاعات و گرافیک آماری استفاده میشود.
تجسم داده ها یکی از مراحل فرآیند علم داده است که میگوید که پس از جمعآوری دادهها، پردازش شده و مدل سازی شده، باید برای نتیجه گیری انجام شود. تجسم داده ها همچنین یک عنصر از نظم معماری ارائه داده گستردهتر (DPA) است که هدف آن شناسایی، تعیین، دستکاری، فرمت و ارائه دادهها در کارآمدترین راه ممکن است.
تجسم داده ها برای تقریباً هر حرفه مهم است. بطور مثال تجسم داده میتواند توسط معلمان برای نمایش نتایج آزمون دانش آموزان، توسط دانشمندان کامپیوتر که در حال بررسی پیشرفتهای هوش مصنوعی (AI) و یا مدیران به دنبال به اشتراک گذاری اطلاعات با ذینفعان استفاده شود. همچنین نقش مهمی در پروژههای دادههای بزرگ ایفا میکند.
تجسم، به دلایل مشابه، تحلیلی پیشرفته است. هنگامی که یک دانشمند داده در حال نوشتن الگوریتمهای پیشرفته تجزیه و تحلیل پیش بینی شده یا یادگیری ماشین (ML) است، مهم است که خروجیها را برای نظارت بر نتایج تجسم کنید و اطمینان حاصل کنید که مدلها در نظر گرفته شدهاند. این به این دلیل است که تجسم الگوریتمهای پیچیده به طور کلی سادهتر از خروجیهای عددی است.
تاریخ تجسم داده ها
یک جدول زمانی که تاریخ تجسم داده را نشان میدهد.
چرا تجسم داده ها مهم است؟
تجسم داده ها یک روش سریع و موثر برای برقراری ارتباط اطلاعات به شیوهای جهانی با استفاده از اطلاعات بصری فراهم میکند. این تمرین همچنین میتواند به کسب و کار کمک کند تا:
- عوامل موثر بر رفتار مشتری را شناسایی کنید؛
- مناطقی که باید بهبود یابند یا نیاز به توجه بیشتری داشته باشند را شناسایی کنید؛
- دادهها را برای ذینفعان یادآوری کنید؛
- درک زمانی و جایی که برای قرار دادن محصولات خاص استفاده میشود؛
- پیش بینی حجم فروش.
مزایای دیگر تجسم داده ها عبارتند از:
- توانایی جذب اطلاعات، بهبود بینش و تصمیمگیری سریعتر؛
- درک پیشرفتی از مراحل بعدی که باید برای بهبود سازمان انجام شود؛
- توانایی بهبود یافته برای حفظ علاقه مخاطبان به اطلاعاتی که میتوانند درک کنند؛
- توزیع آسان اطلاعاتی که فرصت را برای به اشتراک گذاشتن بینشها با همه افراد، درگیر میکند؛
- از آنجا که دادهها بیشتر قابل دسترسی و قابل فهم هستند، نیاز به دانشمندان داده را از بین میبرد؛
- افزایش توانایی برای به دست آوردن یافتهها به سرعت و به این ترتیب، موفقیت را با سرعت بیشتر و اشتباهات کمتر به دست میآورد.
تجسم داده ها و داده های بزرگ
افزایش محبوبیت داده های بزرگ و پروژههای تجزیه و تحلیل دادهها، تجسم را مهمتر از همیشه انجام داده است. شرکتها به طور فزایندهای با استفاده از یادگیری ماشین برای جمعآوری مقادیر عظیم دادههایی که میتوانند دشوار و آهسته باشند تا از طریق درک، توضیح دهند. تجسم به وسیلهی ابزارهایی برای سرعت بخشیدن و ارائه اطلاعات به صاحبان کسب و کار و ذینفعان در راههایی که میتوانند درک کنند، ارائه میدهد.
تجسم داده های بزرگ اغلب فراتر از تکنیکهای معمول مورد استفاده در تجسم طبیعی، مانند نمودارهای PIE، هیستوگرامها و نمودارهای شرکتی است. به جای آن از نمایندگیهای پیچیدهتر مانند نقشههای گرما و نمودار تب استفاده میکند. تجسم داده های بزرگ نیاز به سیستمهای قدرتمند کامپیوتری برای جمعآوری دادههای خام، پردازش آن را دارد و آن را به نمایندگیهای گرافیکی تبدیل میکند که انسانها میتوانند از آنها استفاده کنند تا به سرعت از بینش استفاده کنند.
در حالی که تجسم داده های بزرگ میتواند سودمند باشد، میتواند چندین معایب را به سازمانها برساند. آنها به شرح زیر هستند:
معایب تجسم داده های بزرگ
- برای به دست آوردن اطلاعات بیشتر از ابزارهای تجسم داده بزرگ، متخصص تجسم باید استخدام شود. این متخصص باید بتواند بهترین مجموعه دادهها را شناسایی کند و سبکهای تجسم را برای تضمین سازمانها بهینهسازی استفاده از دادههای خود را بهینهسازی کند.
- پروژههای بزرگ تجسم داده ها اغلب نیاز به دخالت از آن، و همچنین مدیریت، از آنجا که تجسم داده های بزرگ نیاز به سختافزار قدرتمند کامپیوتر، سیستمهای ذخیرهسازی کارآمد و حتی یک حرکت به ابر است.
- بینشهای ارائه شده توسط تجسم داده های بزرگ تنها به عنوان اطلاعاتی که تجسم میشود دقیق خواهد بود. بنابراین، ضروری است که مردم و فرآیندهای خود را برای کنترل کیفیت دادههای شرکت، ابرداده و منابع داده، ضروری بدانیم.
نمونههایی از تجسم داده ها
در روزهای اولیه تجسم، رایجترین تکنیک تجسم، با استفاده از یک صفحه گسترده مایکروسافت اکسل برای تبدیل اطلاعات به یک جدول، نمودار نوار یا نمودار پایه بود. تکنیکهای پیچیدهتر در حال حاضر در دسترس هستند، از جمله موارد زیر:
- هوش
- ابرهای حباب
- گلوله گراف
- نقشههای گرما
- نمودار تب
- نمودارهای سری زمانی
برخی از تکنیکهای محبوب دیگر به شرح زیر است.
- نمودار خط یکی از اساسیترین و رایجترین تکنیکهای استفاده شده است. نمودارهای خط نشان میدهد که چگونه متغیرها میتوانند در طول زمان تغییر کنند. نمودارهای منطقه این روش تجسم یک تغییر یک نمودار خط است؛ این مقادیر متعدد را در یک سری زمانی نشان میدهد، یا دنبالهای از دادههای جمعآوری شده در زمانهای متوالی، به همان اندازه فاصله در زمان است.
- قطعه پراکنده. این تکنیک رابطه بین دو متغیر را نشان میدهد. یک طرح پراکنده به شکل یک محور X و Y با نقطه برای نشان دادن نقاط داده میگیرد.
- treemaps این روش دادههای سلسله مراتبی را در فرمت توزیع شده نشان میدهد. اندازه مستطیلهای مورد استفاده برای هر دسته متناسب با درصد آن است. از Treemaps زمانی که چندین دسته وجود دارد، و هدف این است که مقادیر مختلف یک کل را مقایسه کنید، استفاده میشود.
- اهرام جمعیت این تکنیک از یک نمودار نوار انباشته شده برای نمایش روایت پیچیده اجتماعی جمعیت استفاده میکند. بهتر است هنگام تلاش برای نمایش توزیع یک جمعیت استفاده شود.
موارد استفاده از تجسم داده های معمول
موارد استفاده مشترک برای تجسم داده ها عبارتند از:
فروش و بازاریابی
تحقیقات از آژانس رسانهای Magna پیشبینی میکند که نیمی از تمامی دلار تبلیغات جهانی تا سال 2020 به صورت آنلاین صرف میشود. در نتیجه، تیمهای بازاریابی باید به منابع خود از ترافیک وب توجه کنند و چگونه خواص وب آنها درآمد خود را تامین میکنند. تجسم دادهها باعث میشود تا روند ترافیک در طول زمان به عنوان یک نتیجه از تلاشهای بازاریابی مشاهده شود.
سیاست
استفاده معمول از تجسم داده ها در سیاست، یک نقشه جغرافیایی است که حزب هر ایالت یا منطقه را برای رأی دادن نشان میدهد.
مراقبتهای بهداشتی
متخصصان مراقبتهای بهداشتی اغلب از نقشههای Choropleth برای تجسم داده های سلامت مهم استفاده میکنند. نقشه Choropleth نمایش مناطق جغرافیایی تقسیم شده یا مناطق است که یک رنگ خاص را در رابطه با متغیر عددی اختصاص داده است.
دارایی، مالی، سرمایهگذاری
حرفهایهای مالی باید در هنگام انتخاب خرید یا فروش دارایی، عملکرد تصمیمات سرمایهگذاری خود را پیگیری کنند. نمودارهای شمعدان به عنوان ابزار تجاری مورد استفاده قرار میگیرند و به متخصصان مالی کمک میکنند تا حرکات قیمت را در طول زمان تجزیه و تحلیل کنند، اطلاعات مهم را نشان میدهد، مانند اوراق بهادار، مشتقات، ارزها، سهام، اوراق قرضه و کالاها. با تجزیه و تحلیل نحوه تغییر قیمت در طول زمان، تحلیلگران دادهها و متخصصین مالی میتوانند روند را تشخیص دهند.
لجستیک
شرکتهای حمل و نقل میتوانند ابزار تجسم را برای تعیین بهترین مسیرهای حمل و نقل جهانی استفاده کنند.
دانشمندان دادهها و محققان
تجسمهای ساخته شده توسط دانشمندان داده معمولاً برای استفاده از دانشمند، و یا برای ارائه اطلاعات به مخاطبان انتخاب شده است. بازنماییهای بصری با استفاده از کتابخانههای تجسم زبان و ابزارهای برنامهنویسی انتخاب شده ساخته شده است. دانشمندان دادهها و محققان اغلب از زبانهای برنامهنویسی منبع باز مانند Python یا Tools Proprietary طراحی شده برای تجزیه و تحلیل دادههای پیچیده استفاده میکنند. تجسم دادههای انجام شده توسط این دادهها، دانشمندان و محققان به آنها کمک میکند تا مجموعه دادهها را درک کنند و الگوها و روند را شناسایی کنند که در غیر این صورت نادیده گرفته میشود.
علم تجسم داده ها
علم تجسم داده ها از درک نحوه جمعآوری و پردازش اطلاعات است. دانیل کان و آموس Tversky در تحقیقات همکاری کردهاند که دو روش مختلف برای جمعآوری و پردازش اطلاعات را تعریف میکنند.
سیستم 1 بر روی پردازش اندیشهای که سریع، اتوماتیک و ناخودآگاه است تمرکز میکند. این روش اغلب در زندگی روزمره استفاده میشود:
- خواندن متن بر روی نشانه؛
- حل مشکلات ریاضی ساده، مانند 1 + 1؛
- شناسایی جایی که یک صدا از آن میآید؛
- تعیین تفاوت بین رنگها.
سیستم 2 تمرکز بر پردازش آهسته، منطقی، محاسبه و نادرست است. این روش در یکی از موارد زیر استفاده میشود:
- یک شماره تلفن را بخوانید
- حل مشکلات ریاضی پیچیده، مانند 132 x 154؛
- تعیین تفاوت در معنی بین نشانههای متعدد ایستاده کنار؛
- درک نشانههای اجتماعی پیچیده.
ابزار تجسم داده ها و فروشندگان
ابزارهای تجسم داده را میتوان به روشهای مختلفی استفاده کرد. شایعترین استفاده امروز به عنوان یک ابزار گزارشگری کسب و کار (BI) است. کاربران میتوانند ابزارهای تجسم را برای تولید داشبوردهای اتوماتیک تنظیم کنند که عملکرد شرکت را در مقایسه با شاخصهای عملکرد کلیدی (KPIs) دنبال میکنند و نتایج را به صورت بصری تفسیر میکنند.
بسیاری از ادارات کسب و کار، نرمافزار تجسم داده را برای پیگیری ابتکارات خود پیادهسازی میکنند. به عنوان مثال، یک تیم بازاریابی ممکن است نرمافزار را برای نظارت بر عملکرد یک کمپین ایمیل، پیگیری معیارهای مانند نرخ باز، نرخ کلیک و نرخ تبدیل را اجرا کند.
بزرگترین نام در بازار ابزار بزرگ اطلاعات شامل مایکروسافت، آی بی ام، SAP و SAS است. برخی از فروشندگان دیگر نرمافزار تجسم داده های بزرگ را ارائه میدهند؛ نامهای محبوب در این بازار شامل Tableau ، QLIK و TIBCO است.
در حالی که مایکروسافت اکسل همچنان یک ابزار محبوب برای تجسم داده ها است، دیگران ایجاد شدهاند که تواناییهای پیچیدهتر را ارائه میدهند:
- IBM Analytics Cognos
- Qlik Sense و QlikView
- مایکروسافت power BI
- اوراکل ویژوال تجزیه و تحلیل
- sap lumira
- SAS Visual Analytics
- Tibco Spotfire
- Zoho Analytics
- d3.js
- جپی
- microstrategy
- نمودار گوگل
منبع:
[…] انتخاب نوع نمودار اشتباه، یا پیشفرض به رایجترین نوع تجسم دادهها میتواند باعث سردرگمی کاربران شود یا منجر به تفسیر […]