جریان داده برای بسیاری از سناریوها هنگام برخورد با Power BI مفید است. یکی از مزایای بزرگ آنها جداسازی منبعداده و هر چیزی است که با آن همراه است. مزایای این معماری بسیار زیاد است. از جمله مجموعه داده های مستقل از تغییرات منبع داده، و مدیریت امنیت در لایه دیگر از منبع داده.
در این مقاله، شما را با معماری آشنا می کنیم و مزایای آن را توضیح می دهیم.
معماری جداسازی منبع داده
از جریان های داده می توان به عنوان لایه ای بین منبع داده. و مجموعه داده های Power BI استفاده کرد. این کار حتی اگر منبعداده یک پایگاهداده SQL Server یا هر ذخیره اطلاعات رابطه ای دیگری باشد نیز می تواند انجام شود. در اینجا معماری به نظر می رسد.
معماری فوق، افزودن یک لایه ذخیره سازی جریان داده در بین منبعداده و مجموعه داده Power BI است. این لایه همچنین می تواند شامل برخی تغییرات باشد. (برای کاهش مقدار ردیف ها با فیلتر کردن، یا تبدیل داده ها). یا می تواند فقط به عنوان ذخیره سازی دیگری قبل از اینکه مجموعه داده Power BI از آن داده به عنوان منبع استفاده کند، استفاده شود.
مزایای معماری جداسازی منبع داده
مزایای بسیاری برای معماری ذکر شده در بالا وجود دارد. در اینجا برخی از این موارد ذکر شده است.
- خواندن از منبعداده را کاهش دهید.
- دسترسی امنیتی کاربران می تواند در گردش داده اعمال شود.
- نمای کوچکتر از داده ها را می توان از طریق جریان داده به اشتراک گذاشت.
- نیاز به دروازه برای تازه سازی مجموعه داده را کاهش می دهد.
- دسترسی به منبعداده از هرجای دیگر با اتصال به اینترنت (بدون VPN یا اتصال از قبل لازم است).
- هرگونه تغییر / به روزرسانی منبع داده تاثیری در مجموعه داده ها نخواهد داشت.
بیایید نگاهی دقیق به موارد بالا بیندازیم.
خواندن را از منبع داده کاهش دهید.
اگر مجموعه داده Power BI (یا گزارش) داده ها را مستقیماً از منبع داده دریافت کند. هر بار برای تازه کردن ، داده ها را از منبع داده بخواند. این می تواند در زمان های برنامه ریزی شده تازه سازی مجموعه داده منتشر شده ، یا حتی در زمان هایی باشد که یک توسعه دهنده گزارش داده ها را در Power BI Desktop تازه می کند.
در سناریوهایی که داده ها از سیستم منبع عملیاتی خوانده می شوند. کاهش میزان READ ها از سیستم منبع بسیار توصیه می شود. آخرین چیزی که شما می خواهید این است که کاربران سیستم عامل. هر زمان که یک مجموعه داده Power BI در اوج حجم کار خود تازه می شود. افت عملکرد را در سیستم زنده خود احساس کنند.
گردش داده ها به عنوان لایه ای بین منبع داده و مجموعه داده مورد استفاده قرار می گیرد. به این معنی است که مجموعه های داده به جای منبع داده ، از جریان داده READ خواهند داشت.
دسترسی امنیتی کاربران می تواند در گردش داده اعمال شود.
غالباً منبع داده شامل داده ها و موجودیت های بیشتری از آنچه در گزارش استفاده شده است می باشد. معمولاً دستیابی به سیستم مبدا نیازمند طی مراحل و ورود به سیستم است که ممکن است مراحل زیادی را طی کند. خصوصاً به دلیل اینکه در منبع داده بیش از آنچه در گزارش لازم است وجود دارد.
دسترسی به پایگاه داده سرور SQL با صدها جدول چیزی است که نیاز به ملاحظات زیادی دارد. با این وجود ، اگر یک لایه گردش داده در بالای این منبع فقط با دو جدول از آن وجود داشته باشد، دسترسی به کاربران به آن گردش داده بسیار راحت تر است.
نمای کوچکتر از داده ها را می توان از طریق جریان داده به اشتراک گذاشت.
یکی از نگرانی های اصلی DBA ها یا مدیران پایگاه داده هنگام درخواست دسترسی به جدول پایگاه داده، مقدار داده های خوانده شده از پایگاه داده است. اگر جدولی با 500 میلیون ردیف در پایگاه داده وجود داشته باشد و کسی بخواهد تمام آن جدول را به Power BI وارد کند ، ممکن است بر عملکرد منبع داده تأثیر بگذارد.
از گردش داده می توان به عنوان لایه ای در بالای این منبع استفاده کرد. که فقط داده های مورد نیاز را در خود دارد. ممکن است داده های جمع شده یا داده های فیلترشده برای آخرین دوره های قبلی مورد نیاز برای تجزیه و تحلیل باشد.
نیاز به دروازه برای تازه سازی مجموعه داده را کاهش می دهد.
اگر این منبع در محل واقع شده باشد. Gateway یک عنصر اضافی را در تازه سازی یک مجموعه داده وارد می کند. هر مجموعه داده ای که از آن منبع داده استفاده می کند، باید از آن دروازه برای فرآیند تازه سازی عبور کند.
هنگامی که گردش داده به عنوان لایه ای بین مجموعه داده و این منبع استفاده می شود، فقط یک ورودی برای تازه سازی جریان داده مورد نیاز است. اما نه برای مجموعه داده ها. در نتیجه داده های تازه شده می توانند سریعتر و قابل اطمینان تر باشند.
دسترسی به منبعداده از هرجای دیگر با اتصال به اینترنت (بدون VPN یا اتصال از قبل لازم است).
غالباً توسعه دهندگان گزارش نیاز به اتصال به VPN یا شبکه داخلی دارند. تا گزارش هایی را تهیه کنند که از یک منبع داده داخلی استفاده می کنند.
اگر از جریان داده به عنوان لایه ای در این بین استفاده شود. توسعه دهندگان گزارش فقط به اتصال اینترنت احتیاج دارند.
هرگونه تغییر / به روزرسانی این منبع تاثیری در مجموعه داده ها نخواهد داشت.
معرفی یک لایه بین منبعداده و مجموعه داده ها باعث کاهش وابستگی فراداده به سیستم منبع می شود.
اگر 15 مجموعه داده Power BI با استفاده از جدول پایگاه داده SQL Server وجود داشته باشد. و پایگاه داده اکنون به پایگاه داده Oracle منتقل شده باشد. تمام این 15 مجموعه داده باید با تغییر در داده های دریافت و کد Power Query آنها به روز شوند.
با این حال ، اگر آن 15 مجموعه داده Power BI اطلاعات خود را از یک جریان داده دریافت کنند، به هیچ وجه تحت تأثیر قرار نخواهند گرفت. اگر سیستم پایگاه داده به اوراکل منتقل شود. فقط فراداده و کد جریان داده باید به روز شود. حفظ راه حل از این طریق بسیار آسان تر خواهد بود.
مفهومی که در اینجا ذکر شد وجود یک لایه ذخیره اطلاعات بین داده های منبع. و مجموعه داده های Power BI است. برای بسیاری از کاربران Power BI بدون داشتن پس زمینه پایگاه داده ، ذخیره سازی و تبدیل جریان داده راهی عالی برای دستیابی به آن است. با این حال ، اگر شما یک پایگاه داده حرفه ای و دارای مهارت کافی در پایگاه داده ها و فن آوری های ادغام داده ها هستید. ابزار خود را انتخاب کنید و آن را به روش خود پیاده سازی کنید.
خلاصه
جداسازی این منبع یکی از تکنیک هایی است که من در معماری Power BI بسیار توصیه می کنم. همانطور که در بالا ذکر شد ، مزایای زیادی دارد. با این حال ، یک لایه در توسعه Power BI اضافه می کند. و ممکن است در ابتدا به زمان توسعه بیشتری نیاز داشته باشد. با این حال ، تلاش در ابتدای کار ارزش بلند مدت را دارد.
بدون دیدگاه