آمادهسازی و جابجایی ساده، قدرتمند و یکپارچهی دادهها در Cloud
در عصر Cloud Computing، سازمان ها حجم انبوهی از اطلاعات را که شامل Big Data و (Internet of Things (IoT می شود، تولید میکنند. در مقایسه با Business Intelligence یا BI، در حال حاضر حجم بیشتری از دادهها ایجاد میشوند و تیمهای کارشناسی داده نیز زمان و منابعی را برای تجزیه و تحلیل در اختیار دارند. در واقع، طبق تحقیقات Forrester مشخص شد که اجرای 68 درصد از درخواستهای ساده BI برای سازمانهای IT، به مدت چندین هفته، چندین ماه و یا حتی مدت زمان بیشتری به طول میانجامد.
سازمانها برای آنکه در میان درخواستها برای داده جدید، در مسیر پیشرفت قرار گرفته و همچنان موقعیت رقابتی خود را نیز حفظ نمایند، باید به دنبال روشهایی باشند تا مسیر کارشناسان تجاری را تغییر داده و آنها را به کاربران متخصص در زمینه داده تبدیل نمایند و بدین ترتیب بخشی از مسئولیتهای IT را بر عهده گیرند. بهرحال این فرآیند با چالشهای خاصی همراه میباشد: به عبارتی توانمندسازی کاربران تجاری با برخی از ابزارها با هدف دستهبندی، آمادهسازی و تجزیه و تحلیل سریع دادهها از تعداد زیادی از منابع، به صورت On-Premise و Cloud بدون نیاز به تخصص فنی و دقیقِ مدیر پایگاهداده یا کارشناسان داده صورت میگیرد.
اما با سرویسهای جدید Cloud شرکت IBM، نظیر IBM DataWorks این امکان وجود دارد که کاربران تجاریِ فنی و غیرفنی قادر به کسب دانش مفیدی از دادههای ذخیره شده به صورت Local در صفحات Excel یا پایگاههای داده حجیم در Cloud، همراه با دسترسی Point یا Click گردند.
IBM DataWorks چیست؟
DataWorks، یک سرویس کاملا مدیریت شده برای آمادهسازی و جابجایی داده میباشد و این قابلیت را برای تحلیلگران، Developerها، کارشناسان داده و مهندسین داده فراهم میسازد تا دادهها را از طریق یک واسط کاربری ساده اما قدرتمندِ مبتنی بر Cloud مورد استفاده قرار دهند. تحلیلگران تجاری یا کاربران Power Excel ، با این تکنولوژی به عنوان یکی از اجزای مهم مجموعه سرویسهای IBM Cloud Data، میتوانند فرآیند شناسایی، استانداردسازی، جابجایی و تغییر دادهها را با پشتیبانی توسعه برنامه و تجزیه و تحلیل موارد استفاده، انجام دهند.
DataWorks به واسطه ادغام شدن با سرویسهای داده Cloud نظیر Data Warehouse یا به عبارتی انبار دادهی IBM dashDB Cloud، پایگاهدادهIBM Cloudant NoSQL و IBM Watson Analytics، یک ابزار یکپارچه و بدون محدودیت برای آمادهسازی و جابجایی دادهها از موقعیت On-Premise و Off-Premise به اکوسیستم Cloud به شمار میرود که به سرعت تجزیه و تحلیل شده و تصویرسازی میگردد. به علاوه، این تکنولوژی با ارائه مستمر خدمات و افزودن ویژگیها و قابلیتهای جدید به طور منظم، پشتیبانی میشود. همچنین موتور پردازشگر آن بر روی Apache Spark ارائه میگردد که به دلیل رشد و توسعه مستمر به عنوان پروژه برتر برای تجزیه و تحلیل متن باز به شمار میرود. نتیجه، ارائه بهترین راهکار است که از قابلیت همگام شدن با رشد سریع نوآوری در Big Data و Cloud Computing برخوردار است.
ایجاد دسترسی عمومی به دادهها در سراسر سازمان
با استفاده از تکنولوژیهای روز، نمیتوان به این زودی نتیجه گرفت که هر کسی میتواند یک کارشناس داده باشد؛ اما در عین حال ابزاری مانند DataWorks، فرآیند دسترسی عمومی به دادهها و تجزیه و تحلیل پیشرفته برای همه افراد را در سازمان میسر مینماید. روشهای بیشماری برای استفاده از DataWorks در سازمانها وجود دارد اما موارد کاربرد اصلی آن شامل موارد زیر میشود:
1-ترکیب دادهها از چندین منبع مختلف: دسترسی به دادهها از هر منبع پشتیبانی شده و ترکیب آنها به منظور ایجاد یک فایل یا جدول مرتبط با موضوع تحلیلِ مورد نظر
-مثال: کارشناس داده قصد دارد الگوریتمهایی را بر اساس تحلیل اطلاعات مشتریان و دادههای مربوط به مخاطبان از منابع Third-Party نظیر Nielsen، Rovi، Twitter، Rotten Tomatoes و EIDR جهت طراحی آگهی ارائه نماید. dashDB به عنوان مخزن دادههای مهم رسانه، Cloudant برای ذخیرهی محتوای چندساختاری و DataWorks برای شکلدهی و تصحیح دادههای ترکیبی به کار برده میشوند تا دادهها برای ارائه گزارشگیری آماده گردند.
2-دسترسی به دادهها در فضای Hybrid Cloud: دسترسی به دادهها در هر جایی که باشند با اتصال به اشتراکیترین منبع داده در کسبوکار صورت گرفته و به راحتی و در شرایط ایمن به دادههای پشت فایروال دسترسی مییابد.
– مثال: یک کاربر برای ارزیابی میزان اثربخشی طرحهای بازاریابی، نیازمند دسترسی به دادههای حاصل از ارزیابی احساسی مشتریان خود که بر روی Cloud ذخیرهشده است و همچنین دادههای کمپین بازاریابی از یک پایگاه On-Premise میباشد. در این صورت با DataWorks، میتواند یک مسیر امن را برای بازیابی دادههای پشت فایروال تنظیم نماید.
3- ایجاد دادههای خام برای تجزیه و تحلیل: مقادیر و ستونهای داده را فیلتر نموده و پس از دسته بندی، موارد تکراری را حذف مینماید تا کیفیت دادهها را از طریق امتیازات استاندارد شده مشخص نماید.
– مثال: تحلیلگر تجاری باید پیشبینی فروش را بر اساس دادههای بازههای زمانی گذشته (مثلا دادههای مربوط به فروش در سال قبل) انجام دهد. برای این تحلیلگر، قابلیت دسترسی به پایگاهداده فروش On-Premise وجود دارد اما در مورد کیفیت و میزان مرتبط بودن دادهها قبل از ارائه گزارش اطمینانی وجود ندارد. این تکنولوژی، یک امتیاز کیفیت را ارائه نموده و امکان پیشنمایش دادهها را برای کاربران فراهم مینماید، بنابراین قادرند به صورت دیداری تایید کنند که دادههای مناسب و درست را در اختیار دارند. به علاوه، DataWorks قابلیت فیلتر نمودن موارد نامناسب را نیز دارد.
4- بارگذاری دادهها جهت انجام فرآیند تجزیه و تحلیل: امکان دسترسی به دادههای آماده را در هر جایی فراهم نموده و آن را در سرویس داده بر روی Cloud بارگذاری مینماید.
– مثال: کارشناس داده باید تعداد کمی فایل را از یک منبع داده On-Premise در dashDB Cloud مربوط به خود بارگذاری نماید تا بتواند مدلهای آماری را برای پروژههای حفظ مشتری ارائه نماید. تکنولوژی DataWorks، دسترسی آسان Point-And-Click را ارائه مینماید تا جدولها و فایلها را جهت جابجایی منبع داده مورد نظر انتخاب نماید.
5- کنترل جریان کاری دادهها از برنامه تحت وب: از APIهای DataWorks برای ایجاد و کنترل عملکردهای جریان کاری حاصل از یک برنامه استفاده مینماید.
-مثال: ارائهدهندگان برنامه بر اساس رویدادهایی که از سنسورهای اینترنت اشیا (IoT) و سیستمهای تعاملی مانند سیستمهای اجتماعی و Mobile (سیار) ناشی میشود، میتوانند باعث ایجاد فعالیتی توسط تحلیلگران تجاری، کارشناسان داده یا مدیران IT گردنند و دادهها را با استفاده از APIهای DataWorks جابجا و اصلاح نموده و تغییر دهند.
6-دادههای رابطهای و ساختاریافته را برای دادههای نیمهساختار یافته طراحی مینماید: دادههای استاندارد جدولی را در مخزن NoSQL مربوط به Cloudant بارگذاری مینماید.
-مثال: Developer باید دادههای رابطهای را برای استفاده در برنامههای وب در Cloudant بارگذاری نموده و دادههای استاندارد را در ساختارهای سلسله مراتبی JSON وارد نماید. DataWorks بر منبع دادههای رابطهای و Cloudant مربوط به NoSQL اشاره میکند و بدین طریق دادههای رابطهای را به اسناد JSON تبدیل میکند.
ــــــــــــــــــــــــــــــــــــــــــــــ
مفهوم IBM DataWorks و کاربردهای آن – قسمت اول