در قسمت اول از سری مقالات “بررسی IBM BigInsights برای Apache Hadoop” به تشریح این تکنولوژی شرکت IBM و همچنین مفهوم Big SQL پرداختیم. در این قسمت به صورت تخصصی تر به قابلیت های آن می پردازیم.
تصویرسازی و شناسایی داده ها در IBM BigInsights
با استفاده از تکنولوژی BigInsights، قابلیت شناسایی و آنالیز موردی، برای تمامی دادههای ذخیره شده در این پلتفرم فراهم شده و کاربران میتوانند تصویرسازی دادهها را به چندین شیوه مختلف انجام دهند.
BigSheets، شناسایی دادهها و داشبوردها
BigSheets، یک ابزار مبتنی بر مرورگر و به صورت Spreadsheet میباشد که امکان شناسایی، تغییر و آنالیز Big Data را برای کارشناسان داده و کاربران تجاری فراهم مینماید.
BigSheetsها میتوانند در اجرای موارد زیر به کاربران تجاری کمک نمایند:
- ادغام و شناسایی حجم زیادی از دادهها با فرمتها و ساختارهای متفاوت
- استخراج و غنیسازی دادهها با استفاده از فرآیند تجزیه و تحلیل متن
- شناسایی و مجازیسازی دادهها با چارتها و Pivot Tableها
علاوه بر موارد ذکرشده، BigInsights دارای داشبوردهای متمرکزی میباشد که کسب اطلاعات و آنالیز نتایج در مقیاسهای بزرگ را برای تحلیلگران تجاری ممکن میسازد. مدیران سیستم میتوانند برای مانیتور نمودن شاخصهای کلیدی عملکرد درIBM BigInsights برای کلاستر Hadoop، از داشبورد استفاده نمایند.
ابزارهای توسعه ی IBM BigInsights
BigInsights، از یک فضای توسعه مبتنی بر Eclipse جهت ساخت و پیادهسازی برنامههای کاربردی استفاده مینماید. نحوه عملکرد این پلتفرم بدین صورت میباشد که، Editorهایی را برای اجزای مختلف Hadoop مانند Java MapReduce، Hive و Pig فراهم نموده و همچنین یک واسط کاربری برنامهنویسی را برای Big SQL، Oozie Workflow و Text Analytics یا آنالیز متنی ارائه مینماید.
BigInsights IBM دارای یک ابزار چرخهعمر توسعهی یکپارچه میباشد و این ابزار به کاربران کمک مینماید تا دادهها را از Hadoop نمونه برداری کرده و به محیط توسعه منتقل نمایند و برنامههای کاربردی را در کلاستر، توسعه، تست و پیادهسازی نمایند.
ابزارهای تجزیه و تحلیل و موتورهای پیشرفته در IBM BigInsights
تکنولوژی IBM BigInsights شامل مجموعهی پیچیدهای از ابزارها و قابلیتهای تجزیه و تحلیل میباشد که هیچ هزینهی اضافی را در بر نمیگیرد. سازمانها میتوانند به سرعت الگوهای مربوط به دادههای خود را شناسایی نموده و متناسب با آن برنامههای آنالیز قدرتمند و سفارشی ایجاد کنند. این برنامهها میتوانند نتایج و اطلاعاتی را که برای نیازهای خاصی از کسب و کار طراحی شدهاند، ارائه نمایند.
آنالیز متنی پیشرفته یا Text Analytics
BigInsights دربر گیرندهی یک موتور قدرتمند آنالیز متنی میباشد که توسط IBM Research ارائه شده است. کاربران با استفاده از یک مجموعه جامع از قواعد یا با ارائه قوانین مورد نظر خود میتوانند آیتمهای مورد توجه در اسناد و پیامها، شامل افراد، آدرس ایمیل، آدرس پستی، شماره تلفن، URL، شرکتهای سرمایهگذاری مشترک، اتحادیهها و موارد دیگر را به سرعت استخراج و شناسایی نمایند.
آنالیز دادههای عمومی با قابلیت Social Data Analytics Accelerator
Social Data Analytics Accelerator، این امکان را برای کاربران فراهم مینماید تا انواع مختلفی از دادههای عمومی را آنالیز نموده و به اطلاعات کلیدی کاربران برای پشتیبانی از (BI (Business Intelligence دست یابند. این بخش میتواند اطلاعات مهم مشتریان که شامل تشخیص مواردی همچون احساسات مشتریان در هنگام خرید، تمایل آنها نسبت به خرید، مالکیت سرویس/محصول و همچنین ویژگیهای دیگر جمعیت شناختی مانند جنسیت، موقعیت مکانی، وضعیت پدر و مادر، وضعیت تاهل، وضعیت شغلی، علایق و محصولی که مشتری آن هستند، را هوشمندانه جمعآوری نماید. سازمانها میتوانند از این ویژگیها برای ساخت برنامههای کاربردی نظیر برنامههای حفظ مشتری، جلوگیری از کاهش مشتری، کسب مشتری و کمپینهای بازاریابیِ بهره گیرند.
آنالیز دادههای ماشینی با Machine Data Analytics Accelerator
Machine Data Analytics Accelerator میتواند طیف وسیعی از دادههای ماشینی را از منابعی همچون Logفایلها، تجهیزات هوشمند و Telemetry تجزیه و استخراج نموده و کمک نماید تا این فرآیند به جای چند روز یا چندین هفته در عرض چند دقیقه انجام شود. بدین ترتیب سازمانها میتوانند در مورد عملیاتها، تراکنشها و رفتار سیستمی اطلاعات مطلوبی کسب کنند و از این اطلاعات برای افزایش کارایی عملیاتی، عیبیابی یا شناسایی ریشه مشکلات و بررسی رویدادها استفاده نموده و مانع قطعی یا کاهش سطح سرویس شوند.
کانکتورهای IBM BigInsights
تکنولوژی Big Data میتواند نقش مهمی را در زنجیره عرضه اطلاعاتِ سازمانها ایفا نماید، اما این تاثیر تنها در صورتی به وجود میآید که این تکنولوژی کاملا با سیستمهای فعلی یکپارچه شده باشد. IBM این موضوع را تشخیص داده و BigInsights را با کانکتورهای پرسرعت برای تمامی انواع دادهها (ساختاریافته، بدون ساختار و Streaming) و تمامی منابع (انبار داده یا Data Warehouse، رسانه اجتماعی یا Social Media، Log Data و غیره) ارائه نموده است. کانکتورهای یکپارچهسازی Built-In از این قابلیت برخوردارند که دادهها را به سیستمهای ساختاریافته همانند فایل سیستم Hadoop منتقل نمایند، در حالی که BigInsights میتواند دادههای بدون ساختار را به طور مستقیم تجزیه و تحلیل نماید.
BigInsights به ارائه کانکتور برای نرمافزار پایگاهداده IBM DB2، IBM PureData Systems (که از شاخهی تجهیزات مربوط به انبارهای داده میباشد)، تجهیزات IBM Netezza، IBM InfoSphere Warehouse و IBM Smart Analytics System میپردازد. این کانکتورهای پرسرعت به تسهیل و تسریع فرآیندهای استفاده از دادهها کمک مینمایند. کانکتورهای Standard Java Database Connectivity یا به اختصار JDBC، این امکان را برای سازمانها فراهم مینمایند تا با طیف وسیعی از سیستمهای اطلاعاتی و داده شامل Oracle، Microsoft SQL Server، MySQL و Teradata ترکیب گردند.
علاوه بر قابلیتهای ذکر شده، IBM InfoSphere DataStage دارای کانکتوری است که دادههای BigInsights میتوانند در کارهای ETL یعنی Load Extract, Transform, یا ELT یعنی Extract, Load, Transform در InfoSphere DataStage استفاده شوند.
در قسمت بعدی از این تکنولوژی که قسمت پایانی نیز می باشد به مقوله امنیت و مدیریت این تکنولوژی بیشتر می پردازیم.
ــــــــــــــــــــــــــــــــــــــــــــ
بررسی IBM BigInsights برای Apache Hadoop – قسمت اول
بررسی IBM BigInsights برای Apache Hadoop – قسمت دوم
بررسی IBM BigInsights برای Apache Hadoop – قسمت سوم (پایانی)