در قسمت اول از مقاله ی Hunk به معرفی و بررسی این پلتفرم که جهت تجزیه و تحلیل نرم افزار Splunk در DataStoreهای Hadoop و NoSQL می باشد، پرداخته شد. در این قسمت به بررسی قابلیت های مهم پلتفرم Hunk می پردازیم.
قابلیتهای مهم پلتفرم Hunk
همانطور که پیشتر اشاره گردید؛ Hunk، پلتفرمی سریع جهت تجزیه و تحلیل در Hadoop و NoSQL می باشد که قابلیت های منحصر به فرد آن بسیاری از سازمان ها را ترقیب به استفاده از آن می نماید. در زیر به برخی از ویژگی های مهم این پلتفرم می پردازیم.
- تجزیهوتحلیل پیشرفته و یکپارچه
این قابلیت به بررسی، تحلیل و تجسم سریع دادهها می پردازد، به عبارتی دیگر با استفاده از ایجاد داشبوردها، می توان گزارشات واصله از یک پلتفرم تحلیلی یکپارچه را که با ذخیرهسازهای دادهی Apache Hadoop و NoSQL کار میکنند، به اشتراک گذاشت. علاوه بر آن می توان به تحلیل عمقی و یافتن اشکالات در چند ترابایت یا پتابایت از دادههای خام دست پیدا نمود. با کمک این قابلیت، می توان از هر جستجویی بیرون آمد و بهصورت خودکار الگوهایی معنادار در دادههای خود شناسایی کرد.

Hunk یک پلتفرم پیشرفتهی تحلیلی است که ارزش ماهها یا سالها Big data را نشان میدهد.
- کاربری و گسترش سریع
بهسادگی می توان Hunk را به سمت کلاستر Hadoop سوق داد و مستقیماً بررسی و تحلیل دادهها را آغاز نمود. با استفاده از Data Explorer wizard می توان مرتبطترین دستههای داده را جهت تحلیل در Hunk انتخاب نمود تا دادههای خام را در Hadoop مرور و آمادهسازی کرد.
- جستجوی تعاملی (Interactive Search)
فناوری Schema-on-the-Fly به این معناست که نیازی به دانستن چیزی دربارهی دادهها نمیباشد. Hunk بهصورت خودکار ساختار را اضافه کرده و فیلدهای مورد نظر در زمان جستجو (Quary) نظیر “کلمات کلیدی، الگوهای زمانی، ارزشهای بالا و غیره” را شناسایی مینماید. توجه نمایید که تشخیص الگوی رخدادها (Event Pattern) بهصورت خودکار الگوهای معنادار دادههای شما را شناسایی مینماید.

Interactive Search
- فرمتهای تحتپشتیبانی دادهها
این پلتفرم دسترسی به فایلهای متنی و فایلهای متوالی را در کنار فرمتهای دادهی معروفِ Apache Hive از جمله RCFileها، فایلهای ORC و فایلهای ستونی Parquet خودکارسازی مینماید.
- تسریع گزارش (Report Acceleration)
بهبود قابلتوجهی در زمان پاسخ گزارشدهی و عملکرد کلاستر بهوسیلهی Transparently Caching داده، با انتخاب یک گزینه، فراهم می شود.
- پیشنمایش نتایج (Results Preview)
وقتی در Hunk، یک Query آغاز می شود، به سرعت نتایج موقت نمایش داده می شوند و همزمان کار MapReduce در پسزمینه ادامه مییابد؛ همچنین عملیات را میتوان Pause و Queryها را بدون نیاز به انتظار برای تکمیل کارهای MapReduce تصحیح نمود، که این امر باعث تجربه تعاملیتر و سریعتر میگردد.

Results Preview
- تحلیلهای Drag and Drop
این پلتفرم تیمهای کسبوکار و IT را قادر به تجزیه و تحلیل دادههای خام در ذخیرهسازهای دادهی Hadoop و NoSQL میسازد. مدلهای داده، روابط بین دادههای خام را تشریح کرده و آنها را معنادارتر و کاربردیتر مینماید. همچنین میتوان با استفاده از Pivot سریعاً چارتها، موارد بصری و داشبوردها را تولید نمود.

Drag and Drop
- محیط غنی توسعهدهنده
چارچوب وب باعث میگردد ساخت appها روی Data Store سیستم فایل توزیعی Hadoop یا به عبارتی HDFS و یا NoSQL مانند ساخت هر برنامهی مدرن تحت وبِ دیگری باشد. این چارچوب به توسعهدهندگان این امکان را میدهد که دادهها و عملکرد Hunk را با برنامههای Big dataی سازمانی و با استفاده از یک چارچوب وب استاندارد مبنا، REST APIی ثبت شده و همچنین بستههای توسعهی نرمافزار (SDKها) برای C#، Java، JavaScript، PHP، Python و Ruby تجمیع نمایند. توسعهدهندگان میتوانند بوسیلهی ایجاد داشبوردهای سفارشی، اجزای انعطافپذیر UI و مجازیسازهای سفارشی داده و با استفاده از زبانهای رایج توسعهدهی نظیر JavaScript، HTML5 و Python، برنامههای Hunk را تولید نمایند.

Rich Developer Environment
- داشبوردها و نماهای سفارشی
همکاران فنی و تجاری میتوانند با یک واسط کاربری ساده، داشبوردها را اصلاح و انواع چارتها را تغییر دهند. همچنین می توان جهت تغییر دیدگاهها، همپوشانسازی چارتها و نفوذ به دادهها از هر جایی در یک چارت یا داشبورد، به رخدادهای خام زیرین، Pan و Zoom نمود. این امکان وجود دارد که گزارشات را ذخیره، آنها در داشبوردها تجمیع کرده و تمامی آنها را از روی Desktop یا موبایل رویت کرد. علاوه بر موارد فوق پنلهای داشبورد را میتوان مستقلاً ذخیره و در تیمها به اشتراک گذاشت.

Dashboard and Views
- دسترسی منبع
کنترلهای دسترسی Roleمحور از دادههای حساس حفاظت میکنند. احراز هویت Pass-Through، امکان ارسال کارهای MapReduce و دسترسی امن به کلاسترهای Hadoop را با استفاده از اعتبارات تاییدشده و نقشهای محوله توسط IT فراهم میسازد.
- برنامههای Hunk
برای بررسی، تحلیل و تجسم دادهها در NoSQL یا سایر ذخیرهسازهای داده از جمله Apache Accumulo، Apache Cassandra، MongoDB و Neo4j، پلتفرم تحلیلی Hunk را می توان فعال کرد.
- شروع کار با Hunk Sandbox
جهت فراگیری Hadoop، Hank، جستجوی تعاملی و تجزیه و تحلیل، نیاز به دانلود برنامهای می باشد که روی سیستمعاملهای ویندوز، Apple و Linux بدون نیاز به راهاندازی کلاستر Hadoop اجرا میشود. Hunk Sandbox شامل Apache Hadoop، نرمافزار Hunk، یک راهنمای گام به گام و داشبوردهای نمونه می باشد.
- Hunk 6.2 برای استفاده در محیط های عملیاتی
Hunk تقریباً با هر توزیع Hadoop درحال اجرا روی لینوکس ۶۴بیتی، از جمله هر توزیع سازگار MapReduce 1.0 و توزیعهای YARNیا MapReduce 2.0 کار خواهد کرد. Hunk با توزیع Hadoop دلخواه کاربر از جمله Cloudera CDH، پلتفرم Hortonworks Data، IBM InfoSphere BigInsights و Pivotal HD کار میکند.
- Hunk روی AWS Cloud
علاوه بر گزینهی بکارگیری Hunk برای کلاسترهای On-premise مربوط به Hadoop، Hunk بهعنوان یک نمونهی ازپیشپیکرهبندیشده، روی Cloud سرویس وب آمازون (AWS) نیز موجود می باشد. بنابراین مشتریان AWS شرکت آمازون، می توانند Licenseهای Hunk را از AWS نیز تهیه نمایند. توجه نمایید که این پلتفرم روی لینوکس ۶۴بیتی، ویندوز و یا Apple نیز قابل اجرا می باشد.
ــــــــــــــــــــــــــــــــــــــــــــــ
بررسی و مفهوم Hunk، پلتفرم تجزیه و تحلیل Splunk برای Hadoop- قسمت اول
بررسی و مفهوم Hunk، پلتفرم تجزیه و تحلیل Splunk برای Hadoop- قسمت دوم(پایانی)