بررسی سناریوی High Availability و Disaster Recovery در طراحی SCOM

در مقاله بررسی دسترسی‌پذیری بالا و Disaster Recovery در طراحی SCOM به بررسی قابلیت‌های دسترسی‌‌ پذیری بالا یا High Availability و Disaster recovery در System Center Operation Manager پرداختیم. در این مقاله سعی داریم به بیان سناریوهای پیاده‌سازی این ویژگی‌ها در سیستم SCOM بپردازیم.

اگر در پیاده‌سازی Operation Manager بازیابی سریع Management Group ضروری نباشد و کاربر بخواهد که از پیچیدگی‌های پیاده‌سازی Management Group دیگر بپرهیزد ، می‌تواند به منظور حفظ قابلیت Management Group، در یک دیتاسنتر ثانویه‌ Management Group را پیاده‌سازی کند.

به منظور بازیابی دیتابیس‌های عملیاتی و Data Warehouse بین دو یا چند دیتاسنتر ، پیاده‌سازی SQL Server 2014 یا 2016 با ویژگی Always on Availability Group ، به صورتی ‌که یک Two-node Fail Over Cluster Instance یا به اختصار FCI در دیتاسنتر اولیه و یک Standalone SQL Server در دیتاسنتر ثانویه به عنوان بخشی از Windows Server Fail Over Cluster یا به اختصار WSFC باید مد نظر گرفته شود. همانگونه که در نمودار زیر نشان داده شده است، Replicaی ثانویه برای Always on Availability Group باید روی Non-FCI Standard Instance باشد.

بررسی سناریوی High Availability و Disaster Recovery در SCOM

در این مثال ممکن است کاربر نیاز به پیاده‌سازی یک یا چند Windows Server با پیکربندی سخت افزاری و نام کامپیوتر یکسان و نصب مجدد Role سرور مدیریت (Management Server) با استفاده از پارامتر Recover/ داشته باشد. در طول این مدت، Agentها داده‌های جمع‌آوری شده که شامل هشدارها، وقایع، عملکرد و… می‌شوند را در Queue قرار می‌دهند تا زمانی‌که بتوانند ارتباط خود را با یک Management Server در Management Group از سر بگیرند. این رویکرد از نصب Instance‌های جدید SQL Server و بازیابی مجدد دیتابیس‌ها از آخرین Backup سالم کاربر اجتناب می‌کند. هر چند در این روش بازیابی، احتمالا تاخیر طولانی‌تری در بازگشت به حالت عملیاتی وجود خواهد داشت زیرا کاربر باید تا Roleهای دیگر را برای از سرگیری حداقل قابلیت مانیتورینگ، پیاده‌سازی کند. اگر این روش موثر واقع نشود، کاربر می‌تواند Management Serverها را در دیتاسنتر ثانویه برای ON-Standby Recovery پیاده‌سازی کند و آن‌ها را تحت عنوان بخش‌هایی از سه Resource Pool اصلی که شامل همه‌ Management Server Resource Pool، Notificationها و AD Assignment می شوند، حذف نماید. این امر همچنین شامل همه‌ی Resource Poolهای سفارشی می‌شود، که ممکن است شامل Management Servers Hosted در دیتاسنتر اولیه باشد که نیاز به ادامه عملکرد به عنوان بخشی از برنامه بازیابی را دارد.

بیشتر بخوانید: مدیریت جامع شبکه با استفاده از Microsoft System Center

سرویس‌های System Center Data Access، System Center Configuration Management ، Microsoft Monitoring Agent باید متوقف یا به صورت دستی Disable شوند و فقط در زمان اجرای Disaster Recovery باید شروع به‌کار کنند. اگر Management Server از یکپارچه‌سازی از طریق رابطی که مستقیما روی Management Server یا روی System Center Product دیگری مانند VMM، Orchestrator یا Service Manager میزبانی می‌شود، پشتیبانی می‌کند. بسته به نوع پیکربندی یکپارچه‌سازی و توالی مراحل بازیابی، این امر نیاز به برنامه‌ریزی برای مراحل بازیابی به صورت دستی یا خودکار دارد. این امر تضمین می‌کند زمانی‌که باید برنامه‌ Disaster Recovery اجرا شود برای هرگونه وابستگی دیگر به Management Server، برنامه‌ریزی شده و تحت کنترل می‌باشد.

اگر یک سایت از دسترس خارج شود شود، در صورتی که پیکربندی Agent’s Failover این اجازه را دهد، Agent به Management Server در سایت دیگری Fail Over خواهد شد. Windows Agent ها در دیتاسنتر اولیه باید به صورتی مدیریت و پیکربندی شوند تا فقط Management Serverها را در دیتاسنتر اولیه Cache کنند و از تلاش آن‌ها برای Failover یک Management Server در دیتاسنتر ثانویه جلوگیری کنند، زیرا اینکار فقط ممکن است باعث تاخیر در بازیابی و گزارش‌دهی شود. این امر درصورتی محقق می‌شود که کاربر به صورت دستی Agent را به‌شیوه‌ای خودکار‌سازی‌شده با یک Script پاورشل یا VBScript پیاده‌سازی کند تا پیکربندی از پیش تعیین شده در حین نصب، یا پس از آن انجام شود، مشروط بر اینکه کاربر Agent را از کنسول Push کند و دوباره از روش رمزگذاری مدیریت شده با راه‌حل مدیریت پیکربندی استفاده نماید.

شرکت APK نخستین شرکت دانش محور در اجرای پروژه های انفورماتیکی کشور تماس با کارشناسان 021-88539044-5

برای حفظ استمرار Management Group، می‌توان Operations Manager را روی ماشینهای مجازی Azure به عنوان گزینه‌ی جایگزین Disaster Recovery پیاده‌سازی کرد. پیاده‌سازی SQL Server روی ماشین مجازی در Azure و نه در یک پیکربندی Hybrid ضروری است، زیرا تاخیر بین Management Server و SQL Server میزبانِ دیتابیسِ Operation Manager تاثیر منفی بر عملکرد Management Group خواهد گذاشت. به منظور طراحی مناسب این روش در Azure laaS یا سایر ارائه‌دهندگان Cloud باید دامنه مانیتورینگ، توپولوژی شبکه، اتصال شبکه به Microsoft Azure که بصورت Site-To-Site VPN Express Route است، نقاط یکپارچه‌سازی با راهکارها ITSM و دیگر محصولات System Center، دسترسی کنسول، قوانین و سیاست‌های مربوط یا تنظیم شده و سایر موراد در نظر گرفته شوند.

مقاله های مرتبط:

بررسی امکانات و قابلیت‌های Operation Management Suite Backup

مفاهیم و قابلیت های System Center Operations Manager - قسمت اول

بررسی سناریوی High Availability و Disaster Recovery در طراحی SCOM

مقاله های مرتبط:

بیشتر بخوانید

درباره ما

تماس با ما

تازه ترین مقالات

عمومی

سازمانی

وبینار رایگان

نقش تاب آوری سایبری (CR) در ارتقا امنیت سازمان