Fault Domain اصطلاحی است که معمولا در بحثهای مربوط به دسترسی از آن یاد میشود. در IT، یک سرویس Fault Domain معمولا به گروهی از سرورها، ذخیرهساز و یا اجزای شبکه اشاره میکند که در هنگام قطعی، بطور گروهی و هم زمان تحت تاثیر قرار میگیرند. Server Rack یک مثال بارز از سرویس Fault Domain است. اگر یک سوئیچ Top-of-Rack یا واحد توزیع برق یک Server Rack دچار نقص بشود، تمامی سرورهای درون آن Rack را آفلاین میکند حتی با وجود اینکه سختافزار سرور به درستی کار میکند. در این حالت آن Server Rack به عنوان Fault Domain در نظر گرفته میشود.
هر Host در کلاستر vSAN، بطور غیر مستقیم یک سرویس Fault Domain است. vSAN بطور خودکار اجزای یک vSAN Object را در سراسر Fault Domainهای کلاستر توضیع میکند و این امر بر مبنای قانون Number of Failures to Tolerate (تعداد خطاهای قابل تحمل) موجود در ذخیرهساز پالیسی تعیین شده است. نمودار مقابل نمونه سادهای از توضیع اجزا در تمامی Hostان (Fault Domain) را نشان میدهد. دو اجزای بزرگتر، نسخه پشتیبان Object هستند و اجزای کوچکتر نشاندهنده اجزای شاهد هستند.
در زمان تعیین این که یک کلاستر از چه تعداد Host یا Fault Domain تشکیل شده، باید موارد زیر را بخاطر داشت:
- برای Objectهای vSAN که با Mirroring محافظت میشوند، بایدHost 2n+1 یا Fault Domain برای سطح حفاظتی مورد نظر انتخاب شود.
- محافظت از 1 خرابی نیازمند (2×1+1) یا 3 Host است
- محافظت از 2 خرابی نیازمند (2×2+1) یا 5 Host است
- محافظت از 3 خرابی نیازمند (2×3+1) یا 7 Host است
- برای Objectهای vSAN که با Erasure Coding محافظت میشوند، باید 2n+2 Host یا Fault Domain برای سطح حفاظتی مورد نظر انتخاب شود.
- RAID5 (3+1) نیارمند (2×1+2) یا 4 Host است
- RAID6 (4+2) نیازمند (2×2+2) یا 6 Host است.
همچنین باید درنظر داشت که ممکن است فقدان یک Fault Domain، یا Hostها زمانی که Fault Domainها پیکربندیشده نیستند، هیچ موقعیتی برای بازسازی فوری همراه نداشته باشد. VMware داشتن یک Fault Domain یا Host اضافی را برای قابلیت بازسازی در صورت وقوع خرابی پیشنهادم میکند.
استفاده از Fault Domainها برای ایزولهسازی Rack
خرابی یک دیسک یا تمامی Host در سناریو فرضی قبلی قابل تحمل است. با این حال، این واقعیت از خرابی Fault Domainهای بزرگتر مانند Server Rack کامل محافظتی به عمل نخواهد آورد. مثال بعدی ما را درنظر داشته باشید که مربوط به یک کلاستر vSAN 12-Node است. ممکن است اجزای چندگانه که یک Object را تشکیل میدهند در یک Server Rack یکسان مستقر شوند. اگر خرابی Rack اتفاق بیافتد، Object آفلاین میشود.
به منظور کاهش این ریسک، سرورها را در یک کلاستر vSAN در تمامی Server Rackها قرار دهید و یک سرویس Fault Domain را برای هر Rack در vSAN UI پیکربندی کنید. این کار باعث میشود vSAN اجزا را در تمامی Server Rackها توزیع کند تا ریسک خرابی Rack و آفلاین شدن چندین Object کاهش یابد. معمولا با عنوان «Rack Awareness» از این ویژگی یاد میشود. نمودار زیر جایگذاری اجزا در هنگام پیکربندی سه سرور در هر Rack به عنوان Fault Domainهای جداگانه vSAN را نشان میدهد.