یکی از قابلیت هایی که در VMworld 2019 معرفی شد، پشتیبانی از VVOL برای راهکار SRM بود.
در ابتدا یه توضیح کوتاه در مورد هر کدام از این محصول ها می دهیم و در نهایت از ترکیب آنها با هم صحبت می کنیم.
SRM چیست ؟
محصولی از VMware می باشد که به ما اجازه میدهد بتوانیم به صورت اتوماتیک ماشین ها و سرویس های یک دیتا سنتر رو بر روی سایت دومی Fail-Over یا ماگریت کنیم.
سال هاست که سازمان ها برای فرار از بلایای طبیعی از سایت Disaster استفاده می کنند . محصول Site Recovery Manager شرکت VMware همین کار را انجام می دهد.
در این محصول معماری به گونه زیر است :
- سایت اول که با نام سایت محافظت شده از آن یاد می کنند، تمام سرویس های سازمان را در بر می گیرد.
- سایت دوم که با نام سایت Disaster از آن یاد می کنند، در صورتی که سایت اول برایش مشکلی پیش بیاید، سایت دوم می تواند در صورت صلاحدید ادمین ماشین های سایت اول را در بر عهده بگیرد.
خوب چرا از کلمه بر عهده گرفتن صحبت کردیم ؟
دلیل این امر این است که ما می توانیم در صورتی که پیش نیاز ها را رعایت کنیم ماشین ها را روشن از سایت اول به سایت دوم جابجا کنیم که این امر در Business Continuity بسیار اهمین دارد. اگر پیش نیاز ها را نداشته باشیم باید ماشین در سایت دوم از اول روشن شوند.
در نرم افزار های Disaster Recovery دو فاکتور بسیار مهم هستند :
- RTO (Recovery Time Objective)
- RPO (Recovery Point Objective)
برای اینکه اهمیت SRM را متوجه شویم این دو فاکتور را در مورد SRM بررسی میکنیم.
RTO (Recovery Time Objective)
مدت زمانی که یک سرویس بعد از Failure بتواند در سایت دوم روشن و اجرا شود را RTO می گویند.
ماکزیمم این مقدار توسط سازمان ها مشخص می شود .
RPO (Recovery Point Objective)
مدت زمانی که در موقع خرابی سایت اول دیتا از دست می دهیم.
برای فهم بهتر RPO احتیاج به مثالی داریم :
فرض کنیم مقدار و حجم تغییرات دیتای به گونه ای است که کپی کردن اطلاعات ماشین ها از سایت اول به سایت دوم حدود 4 ساعت طول می کشد.
یعنی کپی کردن ها (Replicate) سر ساعت های زیر انجام می شود :
- 8 صبح
- 12 ظهر
- 4بعد از ظهر
- 8 بعد از ظهر
- 12 بامداد
- 4 صبح
حال یک سوال :
اگر ساعت 11 صبح دیتا سنتر اول دچار مشکل شود، اطلاعات ما برای 8 صبح است، پس یعنی 3 ساعت اطلاعات را از دست داده ایم.
با این تنظیمات در بدترین حالت ما 4 ساعت دیتا را نخواهیم داشت.
پس زمانی که ما Replicate کردن را بر روی 4 ساعت یک بار قرار می دهیم، یعنی RPO ما که ماکزیمم زمان است همین 4 ساعت می باشد.
حداقل و حداکثر مقدار RPO برای SRM بین 5 دقیقه تا 24 ساعت می باشد.
با این توضیحات قابلیت های SRM را به صورت مختصر لیست می کنیم :
- Replicate کردن بین مدل های مختلف ذخیره ساز
- RTO 5 دقیقه ای
- ماگریت کردن بین سایت اول و سایت Disaster
- قابلیت پشتیبانی از VSAN
- قابلیت replicate کردن دو طرفه
- قابلیت ترکیب با ذخیره ساز فیزیکی
- قابلیت ایجاد ریپورت از پروسه Fail over یا ماگریت
- مانیتور کردن سایت اول و سایت دوم
- قابلیت Fail Back
VVOL چیست ؟
برای مطالعه این قسمت به مطلب VVOl مراجعه کنید .
حال در نهایت باید بدانیم که با استفاده از SPBM (Storage Policy Based Management) می توانیم ماشین های مجازی موجود در VVOL را بین دو سایت Replicate کنیم و از قابلیت های خود ذخیره ساز های فیزیکی نیز برای این Replication استفاده کنیم.
فایل هایی که توسط VVOL در Replication جابجا می شوند به شرح زیر است :
- CONFIG – Stores the VM’s vmx, logs, nvram, log files
- DATA – VMDKs – virtual machine disks (base, snapshot deltas)
- SWAP – virtual machine swap files
- MEM – virtual machine snapshot memory
- Other – vSphere solution specific type