قبل از انتخاب تجهیزات و ملزومات چرخه Data Protection شایسته آن است که در ابتدا سیاست های مدیریت مجموعه در سرویس دهی مشخص گردد .گام اول در این سیاست انتخاب RPO و RTO می باشد .این دو پارامتر چه تعریفی داشته و چگونه تاثیر گذار خواهند بود .
تعریف RTO :
مدت زمان تحمل یک سازمان در صورت بروز خرابی و اشکال تا سرویس دهی مجدد را RTO (recovery time objective ) می نامند .هر سازمان ملزم به تعین بازه زمانی طولانی ترین و کوتاهترین زمان تحمل سازمان در وقفه می باشد. . معیار و ملاک هر مجموعه برای تعین این پارامتر خسارت ریالی ، بار سیاسی و . . . خواهد بود .
با نگاه به افق تکنولوژی و الزام رعایت بسیاری از پارامتر های نوین، شایسته است هر سازمان در تببین این سیاست اقدام نموده و RTO خود را مشخص نماید. . توضیح آنکه این زمان می تواند به صفر نزدیک و یا صفر باشد اما هرچه به زمان صفر نزدیک تر می شویم هزینه نیز افزایش خواهد یافت .
بعد از تعریف آستانه تحمل زمانی سازمان در بروز وقفه (RPO) متخصصین مرکز داده می بایست بر این پایه تجهیزاتی را انتخاب نمایند که با توجه به معیار های فرآیند نسخه دوم اطلاعات و آرشیو که در ابتدای این نوشتار ذکر شده ، پاسخگوی مدت زمان تعریف شده جهت وقفه در سیستم باشند .
همخوانی تجهیزات انتخابی با RTO بسیار مهم می باشد . در برخی از مجموعه ها Overdesign شده و در برخی دیگر تجهیزات بسیار ناکارآمد تر از RTO تعین شده می باشد .
تعریف RPO :
میزان آستانه تحمل یک سازمان در از دست رفتن اطلاعات را RPO می نامیم . بعنوان مثال اگر آخرین نسخه Backup تعین شده مربوط به 4 بامداد بوده و سیستم در ساعت 8 بامداد دچار وقفه گردد مجموعه بین ساعت 4 تا 8 بامداد هیچ Backup تهیه نکرده و 4 ساعت از داده ها را از دست خواهد داد .
نکته کلید مطلب آنجاست که هر مجموعه می بایست بر اساس زمان RTO خود تجهیزاتی را انتخاب نمایند که در بازه زمانی تعین شده توانایی بازیابی و بازخوانی اطلاعات را داشته باشد .
این نگاه ، نگاهی به محدوده تجهیزات صنعت انفورماتیک می باشد .
تجهیزات ذخیره سازی داده ها در مراکز انفورماتیک به 3 لایه تفکیک می گردند .
- لایه Small
- لایه MID range
- لایه Enterprise
تمامی تجهیزات در لایه Small تنها برای مراکزی مفید خواهد بود که حجم یا کارائی کوجکی داشته باشند . بعنوان مثال یک شرکت با 20 پرسنل و یا حجم اطلاعات بسیار کوجک که خرابی سیستم چندان توفیری در مجموعه نداشته باشد.
تجهیزات لایه MID range و Enterprise واحد اندازه گیری مشخصی نداشته و الزاما می بایست کارشناسی گردد . پس از کارشناسی های انجام شده می توان نتیجه گرفت که آن مجموعه در کدام لایه قرار دارد .
بعنوان مثال در کشور های صنعتی هر مجموعه با حجم داده های تا 200 ترابایت ، در محدوده Mid-Range قرار گرفته می شود . اما در ایران مجموعه ها با این محدوده در رده Enterprise می باشد. لازم به ذکر است مشاوران هموراه می بایست مراقب مقوله ناپسند Overdesign باشند.
هرچند که در بیش از 95 % از مراکز به استاندارد های لازم جهت فرآیند Data Protection Data Protection توجه نمی گردد اما این مجموعه خود را ملزم به نشر دانش و اطلاع رسانی در این زمینه می دارد .
میزان ریسک از دست رفتن هر داده بری مجموعه
میزان ریسک از دست رفتن داده ها بر حسب نوع داده و نوع کاربرد آن متفاوت است . برخی از داده ها مانند حساب بانکی سرمایه گذاران یک بانک حساسیت ویژه ای را طلب می نماید و تحت هیچ شرایطی از دست رفتن داده ها تحمیل پذیر نمی باشد .
چگونگی نگهداری از داده ها (Data Protection)
هریک از داده ها می بایست در محل خاصی که ویژگی نگهداری همان نوع از داده ها را داشته باشد نگهداری شود . این بدان معنی است که صرف وجود یک فضای مبتنی بر دیسک و Tape به معنی موقعیت مناسب ذخیره سازی نخواهد بود . بعنوان مثال در نظر بگیرید که فضای نگهداری فایل REDO در بانک اطلاعاتی اوراکل دیسک هایی از نوع SSD نمی باشد . اما اصل بانک داده ها در اوراکل می بایست در غاب شرایط در این رسانه ذخیره گردد . مثال فوق نشان می دهد حتی با وجود یک عملکرد ( بانک اطلاعاتی اوراکل ) محل نگهداری داده ها بصورت تفکیک شده متفاوت خواهد بود .
چگونگی بروز رساندن و بازیابی داده ها
بروز رسانی داده ها در ین چرخه به معنی Transaction ها نبوده و در واقع مفهوم آن بروز رسانی داده ها در رسانه دیگری که در یک محل دیگر بوده می باشد. عمل بروز رسانی داده یکی از پیچیده ترین و مهم ترین فرآیند هایی می باشد که در چرخه Disaster Recovery Plan بسیار مورد کاربرد می باشد. اجرای این مهم زیر ساخت های خود را می طلبد و صرف مطالعه چند مستند و مقاله علمی نمی تواند پاسخگوی این عمل باشد .
میزان بوجه لختصاص یافته ، میزان RTO و RPO تعریف شده ، زیر ساخت مخابرات و . . همه بر این مهم تاثیر گذار می باشند . بروز رسانی داده به معنی اطمینان از دسترسی مجدد برای بازخوانی داده ها خواهد بود . که البته زمان این بازخوانی و بازنویسی در راهکار های مختلف با یکدیگر تفاوت خواهد داشت .
کوتاهترین زمان بازیابی در صورت نیاز
زمان بازخوانی و بازنویسی منوط به زیرساخت مخابراتی و شبکه و همچنین سرعت تجهیزات در این مقوله خواهد بود . هرچه سرعت بازخوانی و بازنویسی افزایش یابد ، در مقابل هزینه آن نیز افزایش خواهد یافت .
اهمیت داده ها در برخی از مراکز چنان است که این بازخوانی و بازنویسی می بایست در زمان صفر ثانیه انجام پذیر باشد . این زمان در برخی از مراکز چنان با اهمیت می باشد که حتی mirror در سطح Application نیز پاسخگوی امر نبوده و می بایست این mirror در لایه ذخیره ساز انجام شود.
چگونگی جداسازی داده های نا کارآمد
تفکیک داده های نا کارآمد بدون همراهی و کمک مدیران و مهندسان مرکز داده و همچنین پرسنل قسمت های مختلف مجموعه امکان پذیر نخواهد بود . هرچند که این مهم فقط یک بار انجام خواهد شدو و پس از آن بر پایه سیاست اعمال شده حجم این نوع از داده ها بسیار کاهش خواهد یافت اما تفکیک آن بسیار حائز اهمیت می باشد. این تفکیک برحسب مدت زمان دسترسی مجدد ، و میزان دسترسی و تعداد آن انجام پذیر خواهد بود . لازم به ذکر است این مهم در لایه بانک های اطلاعاتی بسیار پیچیده و تخصصی می باشد و گاها ممکن نخواهد بود .
محل نگهداری داده های نا کارآمد
با سیاست مدیران صنعت انفورماتیک هیچ از داده ها هرگز از بین نخواهد رفت و همواره می بایست از تمامی داده ها ( از بدو تاسیس سازمان و تولید داده تا کنون ) حفاظت نمود .
اما محل نگهداری آن بسیار با اهمیت می باشد . دلیل این تفکیک جلو.گیری از هزینه مازاد خرید دیسک می باشد. علاوه بر آن تجمل تمامی داده ها در یک مکان از بدو تاسیس تا کنون با توجه به عدم نیاز به تمامی آنها چندان معقول نمی باشد . همین امر باعث سر در گمی کاربران در زمان بازیابی می باشد . ضمنا با از دست رفتن رسانه ذخیره ساز تمامی آرشیو های مربوط به دور زمان نیز از دست خواهد رفت .
تفکیک داده ها بر حسب حساسیت آنها
این تفکیک بسیار کلیدی و با اهمیت می باشد . عملکرد فوق دقیقا با بازدهی فرآیند نسبت مستقیم داشته و سرعت فرآیند را تعیین می نماید.
ارزیابی مذکور نیازمند دانش و تخصص در این خصوص بوده که تحلیل آن در این نوشتار مناسب نمی باشد و می بایست در دوره های آموزشی خاصی که درخواست شده بیان شود.
نتیجه حاصله آن است که هر نوع از داده بر حسب نوع کاربرد و عملکرد آن حساسیت خاص خود را دارا می باشد. با این نگاه می توان نتیجه گرفت ، هر نوع از حساسیت داده ، محل نگهداری، ریسک پذیری ، چگونگی بازیابی و زمان بازیابی خود را می طلبد .
(قبل از ادامه مطلب ذکر این نکته ضروریست که از این مقطه به بعد ، شکل گیری های محل ذخیره سازی و چگونگی ذخیره سازی در حال منعقد شدن می باشد . )
در گام اول ملزومات Data Protection تحلیل داده ها ضروریست .
جدول ارزیابی :
در این جدول تمامی داده ها ، اعم از داده های تولید شده توسط برنامه های کاربردی ( مانند مالی ، اتوماسیون اداری ، و . . ) بر حسب حجم ، میزان نیاز به دسترسی ، حساسیت داده ها ، و . . . تعین می گردد .
هریک از داده ها برای یک سطح مشخص تعین و تعریف شده و در اختیار کاربران مختص به خود می بایست قرار گیرد . ( منظور از کاربران می تواند ماشین ها و سرور ها نیز باشند )
محل نگهداری از هر داده به معنی تعین سطوح دسترسی به آن داده خواهد بود . بنابراین بدون این تفکیک عملا امکان حفاظت از داده ها وجود نخواهد داشت . ( مقوله محل نگهداری فیزیکی داده مورد نظر در پاراگراف قبل عنوان گردید )
در مقام چگونگی نگهداری از داده مورد نظر ، بر حسب پارامتر های کیمیت داده ، حساسیت داده ، نیاز به دسترسی آن ( در جایگاه سرعت ) می توان داده مورد نظر را جاگذاری نمود . این تحلیل نیازمند ابزار های خاصی بوده که ورود به آن ابزار ها در این نوشتار نمی گنجد .
چگونگی بروز رسانی داده ، در غالب برنامه های کاربردی دیده شده است اما در زمانی که ما افق Disaster Recovery Plan را برای یک مجموعه تعریف می نماییم ، می بایست با استفاده از برنامه های تخصصی خاصی این مهم را تحت پوشش قرار دهیم . این مار در بانک ها بسیار کاربردی خواهد بود ، زمانی که قصد آن وجود دارد تا Transaction ها از Query مجزا گردد و هر ذخیره ساز ، بار مختص به خود را تحمل نماید.
در خصوص کوتاهترین زمان بازیابی توجه به این نکته خالی از لطفا نبوده که در بازه کوتاهترین زمان بازیابی ( صفر ثانیه ) و یا بیشتر از آن ، هریک بصورت جداگانه سیاست گذاری خاص خود را می طلبد . ین سیاست گذاری منوط به جایگاه داده در جدول ارزیابی و همچنین تجهیزات سخت افزاری موجود خواهد بود .
داده های ناکارآمد ، در تمامی مراکز و سازمان ها مشهود است . نرخ موجودیت آنها بر حسب استاندارد بودن مجموعه ها می باشد . داده های ناکارآمد داده هایی می باشند که در هر لحظه و هر زمان نیازی به دسترسی به آن نباشد ، تفکیک شده نبوده و در ذخیره ساز به تنهایی و بدون کاربرد رها شده باشند . مانند یک تصویر خاص از یک پروژه که هرگز عملیاتی نشده ، محاسباتی که یک کاربر بصورت موقتی در یک پروژه استفاده نموده و . . .
هرچند این داده ها در حال حاضر مورد استفاده قرار نخواهند گرفت اما مدیران صنعت انفورماتیک حق حذف داده را بدون کسب اجازه از کاربر نخواهند داشت . به همین منظور اینگونه داده ها در محلی می بایست قرار گیرد که هم در زمان خود قابل استفاده بوده و در کنار آن در کنار داده های پر ترافیک قرار نگیرند . تمامی این مقوله ها منتج به تامین رسانه های ذخیره سازی می گردند که هریک بصورت جداگانه و در جایگاه خود کاربرد خاصی خواهند داشت .
این رسانه ها بعد از تمامی تحلیل های فوق مبتنی بر دیسک و نوارد مغناطیس می باشند . با رعایت استاندارد های لازم در خصوص محل نگهداری از آن در صورتی که نیاز به انتقال آن به شهر یا کشور دوم وجود داشته باشد ، زیر ساخت مخابراتی نیز مورد توجه خواهد بود. در یک نگاه عام به ملزومات Data Protection میتوان به وجود یک رسانه ذخیره ساز متمرکز ، رسانه ای بمنظور نسخه دوم داده ها و رسانه ای مبتنی بر نوار مغناطیسی جهت آرشیو اشاره نمود .
مجددا تاکید می گرددصرف خرید تجهیزات فوق کمک شایانی به فرآیند Data Protection نخواهد نمود و بدون تحلیل های فوق ناکارآمد خواهد بود .
مخزن اصلی ذخیره سازی داده ها :
Storage و یا مخزن اصلی ذخیره سازی داده ها محلی است که تمامی داده ها بر روی آن ذخیره می گردند. این داده ها بصورت تفکیک شده که در خصوص آن توضیحات لازم ارائه گردید در محل خاص خود ذخیره می گردند.
این رسانه ذخیره ساز می تواند دارای چیدمان های مختلفی تهیه گردد . منظور از چیدمان ساختار رسانه ذخیره یازی متفاوت می باشد. در این رسانه می توان از ساختار های مبتنی بر دیسک متفاوت استفاده نمود . علت تفاوت در ساختار دیسک های مورد استفاده ، وجود تفاوت در نوع داده هاست .
این رسانه با توجه به نوع هریک از داده های آن ، بازدهی خاص خود را طلب می نماید. این بازدهی که می بایست بر حساب محاسبات خاصی انتخاب گردد توسط متخصص این امر تهیه و تعیین می شود . درگاه های ورودی ، پروتکل های مورد استفاده و همچنین میزان بازدهی آن منوط به موجودیت هر مجموعه خواهد بود . موکدا عنوان می دارد ، رسانه های ذخیره سازی که در یک مرکز بصورت موفق پاسخگوی نیاز می باشد ، الزاما در یک مرکز داده دیگر پر بازده نبوده و ممکن است حتی بازدهی نداشته باشد .
علیهذا ، این رسانه مبتنی بر دیسک می بایست تمامی داده ها را در خود جای دهد تا بصورت متمرکز عمل نمائیم . محاسن تمرکز داده ها در آن است که مدیریت یکپارچه ای را در اختیار مدیران قرار خواهد داد . در نگاه نخست ، ما در ابتدا داده های خود را بصورت متمرکز در یک محل ذخیره می نمائیم . اما می بایست برای فرآیند های Disaster Recovery Plan تهمیداتی دیگر اندیشید که باز کردن این مقوله پیچیده در این نگارش مفید نخواهد بود . نسخه دومی که از داده ها نگهداری و در صورت لزوم مورد استفاده قرار گیرد اصطلاحا نسخه بکاپ مبتنی بر دیسک می نامیم . این ذخیره سازی ثانوی ، بر حسب میزان سطح دسترسی ، زمان بازخوانی ، . . . انتخاب گردد .این انتخاب قطعا درغالب مراکز متفاوت خواهد بود و تنها وجه اشتراکی آن مبتنی بر دیسک بودن آن می باشد.
بعد از فرآیند نسخه دوم داده ها ، انتخاب محلی برای آرشیو نیز در این چرخه قرار دارد . آرشیو اطلاعات به معنی نگهداری داده های قدیمی و دیر دسترس می باشد .
هریک از موارد مذکور ، رویکرد خاص خود را داشته و نگاه تخصصی به تمام اجزاء Data Protection بسیار وسیع و گسترده می باشد. این ملزومات دانش خاص خود را طلب می نماید.