در این مقاله ما قصد داریم تا اصول اولیه پشتیبان گیری و بازیابی از فاجعه (Disaster Recovery) را بررسی کنیم تا شما بتوانید برنامه های موثری را تدوین نموده و downtime را به حداقل برسانید. همچنین در این مطلب، تفاوتهای بین پشتیبانگیری و بازیابی از فاجعه را بیان خواهیم نمود تا بتوانید مفاهیم کلیدی را که برای توسعه استراتژیهای موثر حیاتی هستند، درک کنید.
برای به حداقل رساندن تأثیر خرابیها بر کسبوکارتان، درک اصول اولیه پشتیبانگیری و بازیابی از فاجعه ضروری است. در کلیه صنایع، سازمانها بر این باور هستند که هر خرابی، فارغ از اینکه در ابعاد کوچک یا بزرگ باشد، میتواند به سرعت منجر به از دست رفتن سرمایه سازمانی شود. بلایای طبیعی، خطاهای انسانی، نقض امنیت و حملات سایبری همگی میتوانند در دسترس بودن منابع IT را به خطر بیندازند. هرگونه خرابی میتواند تعاملات مشتری را از مسیر خارج کند، بهرهوری کارکنان را کاهش دهد، دادهها را از بین ببرد و فرآیندهای تجاری را متوقف کند.
از این رو، درک تفاوتهای بین پشتیبانگیری با بازیابی از فاجعه، تعریف اصطلاحات کلیدی و ارزیابی گزینهها و فناوریهای مختلف استقرار میتواند به شما کمک کنند تا استراتژیهای موثری برای جلوگیری از عواقب خرابیها در اختیار داشته باشید.
پشتیبانگیری و بازیابی از فاجعه چی هستند؟
یک تمایز مهم بین پشتیبانگیری و بازیابی از فاجعه وجود دارد. پشتیبانگیری فرآیند ایجاد یک کپی اضافی (یا چند کپی) از دادهها است. برای محافظت از دادهها میبایست از آنها نسخه پشتیبان تهیه شود. اگر با حذف تصادفی، خرابی پایگاه داده یا بروز مشکل در ارتقای نرمافزار مواجه شدید، ممکن است نیاز به بازیابی اطلاعات پشتیبان داشته باشید.
از سوی دیگر، بازیابی از فاجعه به طرح و فرآیندهایی برای بازیابی سریع دسترسی به برنامهها، دادهها و منابع فناوری اطلاعات پس از قطعی اشاره دارد. این طرح ممکن است شامل جابجایی به مجموعهای از سرورها و سیستمهای ذخیرهسازی اضافی باشد تا زمانی که دیتاسنتر اولیه دوباره فعال شود.
برخی از سازمانها معمولاً پشتیبانگیری را با بازیابی از فاجعه اشتباه میگیرند. داشتن کپی از دادهها به این معنی نیست که میتوانید از کسب و کار خود تحت هر شرایطی محافظت کنید. به همین جهت، برای اطمینان از تداوم کسب و کار خود، باید به یک برنامه قوی و آزمایش شده برای بازیابی از فاجعه متکی باشید.
اهمیت برنامهریزی
هیچ سازمانی نباید از پشتیبانگیری و یا بازیابی از فاجعه غفلت کند. اگر بازیابی دادههای از دست رفته پس از حذف تصادفی ساعتها طول بکشد، کارمندان شما بیکار میمانند و نمیتوانند فرآیندهای حیاتی تجاری را به انجام رسانند. اگر روزها طول بکشد تا کسب و کار شما بعد از یک حادثه مجدد آنلاین شود، مشتریان خود را برای همیشه از دست خواهید داد. با توجه به مقدار زمان و پولی که در هر دو مورد ممکن است از دست بدهید، سرمایه گذاری در پشتیبانگیری و بازیابی از فاجعه کاملاً منطقی و موجه میباشد.
مفاهیم کلیدی
درک چند اصطلاح ضروری میتواند به شکل دادن به تصمیمات استراتژیک شما کمک کند و شما را قادر میسازد تا راهحلهای پشتیبانگیری و بازیابی از فاجعه را بهتر ارزیابی کنید.
RTO
Recovery Time Objective (بطور مخفف RTO) مقدار زمانی است که برای بازیابی عملیات عادی کسب و کار پس از قطعی نیاز است. همانطور که به دنبال تنظیم RTO برای سازمان خود هستید، باید در نظر بگیرید که چقدر زمان را میخواهید از دست بدهید و این زمان چه تاثیری بر نتیجه شما خواهد داشت. RTO ممکن است برای هر نوع کسب و کاری بسیار متفاوت باشد. برای مثال، اگر یک کتابخانه عمومی سیستم فهرست خود را از دست بدهد، احتمالاً میتواند برای چند روز، در حالی که سیستمها بازیابی میشوند، به صورت دستی به کار خود ادامه دهد. اما اگر یک خردهفروش آنلاین سیستم موجودی خود را از دست بدهد، حتی 10 دقیقه توقف غیرقابل قبول خواهد بود.
RPO
Recovery Point Objective (بطور مخفف RPO) به مقدار دادهای اشاره دارد که میتوانید در یک حادثه از دست بدهید. ممکن است لازم باشد دادهها را به طور مداوم در یک دیتاسنتر کپی کنید تا قطعی منجر به از دست رفتن دادهها نشود. یا ممکن است تصمیم بگیرید که از دست دادن پنج دقیقه یا یک ساعت دادهها قابل قبول باشد.
Failover
فرآیند بازیابی از فاجعه است که بهطور خودکار وظایف را به سیستمهای پشتیبان بارگیری میکند، به گونهای که برای کاربران بصورت یکپارچه اتفاق بیافتد. Failover یک عملکرد بسیار مهم برای سیستمهای حیاتی است که نیاز دارند همیشه در دسترس باشند.
Failback
فرآیند بازیابی از فاجعه برای بازگشت به سیستمهای اصلی است. پس از وقوع حادثه، زمانی که دیتاسنتر اصلی شما پشتیبانگیری و راهاندازی شد، باید بتوانید بهطور یکپارچه به سیستمهای اصلی دسترسی داشته باشید.
Restore
فرآیند انتقال دادههای پشتیبان به سیستم اصلی یا دیتاسنتر شما است. فرآیند بازیابی به عنوان بخشی از پشتیبانگیری در نظر گرفته میشود.
DRaaS
Disaster Recovery as a Service (بطور مخفف DRaaS) یک رویکرد مدیریتشده برای بازیابی از فاجعه است. با در نظر گرفتن یک شخص ثالث برای هاستینگ و مدیریت زیرساخت مورد استفاده برای بازیابی از فاجعه را بر عهده خواهد داشت. پیشنهاداتی که توسط DRaaS ممکن است ارائه شود اغلب ابزارهایی هستند که برای مدیریت فرآیندهای بازیابی از فاجعه مناسب هستند.
بار کاری را اولویتبندی کنید
پس از درک مفاهیم کلیدی، وقت آن است که تمامی آنها را در بار کاری خود اعمال نمایید. بسیاری از سازمانها دارای چندین RTO و RPO هستند که نشاندهنده اهمیت هر بار کاری برای کسب و کارشان است.
برای یک بانک بزرگ، سیستم بانکداری آنلاین ممکن است یک از اجزای حیاتی باشد. از این رو، بانک باید از دست دادن زمان و دادهها را به حداقل برساند. با این حال، برنامه حضور و غیاب کارکنان بانک اهمیت کمتری در چنین مواقع دارد. در صورت بروز حادثه، بانک میتواند این برنامه را برای چندین ساعت یا حتی یک روز، بدون آنکه تأثیر منفی عمدهای بر کسبوکار بگذارد، خاموش کند. تعریف حجم کاری به عنوان Tier 1، Tier 2 یا Tier 3 میتواند به ارائه چارچوبی برای طرح بازیابی از فاجعه کمک کند.
گزینههای استقرار را ارزیابی کنید
گام بعدی در طراحی یک طرح بازیابی از فاجعه، ارزیابی گزینههای استقرار است. آیا باید برخی از عملکردهای بازیابی از فاجعه یا پشتیبانگیری از دادهها را در محل خود شرکت و عموماً در دیتاسنتر شرکت نگه داشت؟ یا می بایست از رویکرد ابر عمومی یا ابر hybrid استفاده نمود؟
ابر (Cloud)
راهحلهای پشتیبانگیری و بازیابی از فاجعه مبتنی بر ابر در بین سازمانها از محبوبیت بالایی برخوردار میباشند. بسیاری از راهحلهای ابری، زیرساختی را برای ذخیرهسازی دادهها و در برخی موارد، ابزارهایی برای مدیریت فرآیندهای پشتیبانگیری و بازیابی از فاجعه فراهم میکنند. با داشتن سیستم پشتیبانگیری یا بازیابی از فاجعه مبتنی بر ابر میتوانید از سرمایهگذاریهای کلان برای زیرساختها و همچنین هزینههای مدیریتی جلوگیری کنید.
راهحلهای پشتیبانگیری و بازیابی از فاجعه مبتنی بر ابر کاربردهای متنوعی دارند. برای مثال، ممکن است تصمیم بگیرید که از فضای ابری، تنها برای ذخیرهسازی دادههای بکاپ گرفته شده استفاده کنید و در عین حال از محیط دیتاسنتر خود برای تولید استفاده نمایید. با این رویکرد ترکیبی، شما همچنان از مزایای مقیاسپذیری و فاصله جغرافیایی بدون نیاز به جابجایی محیط تولید خود بهرهمند میشوید. در مدل ابر به ابر، هم تولید و هم بازیابی از فاجعه در فضای ابری قرار خواهند داشت.
On-premises
در برخی موارد، نگهداری برخی از فرآیندهای پشتیبانگیری یا بازیابی از فاجعه در محل میتواند به شما در بازیابی اطلاعات و بازیابی سریع خدمات فناوری اطلاعات کمک کند. در صورتی که نیاز به رعایت قوانین حریم خصوصی دادهها یا حاکمیت دادهها دارید، حفظ برخی از دادههای حساس در محل گزینه ایدهآلی میباشد.
برای بازیابی از بلایای طبیعی، طرحی که کاملاً متکی به یک محیط داخلی باشد چالش برانگیز خواهد بود. اگر برای مثال برق سازمان شما قطع شود، کل دیتاسنتر شما – با سیستم های اولیه و ثانویه – تحت تأثیر قرار می گیرند. به همین دلیل است که بیشتر استراتژیهای بازیابی از بلایا از یک سایت ثانویه استفاده میکنند که فاصله چندانی با دیتاسنتر اولیه ندارد.
فنآوریها
بسته به اینکه کدام گزینه استقرار را انتخاب میکنید، ممکن است چندین جایگزین برای انواع فناوریها و فرآیندهایی که برای پشتیبانگیری و بازیابی از فاجعه استفاده میکنید داشته باشید.
ذخیرهسازی Tape
علیرغم اینکه چندین دهه از سیستمهای ذخیرهساز سنتی میگذرد، اما همچنان این نوع سیستمها میتوانند در برنامه پشتیبان شما نقش مهمی را ایفا کنند. با ذخیرهسازهای Tape، میتوانید حجم زیادی از دادهها را به طور مطمئن و مقرون به صرفه ذخیره کنید.
اگر چه ذخیرهسازهای Tape در مواردی میتوانند برای پشتیبانگیری موثر باشند اما معمولاً برای بازیابی از فاجعه، که نیاز به زمان دسترسی سریعتر وجود دارد، مورد استفاده قرار نمیگیرند. زیرا ممکن است دسترسی به بسیاری از سرویس ها را به مدت چندین ساعت یا حتی چند روز از دست بدهید.
همانندسازی مبتنی بر Snapshot
پشتیبانگیری مبتنی بر snapshot وضعیت یک برنامه یا دیسک را در یک لحظه از زمان ضبط میکند. این روش میتواند به محافظت از دادهها و حفظ فضای ذخیرهسازی کمک کند.
همانندسازی مبتنی بر Snapshot میتواند برای پشتیبانگیری یا بازیابی از فاجعه مورد استفاده قرار گیرد. البته باید در نظر داشته باشید که با این روش تنها به اطلاعاتی که در آخرین اسنپ شات گرفته شده دسترسی خواهید داشت. اگر بخواهید در هر ساعت یک اسنپ شات از دیتاها بگیرید، باز هم ممکن است بسیاری از دادهها را از دست بدهید.
همانندسازی مداوم
بسیاری از سازمانها به سمت همانندسازی مستمر برای بازیابی از بلایا و همچنین برای تهیه نسخه پشتیبان حرکت میکنند. با استفاده از این روش، آخرین کپی از یک دیسک یا برنامه به طور مداوم در مکان دیگری یا فضای ابری کپی میشود و زمان خرابی را به حداقل میرساند.






