Felaketten kurtarma merkezleri iş sürekliliğini destekleyen konuların en geniş kapsamlısı ve gelinen son noktadır. Diğer iş sürekliliği için yapılan çalışmaların yetersiz kaldığı, teknoloji, insan veya doğal afetlerden dolayı veri merkezin tamamen erişilmez durumda olduğunda devreye giren yedek veri merkezleridir. Ülkelerin hatta şehirlerin bulundukları coğrafi konumlara göre farklı doğal afetler ve iş sürekliliğini etkileyecek diğer problemler, oluş şekilleri ve sıklıklarına göre değişiklik göstermektedir. Bu felaketlerle karşılaşan firmaların hizmetlerini sürdürebilmeleri ve marka değerlerini koruyabilmeleri gerekmektedir. Bu yüzden alınması gereken birtakım tedbirler vardır.

“Türkiye’de TÜBİTAK UEKAE tarafından 2005 yılında yapılan bir araştırmanın sonucuna göre kurumların sadece %11‟i iş sürekliliği planı uygulamaktadır.”  (Dinçkan, 2008)

En büyük felaket, felaketlere karşı hazırlıksız olmaktır. Felaket planı olmayan ve felaketten yaşandıktan sonra önemli veri kaybına uğrayan işletmeler de yapılan araştırmalara göre; “işletmelerin %43’ünün faaliyetlerinin tamamen durduğu, %51’inin iki yıl içinde kapandığı ve sadece %6’sının varlıklarını sürdürebildiği” görülmektedir. (Haag & Cummings, 2012)

Kurum ve kuruluşlar faaliyetlerini sürdürebilmeleri için her zaman beklenmedik olaylara karşı tedbirli olmak zorundadırlar. Veri merkezi yöneticileri tarafından iyi yönetilmiş, planlanmış, analiz edilmiş, testleri yapılmış ve dersler çıkartılmış felaket kurtarma merkezleri sayesinde; işletmelerin hatta ülkelerin ekonomileri güven altına alınabilir.

Bu amaçla faaliyet gösteren felaketten kurtarma merkezleri; felaket oluştuktan birkaç saat sonra devreye girebilecek tam donanımlı, felaketten birkaç gün sonra devreye girebilecek yarı donanımlı, felaketten sonra birkaç hafta içinde devereye girebilecek az donanımlı ve asıl veri merkeziyle aynı özelliklere sahip felaketten çok kısa süre sonra devreye girebilecek eş zamanlı felaket kurtarma merkezleri olarak gruplanabilir. (Dinçkan, 2008)

Felaket kurtarma merkezlerinin ihtiyacını ortaya çıkaran felaketleri; doğal afetler, insandan kaynaklı felaketler ve hibrit olarak üç ana başlık  altında toplamak mümkündür. (Hiles, 2007; Snedaker, 2007; Doğdu, 2009)

Doğal afetler;

  • Sel,
  • Çığ,
  • Deprem,
  • Tsunami,
  • Volkan patlaması,
  • Heyelan,
  • Hortum,
  • Kasırga.

İnsandan kaynaklı felaketler; 

  • Terörizm,
  • Grev,
  • Patlama,
  • Yangın,
  • Siber atak,
  • Politik protestolar,
  • Doğrudan işletmeye yönelik  protestolar,
  • Radyoaktif serpinti,
  • Hırsızlık,
  • Gasp ve adam kaçırma.

Hibrit (Doğal afetler ve insandan kaynaklı);

  • Ulaşım kazaları,
  •  Enerji kesintisi,
  • İletişim kesintisi,
  • Enformasyon sistemlerinde ortaya çıkan kesintiler,
  • Bilgisayar  sistemlerinden kaynaklanan hatalar.

 

Felaket Nedenleri ve Görülme Oranları. (Higgins, 2011)

Önemli kavramlar

Felaket kurtarma merkezleri için en önemli kavramlar, asıl veri merkezindeki verilerin felaketten kurtarma merkezine transfer edilme sıklığı yani ne kadarlık veri kaybı olacağı ve ne kadar sürede felaket kurtarma merkezinin aktif hale getirilebileceğidir. Bu noktada işletmenin kabul edilebilir veri kaybı, kabul edilir kesinti süresi, kabul edilebilir en uzun kesinti süresi ve iş süreçleri süresi gibi kavramlar ortaya çıkmaktadır. (Snedaker, 2007), (Dinçkan, 2008)

Kabul edilebilir veri kaybı (Recovery point objective);

Kabul edilebilir veri kaybı (RPO); verilerin ne sıklıkla felaketten kurtarma merkezine transfer edileceğini gösteren değerdir. Eğer veri transferi eş zamanlı yapılmıyorsa felaketten kurtarma merkezi devreye alındığında veri kaydı olabilir. Bu konuda karar verirken işletmelerin ne kadarlık veri kaybını kabul edebildikleri doğru hesaplanmalıdır. Teknolojinin geldiği noktada maliyetlere bağlı olarak eş zamanlı transfer sayesinde veri kaybı sıfıra indirilebilir.

Kabul edilebilir en uzun kesinti süresi (Maximum tolerable downtime);

Kabul edilebilir en uzun kesinti süresi (MTD); işletmenin fonksiyonlarını yerine getirmesine engel olan, kabul edebileceği en uzun kesinti süresidir. İşletmeler zaman zaman çoklu işlem yapabilirler veya bazı uygulamaları çok yoğun bazıları seyrek olarak kullanılabilir. Bu durumda kabul edilebilir en uzun kesinti süreleri iş süreçlerine bağlı olarak değişebilir. Bu değerin hesaplanması için MTD = RTO + WRT olarak formülü kullanılır.

Kabul edilir kesinti süresi (Recovery time objective);

Kabul edilir kesinti süresi (RTO); kabul edilebilir en uzun kesinti süresinin birinci parçasıdır, felaket kurtarma merkezine transfer edilen veriye erişim için gereken sistemin tekrar devereye alınması için harcanan süredir. Yedekleme süreçlerinde olduğu gibi esas amaç transfer edilen veriye çok hızlı şekilde erişmektir. Bu nedenle felaket anında hizmet verecek bütün ekipmanların hazır olması gerekmektedir. Bu işlem genellikle sistem ve ağ yöneticileri tarafından gerçekleştirilir.

İş süreçleri süresi (Work recovery time);

İş süreçleri süresi (WRT); kabul edilebilir en uzun kesinti süresinin ikinci aşamasını oluşturur. Erişime açılan sistemde transfer edilen son veri tekrar devreye alınır. Bu kesinti süresinde bekleyen ve oluşan kritik veriler manuel olarak sisteme girilir. Erişime hazır olan kritik iş fonksiyonlarının, verinin, uygulama ve diğer hizmetlerin doğruluğu ve bütünlüğünün kontrolü bu aşamada gerçekleştirilir. Verilerde herhangi bir problem tespit edilirse düzeltme yapılır. Bu aşamadan sonra herşey yolunda ise iş süreçlerinin kaldığı yerden devam etmesi için uygunluk verilir. Bu testler genellikle veri tabanı, uygulama ve iş yöneticileri tarafından yapılır.

RTO ve WRT iyi planlanmaz ise en düşük RPO değerleri için yapılan yüksek maliyetler ve çaba boşa gitmiş demektir. Sonuç olarak felaket kurtarma merkezlerine gerçek zamanlı veri transferi yapılmış olsa dahi o veriye zamanında ve doğru şekilde erişebilmek de çok önemlidir.

 

Felaketten Kurtarma Zaman Çizelgesi. (Snedaker, 2007)

 

Bazı işletmeler için yaptıkları işe ve verdikleri hizmetlere göre 2 saat kesinti önemli olmazken bazı işletmeler için ise 10 dakika hayati önem taşıyabiliyor. Dolayısıyla işletmeler için felaketten kurtarma zaman çizelgesini belirlerken işletmenin gerekliliklerine göre değerlendirme yapılır.