Felaketten kurtarma merkezleri iş sürekliliğini destekleyen konuların en geniş kapsamlısı ve gelinen son noktadır. Diğer iş sürekliliği için yapılan çalışmaların yetersiz kaldığı, teknoloji, insan veya doğal afetlerden dolayı veri merkezin tamamen erişilmez durumda olduğunda devreye giren yedek veri merkezleridir. Ülkelerin hatta şehirlerin bulundukları coğrafi konumlara göre farklı doğal afetler ve iş sürekliliğini etkileyecek diğer problemler, oluş şekilleri ve sıklıklarına göre değişiklik göstermektedir. Bu felaketlerle karşılaşan firmaların hizmetlerini sürdürebilmeleri ve marka değerlerini koruyabilmeleri gerekmektedir. Bu yüzden alınması gereken birtakım tedbirler vardır.

“Türkiye’de TÜBİTAK UEKAE tarafından 2005 yılında yapılan bir araştırmanın sonucuna göre kurumların sadece %11‟i iş sürekliliği planı uygulamaktadır.”  (Dinçkan, 2008)

En büyük felaket, felaketlere karşı hazırlıksız olmaktır. Felaket planı olmayan ve felaketten yaşandıktan sonra önemli veri kaybına uğrayan işletmeler de yapılan araştırmalara göre; “işletmelerin %43’ünün faaliyetlerinin tamamen durduğu, %51’inin iki yıl içinde kapandığı ve sadece %6’sının varlıklarını sürdürebildiği” görülmektedir. (Haag & Cummings, 2012)

Kurum ve kuruluşlar faaliyetlerini sürdürebilmeleri için her zaman beklenmedik olaylara karşı tedbirli olmak zorundadırlar. Veri merkezi yöneticileri tarafından iyi yönetilmiş, planlanmış, analiz edilmiş, testleri yapılmış ve dersler çıkartılmış felaket kurtarma merkezleri sayesinde; işletmelerin hatta ülkelerin ekonomileri güven altına alınabilir.

Bu amaçla faaliyet gösteren felaketten kurtarma merkezleri; felaket oluştuktan birkaç saat sonra devreye girebilecek tam donanımlı, felaketten birkaç gün sonra devreye girebilecek yarı donanımlı, felaketten sonra birkaç hafta içinde devereye girebilecek az donanımlı ve asıl veri merkeziyle aynı özelliklere sahip felaketten çok kısa süre sonra devreye girebilecek eş zamanlı felaket kurtarma merkezleri olarak gruplanabilir. (Dinçkan, 2008)

Felaket kurtarma merkezlerinin ihtiyacını ortaya çıkaran felaketleri; doğal afetler, insandan kaynaklı felaketler ve hibrit olarak üç ana başlık  altında toplamak mümkündür. (Hiles, 2007; Snedaker, 2007; Doğdu, 2009)

Doğal afetler;

  • Sel,
  • Çığ,
  • Deprem,
  • Tsunami,
  • Volkan patlaması,
  • Heyelan,
  • Hortum,
  • Kasırga.

İnsandan kaynaklı felaketler; 

  • Terörizm,
  • Grev,
  • Patlama,
  • Yangın,
  • Siber atak,
  • Politik protestolar,
  • Doğrudan işletmeye yönelik  protestolar,
  • Radyoaktif serpinti,
  • Hırsızlık,
  • Gasp ve adam kaçırma.

Hibrit (Doğal afetler ve insandan kaynaklı);

  • Ulaşım kazaları,
  •  Enerji kesintisi,
  • İletişim kesintisi,
  • Enformasyon sistemlerinde ortaya çıkan kesintiler,
  • Bilgisayar  sistemlerinden kaynaklanan hatalar.

 

Felaket Nedenleri ve Görülme Oranları. (Higgins, 2011)

Önemli kavramlar

Felaket kurtarma merkezleri için en önemli kavramlar, asıl veri merkezindeki verilerin felaketten kurtarma merkezine transfer edilme sıklığı yani ne kadarlık veri kaybı olacağı ve ne kadar sürede felaket kurtarma merkezinin aktif hale getirilebileceğidir. Bu noktada işletmenin kabul edilebilir veri kaybı, kabul edilir kesinti süresi, kabul edilebilir en uzun kesinti süresi ve iş süreçleri süresi gibi kavramlar ortaya çıkmaktadır. (Snedaker, 2007), (Dinçkan, 2008)

Kabul edilebilir veri kaybı (Recovery point objective);

Kabul edilebilir veri kaybı (RPO); verilerin ne sıklıkla felaketten kurtarma merkezine transfer edileceğini gösteren değerdir. Eğer veri transferi eş zamanlı yapılmıyorsa felaketten kurtarma merkezi devreye alındığında veri kaydı olabilir. Bu konuda karar verirken işletmelerin ne kadarlık veri kaybını kabul edebildikleri doğru hesaplanmalıdır. Teknolojinin geldiği noktada maliyetlere bağlı olarak eş zamanlı transfer sayesinde veri kaybı sıfıra indirilebilir.

Kabul edilebilir en uzun kesinti süresi (Maximum tolerable downtime);

Kabul edilebilir en uzun kesinti süresi (MTD); işletmenin fonksiyonlarını yerine getirmesine engel olan, kabul edebileceği en uzun kesinti süresidir. İşletmeler zaman zaman çoklu işlem yapabilirler veya bazı uygulamaları çok yoğun bazıları seyrek olarak kullanılabilir. Bu durumda kabul edilebilir en uzun kesinti süreleri iş süreçlerine bağlı olarak değişebilir. Bu değerin hesaplanması için MTD = RTO + WRT olarak formülü kullanılır.

Kabul edilir kesinti süresi (Recovery time objective);

Kabul edilir kesinti süresi (RTO); kabul edilebilir en uzun kesinti süresinin birinci parçasıdır, felaket kurtarma merkezine transfer edilen veriye erişim için gereken sistemin tekrar devereye alınması için harcanan süredir. Yedekleme süreçlerinde olduğu gibi esas amaç transfer edilen veriye çok hızlı şekilde erişmektir. Bu nedenle felaket anında hizmet verecek bütün ekipmanların hazır olması gerekmektedir. Bu işlem genellikle sistem ve ağ yöneticileri tarafından gerçekleştirilir.

İş süreçleri süresi (Work recovery time);

İş süreçleri süresi (WRT); kabul edilebilir en uzun kesinti süresinin ikinci aşamasını oluşturur. Erişime açılan sistemde transfer edilen son veri tekrar devreye alınır. Bu kesinti süresinde bekleyen ve oluşan kritik veriler manuel olarak sisteme girilir. Erişime hazır olan kritik iş fonksiyonlarının, verinin, uygulama ve diğer hizmetlerin doğruluğu ve bütünlüğünün kontrolü bu aşamada gerçekleştirilir. Verilerde herhangi bir problem tespit edilirse düzeltme yapılır. Bu aşamadan sonra herşey yolunda ise iş süreçlerinin kaldığı yerden devam etmesi için uygunluk verilir. Bu testler genellikle veri tabanı, uygulama ve iş yöneticileri tarafından yapılır.

RTO ve WRT iyi planlanmaz ise en düşük RPO değerleri için yapılan yüksek maliyetler ve çaba boşa gitmiş demektir. Sonuç olarak felaket kurtarma merkezlerine gerçek zamanlı veri transferi yapılmış olsa dahi o veriye zamanında ve doğru şekilde erişebilmek de çok önemlidir.

 

Felaketten Kurtarma Zaman Çizelgesi. (Snedaker, 2007)

 

Bazı işletmeler için yaptıkları işe ve verdikleri hizmetlere göre 2 saat kesinti önemli olmazken bazı işletmeler için ise 10 dakika hayati önem taşıyabiliyor. Dolayısıyla işletmeler için felaketten kurtarma zaman çizelgesini belirlerken işletmenin gerekliliklerine göre değerlendirme yapılır.

 

Bilginin en değerli varlık olarak karşımıza çıktığı tarihten günümüze kadar bilgiye ulaşmak ta, kendisi kadar değerli olmuştur. Firmaların faaliyet gösterdikleri alanlara göre bu önem derecesi değişiklik göstermekle birlikte vazgeçilmezleri olmuştur. Herhangi bir felaketten dolayı veri merkezlerinin verdikleri hizmetlerinin kesintiye uğraması veya sahip oldukları verilerinin zarar görmesi karşılabilecek problemler arasındadır. İş sürekliliği; veriye sadece felaket anında erişememe veya planlı bakımlardan kaynaklı kesintiler olarak düşünülemez. Sahip olunan verinin bozulması, silinmesi veya çalınması da iş sürekliliğini kesintiye uğratan önemli konulardır. Dolaysıyla iş sürekliliğinde iki temel konu vardır. Birincisi herhangi bir nedenden dolayı sisteme erişememekten kaynaklı, ikincisi de sisteme erişim ile ilgili bir problem olmayıp erişilen sistemde verinin yok olması veya bozulmasıdır. Bu durumlara göre iş sürekliliği için dikkat edilmesi gereken bazı hususlar vardır. Bu hususlara ne seviyede dikkat edildiği veya bu hususların detaylarının ne kadar bilindiği önemlidir. İş sürekliliği noktasında bilgi teknolojileri en önemli birimlerden biridir. Fakat iş sürekliliğini sadece teknolojiye dayandırmakta yanlıştır, bununla birlikte dış etmenlerde önem arz etmektedir. Bütün detayların iyi bilinmesi ve değerlendirme yaparken tenolojik ve teknolojik olmayan bütün bileşenlerin beraber değerlendirilmesi iş sürekliliği için doğru kararlar alınmasını sağlamaktadır.

İş sürekliliği oluşumunun temel nedeni veriye her zaman her yerden ulaşmaktır. Bu noktada amaç felaket sırasında her yerden veriye kesintisiz ulaşabilmek ve bunu sağlayabilmek için gereken planlama ve çalışmaların en üst seviyede ve yüksek hassasiyette gerçekleştirmektir.

Rekabet ortamlarında işletmeler zamana bağlı hizmet verdikleri için bazen çok kısa sistem kesintileri dahi kabul edilebilir değildir. Özenle yapılan iş sürekliliği planı, yönetimi ve testleri işletmenin oluşan bu felaketlerden en az etkiyle veya hiç etkilenmeden hizmet vermeye devam etmesini sağlar. Bir çok işletme çözüm ortaklarıyla veya başka işletmelerle de entegre olarak çalışmaktadır. Bu yüzden birlikte çalışılan diğer taraflarında iş sürekliliği konusunda aynı özeni göstermeleri önemlidir.

Veri merkezlerinde sürekliliğini sağlayan konular BT ekipmanlarının yedeklenmesi, verinin yeklenmesi ve hatta veri merkezinin fiziksel olarak yedeklenmesi diğer bir ifade ile felaketten kurtarma merkezlerinin kurulması olarak belirlenebilir (Felaketten Kurtarma Merkezleri diğer makalede anlatılmaktadır).

BT ekipmanlarının yedeklenmesi (Clustering)

Enerji altyapısı, iklimlendirme, yangın söndürme, kablolama, güvenlik, izleme gibi bütün altyapı hizmetlerinin sağlanmasındaki esas amaç veriyi korumak olsa da veriyi koruyabilmek için diğer yapılması gereken veriyi barındıran veya veriye erişimi sağlayan BT ekipmanlarını da korumaktır. Fakat her ne kadar korumak için tedbirler alınsada bu ekipmanların yedeğinin olması önemlidir. İş sürekliliği konusunda sunucu, ağ aygıtları, depolama üniteleri, güvenlik duvarı gibi cihazların hepsi aktif – aktif  başka bir ifade ile eş zamanlı yedekli çalışacak şekilde veya aktif – pasif yani esas cihazda problem olduğunda yedek olarak hazır bekletilen cihazın otomatik olarak devreye girecek şekilde ayarlanabilir. Yedekleme süreçleri BT ekipmanlarından internet erişiminin yedeklenmesine kadar bütün aşamalara uygulanabilir. Veri merkezi süreçlerini, yedeklenmiş sistemler olmadan sağlamak bu sürecin herhangi bir noktasında oluşacak problem, uzun süre sisteme erişilememe veya bazı durumlarda verilerin kalıcı olarak zarar görmesine neden olabilir.

 Verinin yedeklenmesi

Veri merkezlerinde verinin yedeklenmesi kesinlikle yapılması gereken tedbirlerden biridir. Yedeklenen veriye ne zaman ihtiyaç olur bilinmez, fakat ihtiyaç olduğunda veri yedeklenmemiş veya yedeklenen veri geri kurtarılamıyorsa işletmelerde geri dönüşü olmayan kayıplar oluşabilir. Dolayısıyla yedekleme tarafında iki konu gündeme gelmektedir. Birincisi başarılı yedeklemedir, ikincisi de yedeklenen verinin ihtiyaç anında istenildiği şekilde geri kurtarılabilmesidir. Günümüz teknolojisinin ulaştığı noktada yedekleme birkaç yöntemle farklı kaynaklardan farklı kaynaklara doğru yapılabilmektedir. Yedekleme işlemi; bir yedekleme uygulaması tarafından belirlenen saat ve günlerde otomatik olarak çalışacak görevler aracılığı ile yedekleme ünitelerindeki yedekleme kartuşlarına veya depolama ünitelerine yapılabilir. Belirlenen saat, gün veya yedekleme sıklığı veri miktarı, yoğunluk ve kritiklik seviyesi ile orantılıdır.

Yedekleme türleri

Öncelikle yedekleme türünü belirlerken ihtiyaca doğru karar vermek gerekir. Genel olarak tam, farksal ve artan olarak 3 tip yedekleme türü vardır. Son zamanlarda dördüncü olarak tekilleştirme yöntemi de yoğun olarak kullanılmaya başlanmıştır. Çoğunlukla tam yedekleme yöntemi kullanılsa da hepsinin kendisine göre avantaj ve dezavantajları vardır. (Symantec, 2015; Dinçkan, 2008)

Tam yedeklilik (Full backup); Tam yedeklilikte seçilen bütün veri olduğu gibi yedeklenir. Bütün verinin yedeklenmesinden dolayı en güvenli yöntemdir ve dolayısıyla en uzun süren yöntemdir. Herhangi bir çalışma yapılacağı veya risk görülen durumlar oluştuğunda özellikle tam yedekleme yöntemi kullanılır.

Farksal yedeklilik (Differential backup); Bu yöntem, tam yedek yöntemindeki gibi bütün veriyi yedeklemez. En son alınan tam veya artan yedeğe ihtiyaç duyar ve en son yapılan tam veya artan yedeklemelerden sonra sadece değişen verinin yedeğini alır. Sadece değişen verinin yedeklenmesi sayesinde yedekleme işlemi tam yedeklemeye göre daha kısa sürede tamamlanır ve verinin yedekleneceği alanda yer tasarrufu sağlar. Bu özelliği ile faydalı olmakla birlikte veriyi geri yüklerken kendisinden önce alınmış tam veya artan yedeğe ihtiyaç duyması da dezavantajıdır. Veriyi geri yükleme aşamasında kendinden önce tam veya artan olarak yedeklenen veriler zarar görürse veya herhangi bir nedenden dolayı o verilere erişelemezse son aldığı farksal yedeği de geri yükleyemez. Örneğin pazartesi günü veriler tam yedek yöntemi ile yedeklendikten sonra diğer günlerin farksal olarak yedeklendiği durumda, pazartesi günü dışındaki bütün günlerde sadece pazartesiden sonraki değişen veri yedeklenmektedir ve geri yükleme yapılırken pazartesi gününün tam yedeğindeki verilere de ihtiyaç duyulur.

Artan yedeklilik (Incremental backup); Artan yedeklilik yönteminde farksal yedeklilik yönteme benzemekle beraber önemli farkları da vardır. Bu yöntemde de amaç verinin yedeklendiği alanda yer kazanmak ve yedekleme işleminin daha kısa sürmesini sağlamaktır. Fakat artan yedeklilik yönteminde yapılan yedekleme işleminden sonra, tekrarlanan artan veya farksal yedekleme işleminde sadece en son yedekleme işleminden sonra değişen veriler yedeklenir. Örneğin; pazartesi günü tam yedekleme işlemi yapıldıktan sonra artan yedekleme yöntemi ile yedekleme işlemine devam edildiği durumda, her gün bir önceki günden sonra değişen veriler yedeklenecektir. Dolayısıyla artan yedekten geri yükleme işlemi yapılacağında tam yedek alınan güne kadar olan bütün verilerin yedeğine ihtiyaç duyulacaktır.

Tekilleştirilmiş (Deduplication) yedek; Gelişmiş algoritmaya sahip tekilleştirme işleminde yedeklenecek veri parçalara ayrılır eğer daha önce bu parçalar yedeklenmemişse parçalar olduğu gibi yedeklenir. Fakat daha önce bölümlere ayrılmış veri yedeklenmişse sadece yedeklenilen bölümün tutulduğu adres referans olarak kaydedilir yani yedeklenmiş parçalar terar yedeklenmez ve ihtiyaç halinde veri bu adresten geri yüklenir. Bu işlem zaman ve maliyet açısından ileri derece fayda sağlar. Yedeklemenin dışında işletim sistemleri ve depolama ünitelerinin çalışma yöntemide bu şekilde tasarlanmaya başlandı. (EMC Corporation, 2016)