Macierze dyskowe RAID (ang. Redundant Array of Independent Disks), są obecnie niezwykle popularnym rozwiązaniem. Do niedawna były stosowane jedynie w sprzęcie biznesowym. Upowszechnienie niewielkich serwerów NAS, wprowadziło te układy na rynek konsumencki. Większość nowych płyt głównych, pozwala również na konfigurację podłączonych do nich kilku dysków twardych, w układzie macierzy RAID.
Serwery dysków sieciowych NAS (Network Attached Storage), jak również serwery ogólnego zastosowania, zazwyczaj stosują układy wielu dysków w konfiguracjach RAID 5 i RAID 6 zapewniających nadmiarowość. Umożliwiają one pracę takiego układu napędów, bez utraty dostępu do danych, nawet w sytuacji usterki odpowiednio jednego lub dwóch z nich. Ta własność mylnie odbierana jest jako forma pełnego zabezpieczenia ciągłości dostępu do danych. Co gorsza, powoduje to w wielu przypadkach, utrzymywanie jedynej kopii danych, zapisanej w woluminie, utworzonym w przestrzeni danych tworzonej przez macierz dyskową.
Nadmiarowość w rzeczywistości zabezpiecza przed utratą dostępu do danych, w przypadku odpowiednio szybkiej reakcji na awarię pojedynczych nośników układu macierzy. Oznacza to, konieczność ciągłego monitorowania stanu macierzy i reagowania na wszelkie anomalie. Nie ma więc mowy o zakładaniu bezawaryjności nośników, a jedynie o mechanizmach minimalizujących ryzyko utraty dostępu do danych. Wynika to z zastosowania układu dysków i założenia, że awaria kilku z nich jednocześnie, jest mało prawdopodobna. Niestety, nasi klienci często mylą te własności z użytkowaniem bezobsługowym i bezawaryjnym.
W macierzach RAID trafiających do naszego laboratorium, występuje często kilka jednoczesnych usterek, uniemożliwiających uzyskanie dostępu do danych. Najpopularniejsze z nich to:
- uszkodzenia powierzchni talerzy, występujące w kilku dyskach macierzy,
- awarie firmware’u dysków lub samych kontrolerów,
- licznie występujące błędne sektory nie dające się prawidłowo odczytać,
- uszkodzenia dysków SSD stosowanych jako cache macierzy,
- błędy powstałe w wyniku nieprawidłowego wywołania funkcji TRIM, w układach stosujących dyski SSD jako podstawowe nośniki,
- dane zaszyfrowane w wyniku ataków ransomware.
Są to tylko główne typy problemów, mogących się pojawić, podczas użytkowania macierzy dyskowych. W rzeczywistości jest ich znacznie więcej. Niestety, wszystkie z nich, w związku z konstrukcją samych układów RAID, wymagają sporych nakładów pracy, wpływając na cenę usługi odzyskiwania danych.
Jak wcześniej zostało wspomniane, układy RAID podwyższają bezpieczeństwo przechowywania danych - spowodowało to popularyzację tego rozwiązania. Często jednak, błędnie utożsamia się tę poprawę bezpieczeństwa danych, z całkowitym zabezpieczeniem przed utratą dostępu do nich. Takie niepoprawne przeświadczenie, nie jest jedyną pomyłką, skutkującym utratą danych, popełnianą przez użytkowników. Kilka najbardziej typowych błędów to:
- Świadome lub przypadkowe skasowanie plików – macierze RAID działają zasadniczo na poziomie bloków danych, a nie systemów plików. W związku z tym, w większości rozwiązań nie implementują one mechanizmów wspomagających przywracanie skasowanych danych np. poprzez tworzenie migawek stanu.
- Pomyłki podczas wymiany dysków, skutkujące usunięciem sprawnego dysku zamiast uszkodzonego, próby odbudowy układu macierzy z użyciem niesprawnych dysków, błędy podczas aktualizacji oprogramowania, czy też brak prawidłowo wykonanych kopii bezpieczeństwa to typowe wpadki zdarzające się administratorom, mającym pod opieką sprzęt wyposażony w macierze dyskowe.
- Nieumiejętny dobór systemów plików lub ich parametrów, w zastosowaniu do bardzo dużych woluminów, możliwych do utworzenia za pomocą macierzy dyskowych, może również skutkować problemami z dostępem do zapisanych w ich strukturach zasobów.
Ataki ransomware, które zostały wymienione wcześniej, uszkadzają dane przechowywane nie tylko w zaatakowanych maszynach, ale również na dostępnych za ich pomocą dyskach sieciowych. Przekłada się to na uszkodzenia danych przechowywanych w macierzach RAID serwerów NAS. Niestety, oprogramowanie samych serwerów, nie jest wolne od błędów, o czym na przestrzeni ostatnich lat kilkukrotnie, boleśnie przekonali się właściciele bezpośrednio zaatakowanych przez ransomware konstrukcji firm Synology i QNAP. Cyberprzestępcy żądają zazwyczaj ogromnych kwot za odszyfrowanie danych. Nie dają jednak gwarancji, że po zapłaceniu okupu dostarczone przez nich klucze, pozwolą na prawidłowe odszyfrowanie danych. Dodatkowo, środki które uzyskują w ten sposób, pozwalają im rozwijać to złośliwe oprogramowanie. Jedynym pewnym zabezpieczeniem przed takimi atakami są prawidłowo wykonywane i przechowywane kopie bezpieczeństwa.
Biorąc wszystkie powyższe czynniki pod uwagę, macierze dyskowe stosowane w serwerach, w szczególności w roli NAS, wymagają bardzo dokładnego przemyślenia ich konfiguracji. Przede wszystkim jednak, należy zadbać o prawidłowe tworzenie, zabezpieczanie oraz weryfikację zawartości kopii bezpieczeństwa danych przechowywanych w woluminach, utworzonych za ich pomocą.
W naszym laboratorium wielokrotnie odzyskiwaliśmy dane z macierzy RAID, gdyż nie istnieją urządzenia bezawaryjne, a jedyną metodą zabezpieczenia się przed utratą danych, jest wykonywanie kopii bezpieczeństwa, obok innych, codziennych operacji, służących utrzymaniu ciągłości działania systemów.