Je to neviditelné a pro každou firmu to má velkou hodnotu. Co je to?

Server Digibiz.cz přináší autorský text datového odborníka Martina Lenka, který působí na pozici Specialist Senior Systems Engineer pro CEE & SEE region ve společnosti Dell Technologies.

Data jsou to, co pohání dnešní firmy. Na jejich základě probíhají veškerá rozhodnutí. A pokud to tak u vás nefunguje a používáte jen intuici, pak jste genius nebo blázen. Digitální transformace zde působí jako nástroj evoluce. Kdo se nevyvine, vyhyne.

Dat, která vstupovala do rozhodovacích procesů před pár lety, tvořila jen zlomek, oproti těm, se kterými se pracuje dnes. Navíc se změnil jejich charakter. Nejde o čísla vyskládaná do tabulky, na která můžeme aplikovat nějakou statistickou metodu či z nich udělat graf a podle výsledku se rozhodnout.

Jde o různé formy dokumentů, video, audio, údaje pocházející z internetu věcí nebo různá analytická data. Říká se jim nestrukturovaná data. Obecně jde o data, která nejsou uspořádána podle předem definovaného datového modelu nebo nejsou ukládána podle předem definovaného schématu – nejsou uložena v relačních databázích, nýbrž uložena ve formě souborů či objektů a je k nim přistupováno prostřednictvím souborových systému či prostřednictvím API. Těchto dat je dnes už většina. A skrývají obrovský potenciál pro toho, kdo je dokáže uložit, ochránit, pracovat s nimi a analyzovat je.

Nastává éra nestrukturovaných dat

Tato oblast byla dříve více na okraji priorit architektů a správců IT a data byla primárně vytvářena uživateli. Dnes již majoritu těchto dat vytváří nebo zpracovávají aplikace. S tím roste i jejich velikost a postupně překračuje únosný rámec toho, co je možné ukládat do klasických SAN úložišť či dokonce databází ve formě blobů či objektů. Druhým aspektem je důležitost těchto dat. Informace v nestrukturovaných datech se staly v řadě případů stejně důležité jako data v databázích, a tak samozřejmě vzniká potřeba chovat se k nim jako k business kritickým datům.

Třetím a velice důležitým aspektem je schopnost predikce růstu těchto dat a rovněž výkonnostních požadavků na práci s těmito daty. Řada zákazníků, s nimiž jsme realizovali různé projekty, se vzácně shodují, že jen těžko toto predikují. Na druhé straně jsou tlačeni k úspoře nákladů, kdy nevhodná volba architektury a vlastního řešení může v budoucnu znamenat nemalé problémy či dokonce ztráty.

S ohledem na vše výše uvedené, kritickým momentem při návrhu nového řešení je volba správné architektury, která je schopna zajistit jak potřebné funkcionality, odpovídající profil výkonu, tak i možnost nepredikovatelného růstu do budoucna, a to nejen kapacitně, ale i výkonnostně. Všechny tyto požadavky stručně charakterizují architekturu tzv. horizontálního škálování či Scale-Out. Tato architektura sama o sobě umožnuje budovat úložiště všech velikostí od jednotek TB do desítek PB a to v rámci jediného souborového systému a namespacu.

Nic tak nebrání tomu konsolidovat veškeré své aplikace a workloady do jednoho řešení, které může být vybaveno rychlým all-flash paměťovým zařízením pro aplikace s vysokými výkonnostními požadavky, spolu s hybridním paměťovým zařízením pro běžné aplikace a dále pak archivní pamětí pro data, ke kterým není tak často přistupováno a je záhodno uložit je na co nejlevnějším nosiči.

Konkurz na ochránce dat

Co by ale měl umět systém, který splňuje veškeré nároky na péči o nestrukturovaná data? V prvé řadě musí být schopen uložit, chránit a zpřístupnit enormní množství dat. Dnes nejsou výjimkou data obsahující 100 miliónů či dokonce miliardy souborů či objektů. Velkou roli hraje způsob práce s metadaty souborů či objektů.

Systém musí být schopen zajistit potřebnou granularitu a strukturu nastavení přístupových oprávnění, jejich kontrolu a správu. Musí poskytnout přístup k datům prostřednictvím potřebných souborových protokolů a API (typicky SMB, NFS, FTP, S3, REST API, NDMP) a umožnit data spravovat pomocí tzv. data services (kvóty, snapshoty, replikace, data reduction atd.)

Klíčovým faktorem při výběru vhodné platformy je i jednoduchost a efektivita správy, provozu a dalšího rozšiřovaní dané platformy. Všichni tvrdí, že mají „easy management“, ale co to vlastně je? Vymazlené uživatelské rozhraní managementu a vše na pár kliků? Může být, ale klíčové je stanovení potřebného úsilí pro konfiguraci systému, běžné administrativní úkony a provozní úkony (upgrady, patche, rozšíření) – tj. kolik času a lidí na to musíte vyhradit. Spravujte svá data, ne datové úložiště.

Zásadním momentem každého zařízení, je konec jeho životního cyklu, kdy je nutné provést technologickou obnovu. Ideálně by mělo být možné kombinovat v rámci jednoho systému více generací Storage nodů. V takovém případě lze totiž bez odstávky data převést na ty nové. Zejména v případě většího množství dat v řádech 100TB či PB by to u klasických databází bylo velmi obtížně realizovatelné nebo spíše nerealizovatelné.

Chraňte svá data

Jedním z fenoménů data managementu je ochrana před cílenými útoky na data zákazníka, tzv. ransomware. Jedná se výnosný byznys, tomu odpovídá i kvalita a následky těchto útoků. Všichni ještě máme v paměti smutný případ benešovské nemocnice, která byla odstavena na více než měsíc z kompletního provozu.

Klíčovou prevencí ztráty dat jsou jejich zálohy, ze které je možné data po útoku obnovit. Bohužel v řadě případů není fyzikálně možné zazálohovat rozsáhlé data sety a tak musí být navržena vhodná strategie kombinující různé techniky – verzování, snapshoty, replikace, WORM atd. Tyto takříkajíc standardní techniky je možné v případě některých enterprise úložišť rozšířit o externí aplikace, které analyzují v reálném čase auditní záznamy všech operací na úložišti. Pokud je detekován vzorec chování, který odpovídá útoku, zajistí potřebnou okamžitou akci na úrovni pole dříve, než správce učiní potřebné kroky.

Aplikace prostřednictvím REST API datového úložiště přeruší komunikaci klientského zařízení, znemožní mu další připojení, obnoví již kompromitovaná data z dostupného snapshotu a případně provede další adminem nadefinované akce, například přepnutí systému do read-only modu, zrušení replikačních politik a podobně. Zde více než kde jinde platí, kdo je připraven, není zaskočen.

Autor je Martin Lenk, Specialist Senior Systems Engineer, CEE & SEE region, Dell Technologies

https://digibiz.cz/sef-avastu-ondrej-vlcek-pandemie-agilnimu-vyvoji-prilis-nesvedci-utoky-na-nemocnice-povazuji-za-terorismus/