Tekoälykeskustelun varjoon on jäänyt merkittävä ja kasvava kustannuskomponentti eli tallennus- ja arkistointi (storage). Tuotamme valtavat määrät dataa tekoälyn polttoaineeksi hyödyntääksemme tietoa ja luodaksemme uutta. Samaan aikaan siirrymme yhä kiihtyvään vauhtiin kohti pilvipalveluita. On hyvä hetki tarkastella kustannus- ja tietoturvariskiä sekä tallennuspalveluiden tulevaisuutta. Tallennuksen ja tekoälyn hinta yllättää.

Keskustelimme hiljattain tieteellisen datan arkistointitarpeesta eri sidosryhmien kanssa Suomen Meriarkeologisen Seuran johdolla. Näissä keskustelussa nousivat esiin tallennus- ja arkistointipalveluiden sekä käytettyjen ratkaisumallien merkittävät kustannukset.  Myös pilveen liittyvät myytit tietoturvariskeistä ovat edelleen laajasti esillä.  Vastaavia keskusteluja käydään lukuisissa yrityksissä. Haasteena kaikille ovat tallennustilan jatkuvasti kasvavat kustannukset sekä datan ja varmistusten tietoturva.  Olemme uuden kustannusajurin äärellä.

Tallennuksen ja tekoälyn hinta yllättää

Pilvipalveluiden kustannuksia on usein vertailtu paikalliseen Data Center-ratkaisuun tai teknologian hankintaan. En tässä blogissani vertaile kokonaiskustannuksia, mutta tuon esille kolmen merkittävän ja kasvavan kustannuskomponentin.  Yleisesti tiedostetaan sääntö, että datan siirtäminen pilveen ei maksa, mutta datan käyttäminen (egress) maksaa. Tämän lisäksi kaikki suuret ja tunnetut pilvitoimijat veloittavat API-kutsuista eli datan hyödyntämisestä. Nämä kaksi kustannuskomponenttia (erityisesti API) kasvavat tulevaisuudessa aloittaessamme laajemmin AI/ML-tekniikan hyödyntämisen.

Voit helposti päätyä maksamaan 50–80% enemmän storage palvelustasi kuin olet budjetoinut. Sen lisäksi päädyt vendor lock, josta on vaikeaa päästä irti.

AI- ja ML-sovellusten ”kouluttamiseen” tarvitaan valtavia tietomääriä, jotta saadaan mielekkäitä tuloksia. Esimerkiksi NVIDIA:n mukaan kuvantunnistussovelluksen on nähtävä ”satoja tuhansia, jopa miljoonia kuvia” ennen kuin se voi toimia luotettavasti. Ilman kustannustehokasta tiedontallennusstrategiaa tekoäly- ja ML-projektit eivät ehkä koskaan pääse liikkeelle. Tallennuksen ja tekoälyn hinta yllättää.

SASE ja SD-WAN nostaa datan kustannuksia

Kolmas sudenkuoppa on SD-WAN, joka on yritysverkoissa ns ”Overlay” tekniikka. Suurin osa SD-WAN ratkaisuista perustuu tunnelointiin. Huonosti suunniteltu yrityksen verkkoarkkitehtuuri, jonka piti ratkaista tulevaisuuden haasteet, onkin pahimmassa skenaariossa täynnä päällekäisiä GRE, IPSec, VxLAN yms. tunnelointiteknikoita.

Lopputuloksena hukkaat tietoliikenneverkon kapasiteetista 15–25 % näiden ”Overlay” TCP/IP header siirtämiseen ja maksat myös tämän siirtämisestä.

Budjetoinnissa on huomioitava, että yritys maksaa myös tästä (overlay IP packet header) datan osuudesta hyödyntäessä pilvessä olevaa dataa. Tämän näkee verkkoanalysaattorilla sekä palvelun käyttäjän tuskaisesta ilmeestä siirtoviiveen kasvaessa. Tallennuksen ja tekoälyn hinta yllättää., mutta myös SD-WAN luoma lisäkustannus.

Tulevaisuus – turvallinen ja edullinen pilvitallennus

Venäjän hyökkäyssota Ukrainaan osoitti hajautetun arkkitehtuurin tärkeyden. Jatkuvuuden turvaamisessa paikallisuus on myös riski. Datan hajauttamisen lisäksi turvallinen datan tallentaminen, arkistointi ja sen varmistaminen on noussut tärkeäksi teemaksi. Tallennuspalvelussa vaaditaan nyt sisään rakennettu kiristystaittaohjelman sekä inhimillisten tai tahallisten vahinkojen suojaus.

Hyvin edulliset, nopeat ja modernit pilvitallennus- ja arkistointipalvelut tekevät tuloaan myös Pohjoismaihin. Näissä palveluissa ei makseta datan hyödyntämisestä tai API-kutsuista. Valitettavasti saamme Suomeen uusia toimijoita yleensä viimeisenä Euroopassa. Toisaalta teknologiariskit ovat olemattomia tästä johtuen. Olemme saaneet kolmannen vaihtoehdon perinteisten pilvijättien sekä paikallisen storage-ja arkistointipalvelun rinnalle. Kukapa ei haluaisi selkeää ja edullista storage-hinnoittelua, joka on helppo budjetoida?

 

Hannu Rokka, Senior Advisor

5Feet Networks Oy