Cloud computing leugen

IT dienstverleners zijn het er wel over eens. Cloud computing heeft de toekomst. En die toekomst is inmiddels gearriveerd.  Veel consumenten en bedrijven gebruiken al producten “Uit de Cloud”. Ook overwegen ze bestaande IT diensten naar een Cloud omgeving te migreren. Hierbij spelen nog wel issues als “Safe Harbor“, maar uiteindelijk lijken ook deze bezwaren overkomelijk. Cloud computing belooft dat we “los” komen van de infrastructuur. Dat we ons eindelijk kunnen richten op de kern van de (IT) zaak, namelijk functionaliteit. Tegelijkertijd is het risico dat we verder in infrastructuur verzeilen. De Cloud computing leugen.

Cloud computing

Big change

Cloud computing brengt ons vele voordelen. Natuurlijk begrijpen we dat we voor daadwerkelijk gebruik betalen (van Capex naar Opex), dat capaciteit schaalbaar is (scale out en scale in) en dat deployment en management van servers geautomatiseerd is (Puppet of Ansible). Echter achter al deze details gaat de werkelijke verandering schuil. We besteden minder energie aan de infrastructuur. Infrastructuur wordt een gegeven. Het is er en het doet het. Geen disks wisselen, systemen in racks schroeven en netwerkkabels aansluiten. Geen gedoe met ijzer, dat regelt de Cloud provider. Eindelijk kunnen we ons richten op  functionaliteit. Dat is namelijk waar bedrijven en consumenten het voor doen. Niemand draait een operating systeem “just for the fun of it”.

Containers en microservices

Als de nadruk op functionaliteit komt te liggen en de steeds sneller ontwikkelen noodzaak is, dan ligt het voor de hand steeds kleinere stukjes functionaliteit te maken. Dit verklaart de populariteit van de microservices. Maar als gevolg hiervan wordt de overhead van het (gevirtualiseerde) operating systeem relatief wel steeds groter. Container technologie zoals Docker verlaagt deze overhead weer. De onderliggende hardware wordt zo beter benut. Amazon gaat nog een stap verder met de AWS Lambda Model (hier mee lijkt het overigens op Red Hat’s Open Shift). De applicatie draait met nog minder overhead op het onderliggende cloud platform.

DevOps en agile

Het is dan ook niet verwonderlijk dat deze technologische ontwikkelingen een andere manier van werken vereisen. Met het verdwijnen van de infrastructuur en het bijbehorende beheer, komt de DevOps discussie in een ander licht te staan. Het wordt noodzakelijk (maar nu ook  mogelijk) om agile te gaan werken. Microservices worden sneller ontwikkeld en traditionele constructies zoals OTAP verlaten. Spotify bijvoorbeeld, doet software ontwikkeling in tribes. Het een kan niet zonder het ander lijkt wel.

Cloud computing leugen

Sneller software ontwikkelen en minder “last” van de infrastructuur zijn goed nieuws voor bedrijven en organisaties. Kortere doorlooptijden en er efficiënter werken het gevolg. We kunnen ontwikkelen tegen lagere kosten en klanten worden slagvaardiger. Ook betekent het dat IT bedrijven zich eindelijk bezig kunnen houden met alles op, of boven, de infrastructuur. Tenzij je natuurlijk deel wil uitmaken van een steeds kleinere groep infrastructuur specialisten. En dit is de Cloud computing leugen. Veel IT bedrijven die nu bezig zijn met Cloud, zijn eigenlijk bezig met infrastructuur. Is dat nog wel zo interessant?

Linux revolutie onderweg

Al jaren wacht ik op de Linux (en open source) revolutie in de IT markt. Linux op desktops, Linux op servers en Linux op telefoons. De wereld zou overspoeld worden en Linux zou overal te vinden zijn. Hoe kunnen bedrijven met hun commerciële software hiermee concurreren? 

Microsoft_loves_Linux

Geen revolutie

Niets was echter minder waar. Linux op de desktop zette niet door. Niet dat het ontbrak aan goede Linux desktop distributies en ook niet aan goede software. Bovendien steeds meer applicaties werden web-based. Een Linux desktop was een prima alternatief. Eindgebruikers stoorden zich toch aan kleine visuele verschillen en bleven Microsoft Windows trouw. Vreemd genoeg waren het vaak juist deze eindgebruikers die het geen probleem vonden over te stappen maar OS X.

Toch een revolutie

Hoewel het minder zichtbaar was, kwam Linux toch in elk bedrijf en in elke huiskamer binnen. Routers, firewalls, NAS en andere appliances werden steeds vaker voorzien van Linux. Dit is begrijpelijk, Linux kost niets en is eindeloos aanpasbaar. Ook kwam er goedkope PC hardware (Raspberry pi) op de markt en daarop draaide natuurlijk Linux. Ineens gingen naar mijn idee mensen om me heen zonder enige Linux geschiedenis daar gewoon mee experimenteren. De drempel is blijkbaar toch laag.

Microservices en Cloud computing

De invloed van web gebaseerde technieken op de IT ontwikkelingen deed zich gelden. Het werd steeds interessanter geen grote applicaties te bouwen, maar kleine stukjes functionaliteit, zogenaamde microservices. Deze microservices maken het mogelijk dat development sneller kan plaats vinden en met minder risico’s en impact op eindgebruikers. Ook de bijbehorende development methoden werden geadapteerd, zoals continuously delivery, agile en scrum. Tegelijkertijd raakten bedrijven overtuigt van het nut van virtualisatie van infrastructuur (getuige het grote succes van VMware). De stap van virtualisatie naar Cloud Computing is daarom geen al te grote technische stap. De open source community volgde rap met bijvoorbeeld OpenStack.

Datacenter automation

Hoewel Cloud Computing technisch geen al te grote stap betekende, mist het zijn effect op de IT niet. Alles binnen een Cloud omgeving laat zich scripten en daarmee automatiseren. Of het nu gaat om de deployment van virtuele servers, de configuratie daarvan of het schalen van capaciteit (scale in en scale out). Dit wordt wel aangeduid met datacenter automation. Het verklaart de populariteit van tools als Puppet en Ansible. Het laat zich raden dat die zich goed laten combineren met het idee van de microservices. Men spreekt hier wel over de verandering van “server as pets” naar “servers as cattle”.

Alle ingrediënten samen

De principes van “scale out” en “scale in” en de microservices samen stelden steeds minder eisen aan de features van het operating systeem. Een OS wordt steeds eenzijdiger ingezet. Linux leent zich hier wederom erg goed voor. Het lijkt eerder een doos met Lego blokjes waaruit je zelf iets kan maken, dan een kant en klaar product. Het is naar mijn idee hier dat Linux revolutionair zal blijken. Naast dat bijna alle cloud infrastructuren op Linux gebouwd worden (zoals bijvoorbeeld Amazon, maar ook OpenStack) is de keuze voor Linux als OS binnen de Cloud ook logisch. Voordelen zijn bijvoorbeeld: lage kosten, geen licentie problematiek en de aanpasbaarheid.

Nog eenvoudiger

Het toepassen van microservices in Cloud infrastructuur verlangt verdere afslanking. De overhead van een virtuele server is nog steeds te groot. Hier biedt het gebruik van container technologie, zoals Docker uitkomst , zeker in combinatie met datacenter automation. Het OS hoefde nog minder features – en dus complexiteit – te hebben. Ook het update mechanisme kon vereenvoudigd worden. De grote Linux distributeurs kwamen met “uitgeklede” versies van hun OS met aangepast update mechanisme (zoals Ubuntu Snappy Core en Red Hat’s Atomic).

d.d. 7 december 2015
Aanvulling, Vandaag kwam ik dit artikel tegen over unikernels. Dit sluit precies aan bij de zoektocht naar kleinere OS-en, een kernel die slechts een applicatie draait.

Features

Kon commerciële software voorheen met Linux concurreren op basis van features, dan zie ik de grond daarvoor nog verder verdwijnen. De aanpasbaarheid en kwaliteit maken Linux tot een onweerstaanbare keuze voor bedrijven – nog los van kostenvoordelen. De schaalbaarheid en automatisering daarvan schreeuwt om open source software. Linux “loves Cloud Computing”. Deze revolutie is in alle hevigheid los gebarsten.

Houdbaarheid van digitale gegevens

In Noorwegen heb ik rotstekeningen gezien waarvan vermoed wordt dat deze ongeveer 9000 jaar oud zijn. Een van de tekeningen laat een rendier of hert zien dat zijn kop omdraait en achter zich kijkt. Niets bijzonders zou je denken. Maar iemand heeft dat beeld 9000 jaar geleden gezien, op de rots getekend en nu weten wij het. Dat is toch onvoorstelbaar. Hoe zit dat eigenlijk met onze moderne digitale gegevens, hoe lang kunnen wij die bewaren? Dit zette me aan het denken en als zo vaak leidt dat tot een stukje tekst.

Uiteindelijk vergaat alles

Om te beginnen, natuurkundig bekeken zal alles tenslotte vergaan. Zo hiermee is het meest voor de handliggende eerste gedachte van tafel.

Hoe lang kunnen we als mensheid eigenlijk analoge gegevens bewaren? Welke voorbeelden zijn er van overleveringen (analoog evenwel) en hoe oud zijn die eigenlijk? Kort onderzoek op internet levert het volgende overzicht op:

  • Noorse rotstekeningen geschat 9000 jaar oud
  • Kahun Gynaecological Papyrus geschat op 4000 jaar oud
  • Gutenberg bijbel wordt geschat op 2000 jaar oud
  • Gedichtenbundel van Den Schoolmeester in de boekenkast, geschat net iets minder dan 100 jaar oud
  • Oudste foto in huis, mijn vader als kleine jongen, iets ouder dan 75 jaar

hertje

Mijn eerste observatie is dat ik vergeleken met de andere voorbeelden geen erg oude zaken in huis heb.  Mijn tweede observatie is dat mits zorgvuldig bewaard papier aardig kan concurreren met rotstekeningen. We zouden dit als baseline kunnen beschouwen en eens kijken welke digitale media ik nog heb.

Digitaal archief

De eerste digitale media die ik zelf in huis haalde waren CD’s. Voor zover ik weet is de inhoud daarvan nog steeds goed leesbaar. In overzicht:

  • Oudste CD (Kate Busch, Hounds of love) 30 jaar oud (het jaartal op het boekje)
  • Floppy disc 19 jaar oud (er stond een datum op het label, de leesbaarheid kan niet geverifieerd worden, ik heb geen diskdrive meer)
  • Oudste digitale foto 12 oud (ik wist nog waar en wanneer dat was, foto geverifieerd goed leesbaar)

Vergeleken met de rotstekeningen en de eerste boeken is dit nog geen indrukwekkend resultaat. Hoelang gaan digitale media eigenlijk mee? Kort onderzoek op internet levert het volgende overzicht op.

tabel levensduur media

Hoewel ik dit een wel erg voorzichtige inschatting vind, is het geen erg bemoedigend resultaat.

Digitaal versus analoog

Er is blijkbaar een belangrijk verschil tussen het opslaan van gegevens in analoge vorm en in digitale vorm. In het geval van analoge gegevens kan je stellen dat de levensduur van de gegevens gelijk is aan die van het materiaal (de media) waarop ze zijn opgeslagen. Voor digitale gegevens gaat dit niet op. Een tape of floppy kan zijn gegevens verloren zijn zonder dat je dat kan zien. Daarnaast moet het het medium nog kunnen lezen (heb je dan nog een werkende floppy drive of CD speler en interface?).

Er wordt wel gesteld dat media na twee generaties systemen niet meer leesbaar zijn.

Daarnaast moet het format van de bestanden ook nog leesbaar zijn. Deze zaken worden wel aangeduid met fysical media obsolescences. Naast deze digital obselescence speelt er nog een andere complicerende factor, namelijk datagroei. De groei van data is niet lineair, maar eerder exponentieel.

Welke factoren beïnvloeden digitale opslag media? Te denken valt aan magnetische invloeden, temperatuur (zowel hitte als kou), brand, radiostraling, vocht, uitdroging, chemicaliën en fysieke invloeden (aardbevingen, instortingen van gebouwen e.d.)

Aanvalsplan

Bedrijven en organisaties zien zich natuurlijk eveneens geconfronteerd met deze problematiek, daar zijn we bij ons in huis met onze muziek, foto’s en home video’s geen uitzondering op. Welke tactiek(en) passen deze bedrijven toe?

Het fysiek handelen van mensen doet de media sterk doet achteruitgaan en heeft daarom grote risico’s. Om dit tegen te gaan worden bijvoorbeeld robot’s gebruikt om tapes te hanteren.

Het labelen van CD's en DVD's verminderd de houdbaarheid van sterk.

Ook wordt data wel herschreven (ververst). Hiermee wordt datarot (ook wel bitrot genoemd) tegengegaan. Ook wordt ervoor gekozen data naar nieuwe media te migreren.

 

Datarot, het vervagen onleesbaar worden van digitale gegevens op een drager of in memory.

In alle gevallen wordt geaccepteerd dat een deel van de gegevens verloren gaat. Dat is dus niet anders dan ik de fysieke (analoge) wereld.

Misschien een vreemd idee, maar digitale gegevens op papier printen kan een oplossing zijn voor de eeuwigheid. We weten immers dat dit duizenden jaren kan overleven. Bovendien is er daarmee ook geen afhankelijkheid van gebruikte interfaces. Het is echter minder handig als het gaat om de opslag van veel gegevens. Daarmee vallen foto’s, muziek en film praktisch af.

De keuze voor rotstekeningen was dus nog zo slecht niet. Alle respect voor de kunstenaar van 9000 jaar geleden.