#IDPD2017

30 november 2017 was de eerste Internationale dag van de Duurzaamheid (International Digital Preservation Day). Deze internationale dag staat in het teken van het behoud van het maatschappelijk digitaal geheugen, alles wat we op dit gebied hebben bereikt en nog veel belangrijker; het creëren van bewustzijn en betrokkenheid voor de uitdagingen die ons nog te wachten staan om dit geheugen veilig te stellen.

Een feestdag voor Digitt zou je kunnen zeggen. Een dag van internationale aandacht voor iets waar wij ons dagelijks mee bezighouden. Dit moet natuurlijk gevierd worden en waar beter dan op de 15e verdieping van het Ministerie van OCW in Den Haag.

Op deze locatie organiseerden het Netwerk Digitaal Erfgoed, de NCDD en het Kennisplatform Preservation twee themabijeenkomsten over E-mailarchivering (nu en in de toekomst) en de essentiële kenmerken van objecten.

Onder de groep aanwezigen viel op dat er grote diversiteit was. Gedurende de dag waren ongeveer 100 medewerkers aanwezig met zeer uiteenlopende achtergronden. Zo waren er onder andere ministeries, wetenschappelijke instellingen, musea, gemeenten, bibliotheken en commerciële bedrijven aanwezig. De opkomst en diversiteit van deze groep laat al blijken dat het onderwerp in meerdere domeinen wordt erkend en dat de groep mensen die er mee bezig is zich uitbreidt. In het welkomstwoord werd ook dan ook opgemerkt: “Hadden wij deze dag 4 jaar geleden georganiseerd, dan hadden we waarschijnlijk een kwart van de opkomst gehad”.

De ochtend van deze dag stond in het teken van e-mailarchivering. De e-mail heeft inmiddels de brief in veel gevallen vervangen als communicatiemiddel, bij zowel instellingen als individuen. Dit levert de nodige vraagstukken vraagstukken op, zoals welke mails bewaren we? Welke metadata passen we toe? Hoe beschermen we de privacy? Experts uit binnen- en buitenland deelden hun kennis en ervaringen met de aanwezigen. James Lappin van de Loughborough University trapte het onderwerp af en vertelde over de problematiek in de UK, de juridische kant van e-mailarchivering en de praktijkinvulling.

Hij uitte de problematiek met een observatie uit de praktijk.

“If 1.000 people send an average of 30 e-mails per day each, and store 1 in two days in the archiving system, what’s going wrong? Training? Interface? Professionalism? Record system should mirror the e-mail system.”

Vooral zijn laatste zin roept nogal discussie op. Moeten daadwerkelijk alle e-mails gearchiveerd worden? Wat als je hiermee privacy en andere wet- en regelgeving overtreedt? Bij overheden levert dit een continu spanningsveld op tussen Wet Openbaarheid van bestuur (WOB), de Archiefwet en huidige/nabije privacywetgevingen. In de opvolgende presentatie van het Nationaal Archief en het Ministerie van BZK werd verder in gegaan over het dilemma van e-mailarchivering bij de rijksoverheid.

Wat blijkt, ook bij de Rijksoverheid weten ze er eigenlijk maar lastig raad mee. Jaarlijks worden bij de rijksoverheid ongeveer 1 miljard e-mails verstuurd. In de huidige situatie bepaalt de individuele ambtenaar welke informatie er archiefwaardig is. In de praktijk levert dit de resultaten op die James in het eerdere voorbeeld schetste. Na maanden van onderzoek ligt er nu het volgende voorstel: Alle e-mail wordt na 10 weken gearchiveerd. Ambtenaren hebben in die 10 weken de tijd om hun privé mails van de server te verwijderen. Vervolgens worden de mails zonder verdere toevoeging van metadata naar het archief geëxporteerd. Enigszins teleurstellend zou je zeggen, deze weinig innovatieve en rigoureuze manier van bulk archivering. Met hedendaagse technologie kan het namelijk ook anders. Het bewijs hiervoor werd een paar minuten later gedemonstreerd in experiment van het National Archief met E-mail Autoclassificatie & Machine Learning.

Wat als we het antwoord op de vraag over welke e-mails gearchiveerd moeten worden kunnen toevertrouwen aan een computer? Bij het Nationaal Archief wordt er geëxperimenteerd met machine learning. Tijdens het experiment wordt de software eerst getraind om te herkennen welke e-mails zakelijk of niet-zakelijk zijn. Vervolgens moet de computer slim genoeg zijn dit bij nieuwe e-mails zelf te kunnen bepalen. Hoewel het hier om een relatief eenvoudige ja of nee invulling ging van deze technologie en het ook nog niet foutloos is, is het wel duidelijk dat hier de toekomst ligt voor classificering. Tegenwoordig zijn er partijen die middels machine learning veel kunnen bereiken op dit gebied. Bij Digitt verdiepen we ons steeds meer in het onderwerp en het maken van de match tussen ons gedachtengoed en de mogelijkheden. Het was dan ook interessant om te zien hoe het Nationaal Archief experimenteert met het toepassen van deze technologie.

De middag stond in het teken van het digitale DNA, de kenmerken van digitale objecten die essentieel zijn om te bewaren. Wat vinden we belangrijk en wat moet er behouden worden? Welke eigenschappen zijn belangrijk om door de tijd heen mee te nemen, essentiële kenmerken (significant properties).

In een aantal korte presentaties werden er verschillende zienswijzen op essentiële kenmerken gedeeld. Hoe gaan Beeld en Geluid, het Nationaal Archief, het Internationaal Instituut voor Sociale Geschiedenis (IISG) en de Koninklijke Bibliotheek om met de eigenschappen van de digitale objecten die zij beheren?   Nieuwsgierig naar hun presentie? Lees er hier meer over

Verder werd er ook de Bit list onthuld. Dit is een lijst van bedreigde digitale objecten. Deze lijst is middels crowd-sourcing opgesteld en kent verschillende gradaties van vulnerable tot practically extinct. Het is interessant om te zien welke objecten in deze lijsten opgenomen zijn. Nog interessanter voor ons is dat de reden waarom deze objecten bedreigd worden ook is beschreven. Ben je ook benieuwd naar welke objecten op het randje van verdwijnen staan? Klik dan hier

IDPD 2017 was een geslaagde feestdag waar we met z’n allen hebben bijgedragen een grotere bewustwording voor de toekomst van onze historie.

Tags: