Werkafspraken Koninklijke Bibliotheek en DARE-partners  Betreffende langdurige opslag en permanente toegang

Versie 2.0(concept)

Datum

Instelling

Naam



 




.............................................

 

 

Bibliothecaris Universiteit

 

Koninklijke Bibliotheek




.............................................

 

 

Directeur

  1. Inleiding

Het e-Depot is een digitale archiefomgeving waarin permanente toegang tot digitale informatiebronnen wordt nagestreefd. Zonder een dergelijke omgeving zouden digitale bronnen snel onleesbaar worden, doordat software en hardware verouderen en de informatiedragers een beperkte levensduur hebben. Het e-Depot is ingericht om het Depot van Nederlandse (elektronische) Publicaties te bewaren en om permanente toegang te verzekeren voor de onderzoeksgemeenschap tot wetenschappelijke informatie. De kern van het e-Depot, het Digital Information Archiving System (DIAS), is gebaseerd op het OAIS reference model, een internationale standaard. De KB hanteert transparante procedures bij de opname en verwerking van digitale publicaties. Kwaliteitscontrole is onderdeel van het opnamebeleid en de daadwerkelijke verwerking van het materiaal in het e-Depot. Het e-Depot is ontwikkeld om duurzame opslag en lange-termijn toegang te faciliteren. Migratie- en emulatieprocedures worden ontwikkeld als strategieën voor duurzame toegang. Lange-termijn archivering van digitale publicaties is volledig ingebed in de organisatie en maakt onderdeel uit van het collectiebeleid en de dagelijkse verwerkingsprocessen van de KB. Binnen de Research en Development afdeling vindt continu onderzoek naar nieuwe ontwikkelingen op het gebied van digitale duurzaamheid plaats, in een internationale context. Het e-Depot systeem en de kwaliteit van de verwerkingsprocessen voor digitale publicaties worden met regelmaat aangepast aan de huidige stand van zaken. Daarvoor worden nieuwe tools ontwikkeld en geïmplementeerd. De KB streeft naar internationale certificering van het e-Depot als een kwaliteitskeurmerk.
In het kader van project DARE (Zie verder onder: http://www.narcis.info/index/tab/darenet/) is, ten behoeve van langdurige opslag van en permanente toegang tot digitale objecten ('Door DARE als volgt gedefinieerd: ".. those objects that are made available on the public Internet through the IR's. A copy of those objects will enter the e-Depot of the Koninklijke Bibliotheek." In: "Report DARE - Specifications for a Networked Repository", versie 3.0, Augustus 2003, par. 4.3.3. "Requirements of the DARE partners relating to archiving and preservation") van de Institutional Repositories (IR's) van Nederlandse universiteiten en wetenschappelijke instituten, een koppeling tot stand gebracht tussen deze IR's en het e-Depot van de KB. De IR's kunnen door middel van deze werkafspraken gebruik maken van de diensten die de KB ten behoeve van lange termijn bewaring van digitale publicaties heeft opgezet. Dat betekent dat IR's hierin niet zelf hoeven te investeren. Het gaat hierbij hoofdzakelijk, maar niet uitsluitend, om tekst objecten. De KB richt haar digitale duurzaamheidsactiviteiten voornamelijk op tekstmateriaal. De overeenkomst met de IR's is onderdeel van de nationale depotfunctie van de KB. Voor de levering van materiaal door de IR's aan de KB en voor de teruglevering van materiaal door de KB aan de IR's gelden de werkafspraken zoals deze hieronder zijn vastgelegd.

  1. Deponeren & Archiveren

    1. De KB neemt alleen openbaar toegankelijke publicaties op die door de IR's in het publieke domein worden, of zullen worden, aangeboden. IR's zijn zelf verantwoordelijk voor formele afstemming met auteurs van de in de repositories aangeboden publicaties die ter harvesting worden aangeboden.
    2. Het materiaal wordt alleen dan in het e-Depot opgenomen indien het beschikbaar is in een van de afgesproken bestandsformaten en de metadata voldoet aan de richtlijnen van Darenet (zie verder onder 3.) Bijlage A bevat een lijst van toegestane bestandsformaten. Deze lijst kan gedurende de looptijd van deze werkafspraken aangepast worden aan de actuele situatie. Vanuit het oogpunt van duurzaamheid hebben non-proprietary of algemeen gangbare en veel gebruikte formaten de voorkeur. Tenminste één maal per jaar, zal tussen de IR's en de KB overlegd worden over de geaccepteerde bestandsformaten. Dit zal binnen het WRM-overleg gebeuren.
    3. Uit IR's geharveste tekstbestanden anders dan in PDF formaat zullen met het oog op duurzame archivering door de KB worden omgezet naar PDF-A. Het originele bestand in het originele formaat zal echter altijd bewaard worden naast de genormaliseerde versie.
    4. De KB richt zich op het duurzaam toegankelijk houden van digitale objecten. Om die reden zal de KB alleen metadata met bijbehorende objecten harvesten en opnemen in het e-Depot. De KB gaat er vanuit dat wanneer er in een metadatabestand geen externe verwijzing naar een object is opgenomen, er ook geen object bij hoort en het betreffende record niet geharvest hoeft te worden.
    5. De KB neemt het materiaal permanent op in het e-Depot: eenmaal gearchiveerd materiaal wordt niet verwijderd. Zogeheten "deletes" uit het OAI-protocol worden door de KB genegeerd. Wel kan op verzoek van de IR de toegang ertoe beperkt worden (zie verder onder 5.3).
    6. De IR's stellen de KB in staat om minimaal één maal per maand materiaal te harvesten. De KB doet dit zoveel mogelijk op een vast tijdstip per IR. De IR's stellen de KB op de hoogte wanneer het om bepaalde redenen niet mogelijk is om te harvesten.
    7. Een object kan in verschillende IR's zijn opgenomen (bijvoorbeeld door samenwerking van verschillende medewerkers van universiteiten aan één publicatie). Verdubbeling in DAREnet is dan ook onontkoombaar. Dat geldt ook voor verdubbeling die zal optreden in het e-Depot.
    8. Indien een IR een object met een nieuwe wijzigingsdatum in de set plaatst die volgens afspraak door de KB wordt geharvest, zal deze zonder meer als nieuw object worden opgenomen in het e-Depot.
  1. Metadata

    1. De IR's zorgen ervoor dat de metadatarecords voldoen aan de richtlijnen voor metadata, zoals die zijn vastgelegd in DARE Use of Dublin Core. De actueel geldende versie is "DARE Use of Dublin Core 2.0". Indien een nieuwe versie verschijnt, zullen de IR's de KB daarover informeren.
    2. Besluiten over invoering van een nieuwe richtlijn voor metadata worden in concept vastgesteld binnen het WRM-overleg. Daarvan maakt de KB deel uit. Met in achtnemening van het daaropvolgende advies van de BIK worden de richtlijnen vastgesteld door het platformbestuur (SURFfoundation).
    3. Wijzigingen in de metadatastructuur worden voorbereid binnen de zg. WISH-groep en vervolgens besproken binnen het WRM-overleg. Daarin worden besluiten genomen ten aanzien van invoering hiervan. De KB dient in een zo vroeg mogelijk stadium op de hoogte te zijn van eventuele wijzigingen ten aanzien van de metadatastructuur. Alleen op die manier is de KB in staat om tijdig eventuele aanpassingen in zijn eigen processen door te voeren.
    4. De KB meldt aan de betreffende IR eventueel in de metadata geconstateerde afwijkingen ten opzichte van de richtlijnen. De KB voert hiervoor een eenmalige kwaliteitscontrole uit voorafgaand aan het opstarten van het harvestproces. Na eventuele aanpassingen, zal er een nieuwe kwaliteitscontrole plaatsvinden. De KB is bevoegd om bij afwijkingen het materiaal vooralsnog niet op te nemen en meldt dit aan de betreffende IR.
    5. De KB neemt, conform de algemene lijn van het e-Depot, metadata van het gearchiveerde IR-materiaal op in de zonder beperking toegankelijke KB catalogus. Hiertoe wordt de door IR's aangeleverde metadata omgezet in de metadatastructuur zoals die door de KB wordt gehanteerd.
  1. Duurzame opslag & Permanente toegang

    1. Om het materiaal uit de IR's zo goed mogelijk te kunnen bewaren en de toegang daartoe te garanderen, doet de KB voortdurend onderzoek naar alle mogelijke aspecten hiervan. De KB committeert zich aan het uitvoeren van "preservation actions" wanneer dat nodig is om toegang tot het materiaal veilig te stellen. Voorwaarde hiervoor is dat IR's bestanden conform de lijst van toegestane bestandsformaten aanbieden.
    2. De KB houdt de IR's op de hoogte van procedures rondom acties nodig om gedeponeerd materiaal toegankelijk te houden.
  1. Vindbaarheid & Teruglevering

    1. De KB zal geen speciale diensten gaan aanbieden op het uit de IR's geharveste materiaal, tenzij met toestemming van de IR's. Onder speciale diensten wordt o.a. verstaan een aparte toegang tot dit materiaal of een aparte ingang in de KB-catalogus.
    2. Zowel de metadata als de door de KB bij de IR's geharveste objecten zelf zijn vrij toegankelijk. De metadata van de objecten zijn raadpleegbaar via de KB-catalogus. Bij het opvragen van een object krijgt de gebruiker twee resultaten gepresenteerd. De eerste leidt naar de IR van de instelling die het betreffende object beheerd en heeft gedeponeerd. De tweede leidt de gebruiker naar de gearchiveerde kopie daarvan in het e-Depot. De gebruiker kan kiezen voor twee routes naar het betreffende object. De wijze waarop beide resultaten gepresenteerd worden zal de gebruiker in eerste instantie rechtstreeks naar de betreffende IR verwijzen. Wanneer het opgevraagde object daar niet beschikbaar is, kan de gebruiker alsnog toegang daartoe krijgen via het e-Depot.
    3. De IR kan, vanwege zwaarwegende redenen, de KB verzoeken om bepaald IR-materiaal niet meer vrij toegankelijk te maken. De KB gaat er vanuit dat er bij de IR's procedures geïmplementeerd zijn met betrekking tot "notice and take down". Publicaties die als gevolg van deze procedure uit een IR gehaald zijn zullen, op aangeven van de IR's zelf, niet meer getoond worden via de KB-catalogus Onderzocht wordt hoe dit zo veel mogelijk geautomatiseerd kan worden. Bijvoorbeeld via "deletes" in een harvest..
    4. IR's dienen in een daarvoor bestemd metadataveld in te vullen of er op bepaalde content een embargo rust. De metadata van de betreffende content komen dan wel in de Nederlandse Bibliografie Online, de content wordt na de embargodatum geharvest en beschikbaar gesteld.
    5. De IR's kunnen de KB verzoeken materiaal terug te leveren. Teruglevering kan per batch, geselecteerd op door de IR zelf in de metadata aangeven datum (door middel van de elementen <date> en <dateModified>) en/of bestandsformaat en formaatversie.
    6. Indien de IR meerdere versies van hetzelfde materiaal heeft aangeleverd, wordt bij teruglevering de meest recente versie teruggeleverd. Oudere versies blijven uiteraard wel bewaard. Voorwaarde voor de KB om daadwerkelijk de laatste versie van een object terug te kunnen leveren is dat deze laatste versie geïdentificeerd moet kunnen worden door de harvester. Dit kan alleen wanneer de IR's zorgvuldig gebruikmaken van het datumveld in de metadata (DateModified).
    7. Voor teruglevering dient een IR een verzoek in bij de afdeling e-Depot van de KB. Hiervoor kan een mail worden gestuurd naar E-depot.mailbox@kb.nl. De KB zal vervolgens binnen een periode van drie weken het gevraagde materiaal klaarzetten op de FTP-server van de KB. Teruglevering geschiedt kosteloos.
  1. Overige afspraken

    1. Om adequaat te kunnen reageren op veranderingen bij de IR's en het harvestproces zo goed mogelijk te laten verlopen, is het van belang dat de KB tijdig op de hoogte is van wijzigingen. Zo moet de KB o.a. op de hoogte zijn van veranderingen in de metadata op element-niveau, naamgeving van repository, de basisurl, de metadataprefix, setnaam en setspec, en de contactgegevens van de beheerder van de IR. Mogelijk zullen deze gegevens centraal worden bijgehouden via een centraal informatiepunt bij de KNAW.
    2. Via het WRM- en WISH-overleg worden de repository managers geïnformeerd over wijzigingen met betrekking tot het e-Depot.
    3. De KB dient tijdig op de hoogte gesteld te worden van het toevoegen van een IR aan de DAREnet groep. Dit om tijdig voorbereidingen voor harvesten en opname in het e-Depot te kunnen treffen.
  1. Duur van de werkafspraken

    1. De huidige werkafspraken (versie 2.0) zijn geldig vanaf 1 januari 2009 en zullen vóór het eind van 2010 geëvalueerd worden en bij voorkeur omgezet worden in een overeenkomst. Dit geldt niet voor de lijst van toegestane bestandsformaten, die wordt bijgesteld wanneer nodig.
  1. Bijlage A Lijst met geaccepteerde bestandsformaten, versie 1.0

Bestandsformaat

Extensie

ABP

abp

AVI

avi

Executable

exe

GIF

gif

HTML

htm(l)

JPEG

Jpg, jpeg2000

Latex

ltx

Macromedia Flash

swf

MP3

mp3

MPEG

mpg

MS Excel

xls

MS Powerpoint

ppt, pps

MS Word

Doc, docx

Portable Document Format

pdf

Plain Text

txt

Postscript

ps

QuarkExpress

qxd

Quicktime

mov

Rich Text Format

rtf

TIFF

tif

WAVE

wav

WordPerfect

wp, wpd

OpenDocument formaten

odt, odp, ods