Child pages
  • Decisions from meetings
Skip to end of metadata
Go to start of metadata


On this page one can find formal decisions that have been made by the Management and Technical groups. The information below is extracted from the minutes of these community meetings. One can find the minutes on the restricted community site www.surfgroepen.nl/sites/SURFshare .

The Decision working groups get advice from the working groups. On this wiki you can find information about the advice-decision workflow. More information about these workgroups can be found on the Organisations page. Contact information about these workgroups can be found and filtered on www.surfgroepen.nl/sites/SURFshare/Lists/Contacts

The list below is in reverse chronological order. The oldest decisions at the bottom, the newest descisions at the top.

WISH (eerder: WW)
Workgroup Implementation SHare

WRM (eerder: KANO)
Workgroup Repository Managers

Werkgroep Repositories HBO

21 januari 2010* Voortaan wordt MODS 3.2 of 3.3 gebruikt. In Use of MODS wordt 3.3 aangegeven

 

 

9 juli 2009

Usage Statistics

  • Mededeling: Van start gegaan
  • Doel: pilot opzetten waarin de mogelijkheid wordt onderzocht om te harvesten uit verschillende repositories
  • Planning: In oktober een mock-up
    In november een werkende demo
    In mei projectafronding

    DRIVER
  • WISH staat positief tegenover aansluiting aan DRIVER guidelines.

    Wiki
  • Wiki staat online
  • Doel: op een plek alle afspraken van de afgelopen jaren uit DARE en SHARE presenteren
  • Wiki pagina geeft mogelijkheid tot aanpassen, de PDF versie bevat de vastgelegde afspraken
  • Besluit: Werkgroepen zullen controle van specifieke wikipagina's op zich nemen
  • Wijzigingen op de wiki zullen worden besproken in werkgroep vergaderingen

 

 

 

14 mei 2009 (concept)

  • TUDelft heeft Fedora in gebruik genomen als repository. TUDelft heeft zelf een Open Source schil bovenop Fedora gebouwd. Voor de HBO community heeft SURF Sharekit laten bouwen als schil op Fedora.
  • Open Access: aan alle WRM leden om bij de eigen instelling onderzoekers te benaderen met het verzoek deel te nemen aan deze pilotgroep.
  • WP6: Widget wedstrijd loopt, nog niet veel respons

 

23 april 2009

  • Besluit: "other" wordt als type toe gevoegd aan de Publicatie typen lijst.
  • Besluit: Publicatie typen lijst is goedgekeurd
  • Besluit: Copyright schema en extension is goedgekeurd
  • Besluit: MODS en DIDL kunnen onafhankelijk bestaan, echter in WISH verband blijft het besluit dat MODS in DIDL wordt geplaatst.
  • Besluit: voorbeeld wordt aangepast naar de normale Nederlandse situatie.
  • Besluit: MODS is goedgekeurd met de aanpassingen
  • Besluit: DIDL 3.0 document is goedgekeurd
  • Besluit: De sets hoeven niet worden geïmplementeerd, maar dan moet wel de nieuwe nl_didl 3.0 zijn eïmplementeerd waar de access rights worden afgehandeld. (Geef deze overgang wel door aan de KNAW en de KB.)
  • Besluit: Meld classificatie schema's aan aan Thomas Place, deze worden in de Info:eu-repo namespace geplaatst.
  • De tender projecten gaan samenwerken met de werkgroep metadata om gezamelijke issues op te lossen.

 

 

22 januari 2009

  • Besluit: metadata prefix: NL_DIDL
  • Actie Standaarden werkgroep: Namespace gebruiken om de versies aan te duiden: DIDL 2.3 en MODS 1.0
  • Besluit: DC mag in DIDL blijven.
  • Besluit: Samenvoegen metadata en complexe objecten werkgroep
  • Samenvoegen metadata en complexe objecten werkgroep:Besluit: Renze heeft het voorstel met Thomas Place besproken. Thomas had geen bezwaar, en bij de WISH is het ook geen bezwaar gebleken.

13 januari 2009 (concept)
UKB benchmarking

  • Henk Voorbij licht toe dat UKB wil inventariseren wat de totale output is per instelling, welk deel daarvan in Metis is opgenomen en welk deel van die Metis-beschrijvingen weer in de repository is terug te vinden. Een voorlopige analyse heeft geleid tot onbruikbare cijfers
  • Veel materiaal voor de benchmarking is al beschikbaar. Gewezen wordt op de informatie die uit NARCIS is te destilleren en op de door VSNU gemaakte overzichten van wetenschappelijke output. Dit is een betrouwbaarder bron voor de totale output dan Metis.


    Open Access
  • 4 zwaartepunten:
    • Vergroten van betrokkenheid (communicatie werkgroep)
    • Beleidsontwikkeling met betrekking tot OA en repositories
    • Auteursrechten en Licenties
    • Workflow
  • Kern is dat het belangrijk is om allereerst te zorgen dat materiaal in de repository terechtkomt. Daarna moet geregeld worden dat dat materiaal zo veel mogelijk OA beschikbaar wordt.


    DAI
  • Ontdubbeling is een organisatorische zaak. Het zou profijtelijk kunnen zijn de controle over Metis in handen van de bibliotheek te leggen.


    MODS
  • Er zijn de nodige problemen gekoppeld aan de introductie van MODS:
    • Het rechtenbeheer gaat verloren (je kunt niet meer zien wie de copyright owner is)
    • Het gebruik van de richtlijnen voor Conference Report en Conference Paper strookt niet bij de DRIVER Guidelines en de voorgenomen vereenvoudiging van dit type in Metis. Zowel DRIVER als (in zeer nabije toekomst) Metis geven één type voor alle aan een conferentie gerelateerde output. MODS splitst de conference reports en conference papers.
      • Als oplossing voor deze problematiek is te denken aan het inrichten van vocabularies en ontologies
    • Nagekomen: Vandaag (14 januari) werd op de KNAW ontdekt dat het type 'book review' (review in DRIVER) niet wordt ondersteund in de MODS richtlijnen. Daardoor wordt mapping van DC naar MODS en van MODS naar DRIVER extra lastig.

 

18 september 2008

SURFfoundation zal zich gaan inzetten bij PEER

DAI

  • Het is goed mogelijk om met een script foutief ingevoerde DAI's te controleren


    MODS implementatie
  • Vorige afspraak was 1 okt validatie rond; en 1 nov zouden instellingen hebben geimplementeerd. De KNAW heeft aangegeven in de WRM dat de planning zoals voorgesteld met en door de WISH voor hen niet haalbaar is. Twee maanden later, 1 dec, i.p.v. 1 okt. is wel haalbaar. Dat betekent dat de instellingen 1 januari 2009 klaar moeten zijn.

18 september 2008

Opnemen bibliographic only records in NARCIS

  • de bibliographic records van de Keurlingen blijven ook na 2008 via NARCIS toegankelijk.
  • Kwaliteit van metadata in Metis op dit moment niet voldoende
    • Komt omdat dit niet door bibliotheektechnisch geschoolde mensen wordt ingevoerd
    • Gevolg is dat algemeen harvesten van records nu niet mogelijk is. Daarnaast vraagt met harvesten van die records uit Metis ook aanpassingen in Metis zelf.
  • De KNAW dringt wel aan dat de bib only records wel voorzien zijn van ten minste 1 auteur met een DAI.

 

5 juni 2008
Mods

  • 1 juli zal de publicatietypen-lijst zijn goedgekeurd
  • 1 nov. 08 is MODS geimplementeerd en gevalideerd bij alle organisaties (m.u.v. Uni. Maastricht). Dit betekent dat de KNAW per 1-10-08 haar programmatuur (validatie) moet hebben aangepast zodat tussen 1-10 en 1-11-08 iedereen kan valideren.

18 juni 2008
Open Access

  • Afgesproken wordt om locale bewustwordings- en PR presentaties te delen op de SURFshare community onder 'SHAREd documents'.
  • Besproken ideeën
    • Nationale OA uitgeverij
    • Werkbaar business model voor borging OA-projecten
    • Inzichtelijk maken voor wie OA nuttig is
    • Mogelijkheden die OA biedt voor open computation inzichtelijk maken

      Driver
  • Afgesproken wordt dat iedereen feedback levert op DRIVER guidelines aan Maurice en Gera


    DAI
  • Afgesproken wordt dat de problemen die opkomen tijdens de validatie worden doorgespeeld door Elly Dijk naar de werkgroep metadata.

 

6 maart 2008

  • Door alle instellingen is de DIDL2.3 ingevoerd, mini-MODS en PID. DAI blijft een hot issue.


    Beperkingen DAI

    # Limited view:
    * Het lijkt erop dat wanneer je geen Pica instelling bent, Metis per default een beperkte view op de NTA.
  • Handmatige matching kan zeer moeilijk plaatsvinden door de beperkte gegevens die gebruikt mogen worden om te matchen.
  • Er zijn te weinig human resources om de moeilijke auteurs te matchen. Veel tijd gaat zitten in het onderzoeken of die persoon nou echt is wie die is.
    # Unverified insertion:
    * Handmatige invoer maakt het mogelijk dat nieuwe auteurs kunnen worden ingevoegd in de NTA. Als dit niet goed wordt gedaan wordt de NTA onzuiver.
  • Vanuit Metis kun je een auteur die nog geen DAI heeft een DAI geven. In Metis wordt contact gemaakt met de NTA interface. Bestaat deze persoon niet, dan worden de Metis gegevens geexporteerd en in de NTA geplaatst, de NTA voegt er een DAI aan toe en stuurt de DAI weer naar Metis. Bestaat deze persoon wel in de NTA, dan wordt er vanuit de NTA een aantal opties gegevens, de metis medewerker kan dan kiezen welke persoon (incl DAI) in Metis kan worden ingevoegd.
    # Ambiguous data:
    * De kwaliteit wordt NIET gewaarborgd door PICA
  • Door (bulk) invoer van persoonsgegevens (incl. DAI) dat gedaan wordt door secetaresses is de verwachte kwaliteit lager.
  • Bij de UvA ligt de validatie van deze gegevens in handen van de UB.
  • Een hele actuele vraag: Als er een fout uit de NTA wordt gehaald, hoe krijg je die fout ook uit Metis? (bijv. twee personen met twee DAI's blijken later een zelfde persoon te zijn)
    # Run once:
    * De initiële vulling is gedaan in 2006 / 2007. Hiermee is gemiddeld 60% ontdubbeld.
  • Het is niet nodig om elk jaar deze bulk-methode te draaien.
    # No retrospection:
    * Verrassend positief: Vaak blijkt wel dat retrospectie mogelijk is! Dit is afhankelijk of je de metis nummers van een publicatie ook in de repository hebt opgenomen.
  • Dus: alleen publicaties die ooit in Metis hebben gezeten en nu ook in de repository zitten kunnen heel snel en eenvoudig van een DAI worden voorzien. (behalve de UvA)
  • Wanneer geen metis nummer is geplaatst in de repository, dan kan dit nog vrij eenvoudig worden verwerkt, omdat de karakters in de typische velden vrijwel 1op1 zijn overgenomen.
    # Interface under construction
    * Aan een partij is de interface af, de andere partij moet er nog aan werken
  • Dit is op te lossen door de betrokken partijen met elkaar te laten praten.
    # Metadata quality
    * Een export van naamsgegevens vanuit Metis, om bij de bestaande records te voegen, is niet zondermeer wenselijk. Dit vanwege de effort die gestopt is in het goed noteren van naamsgegevens in de repository, terwijl de naamsgegevens in Metis van lage kwaliteit zijn.
  • Eigenlijk zouden de naamsgegevens van hoge kwaliteit teruggekoppeld moeten worden aan Metis.
  • Het is een synchronisatie kwestie
  • Tot nu toe worden alleen de URL van de publicatie teruggekoppeld naar Metis.
  • Andere oplossing: in Twente laat een faculteit publicaties door de auteurs zelf invoeren in de repository. Dit werkt uitstekend, omdat de auteur er ook een direct belang bij heeft. Er is echter wel een goedkeuringsproces ingesteld (workflow). Een groot nadeel is dat er door de auteurs geen gebruik wordt gemaakt van DAI's.
    # Workflow
    * Dit is nog niet de huidige situatie (behalve voor CWI), maar is wel wenselijk.
  • Omdat nu bij sommige instellingen Metis 1x in het jaar massaal wordt ingevuld. Dat betekent dat repositories 1x per jaar nieuwe DAI's binnen krijgen.
  • Vraag: geeft de wenselijke situatie niet synchronisatieproblemen met metis? (beide systemen mogen DAI's maken, wie is het bronsysteem?)


    Oprichting DAI werkgroep
    Doelstelling:
  • Doelstelling van DAI te bepalen
  • Issues nauwkeurig te identificeren (technisch en organisatorisch)
  • Met oplossingsvoorstellen te komen.


    DARE_DIDL
  • DARE_DIDL wordt niet meer ondersteund vanaf 1 mei 2008.
  • We gaan volledig over op DIDL (v2.3)

 

 

 

16 april 2008

  • Besloten wordt de Keurlingen in deze vorm niet meer te tonen vanaf 1 januari 2009.
  • De full-text items van de Keurlingen blijven natuurlijk bestaan. De afzonderlijke repositories kunnen de volledige output van de Keurlingen natuurlijk wel in de eigen repository (aangeboden op de instituutswebsites) laten staan.

 

17 januari 2008
Voordelen van MODS in de vorm van business cases :

  • Met MODS kunnen er makkelijker OpenURL's worden gemaakt.
  • Federated repositories zijn makkelijker op te zetten.
  • Citatie informatie kan eenvoudiger worden weergegeven.

29 januari 2008

  • WP 6: Besloten is dat SURF een duidelijker meerjarenplanning voor SHARE geven
  • Workflow PM en IR: Afgesproken wordt dat er een workshop in maart zal worden georganiseerd (door SURF) waar alle instellingen de informatiestromen waar we mee te maken hebben bespreken en we met good practices (o.a. van EUR, UT en pilots van UvA) op zoek gaan naar een zo generiek mogelijke workflow met ruimte voor specifieke afgeleiden
  • Driver II: Driver I is afgesloten
  • Driver II: Vooralsnog houden we de DARE guidelines aan, maar willen wel in de pas gaan lopen met de internationale standaard. Een volgende vergadering komt dit terug op de agenda.

 

1 november 2007
Persistent Identifier

  • De locale Identificatie nummers:
    • Gebruik geen bestandsnamen
    • Gebruik geen MD5 hash of GUID's, omdat ze te lang zijn en moeilijk hanteerbaar voor wetenschappers.
    • Database nummer zijn misschien geschikt, maar gebruikt de key-nummers niet rechtstreeks, bij migraties van databases kunnen de nummers veranderen.
    • Moet bruikbaar zijn voor wetenschappers om te gebruiken voor te citeren.
  • Huiswerkopdracht: Wat gebeurt er als je noodgedwongen naar een ander systeem moet overstappen?
  • Planning is aangenomen voor de andere IR's om tussen december en januari de Persistent Identifier in te voeren en in DIDL 2.3 te implementeren.


    Mini-MODS
  • Mini-MODS is goedgekeurd

 

 

13 september 2007

  • DIDL 2.2.2 ook door WISH goedgekeurd
  • Er moet validatie organisatie komen die implementatie van DIDL controleert. Geopperd zijn KB of KNAW.
  • Voor DIDL 2.3 moet Persistent Identifier beter worden uitgewerkt, vraag is of nu een PI wel duurzaam genoeg is
  • Goedgekeurd dat DAI naar DARE gaat
  • Alle planningen zijn aangenomen door de WISH, m.u.v. de PI planning omdat deze nog niet door de WISH is bekeken.


    Werkgroep Metadata
  • Gezien de eenvoud van mini-MODS is besloten mini-MODS eerder in te voeren dan volgens planning (dit i.v.m. aansluiting op planning DAI)

11 september 2007

  • Voor WP4 hbo kennisdisseminatie wordt een repository dienst op basis van Fedora ontwikkeld door APS IT diensten, in opdracht van SURFfoundation.
  • workflow/organisatie problemen rondom invoer in Metis/repositories en koppeling met andere systemen.Voorgesteld wordt om de protocollen van de verschillende systemen goed te definiëren, open protocollen te gebuiken en het Pica-systeem open te breken zodat meerdere systemen (bijv. IR's) toegang kunnen krijgen (en niet alleen Metis).
  • Vraag: wat is leidend, Metis of IR? Afgesproken wordt dat lokaal de organisatie wordt bekeken en dit onderwerp volgende keer op de WRM agenda komt, waarbij iedereen zich heeft voorbereid. Ook wordt het voorgelegd aan de Beleidsgroep Innovatie Kennisinfrastructuur (BIK).Daarnaast is het nodig dat de Metis-mensen goed worden geïnformeerd over de voordelen van de DAI.

 

26 april 2007
Wekgroep Persistent Identifier

  • Akkoord over lijn van het voorstel
  • Uitvoering gebeurt in twee fasen: een pilot traject en een uitrol op basis van best practices


    Werkgroep Complexe Objecten
  • DIDL versie 2.2.2 goedgekeurd

 

 

22 maart 2007

  • Afspraak: De WW vinden het MODS voorstel in Metadata 3.0 een goed voorstel. De opdracht aan De werkgroep metadata wordt gegeven om dit verder uit te werken voor implementatie voor de verschillende systemen.

    Reminders Metadata werkgroep
  • Er zullen richtlijnen ontwikkeld moeten worden waar je minimaal aan moet voldoen. Dit is onafhankelijk van wat een repository systeem in de praktijk aan kan.
  • Dspace systeem kan de hiërarchische structuur van MODS niet aan. Wel zijn er Dspace systemen die hier iets voor bedacht hebben (in Parijs?).
  • Voor Repositories: ze hebben een intern metadata beheer die onafhankelijk is van MODS, echter moet de interne structuur van de juiste granulariteit zijn om MODS output te bieden.
  • MODS is naar verwachting te beperkt om gebruikt te kunnen worden voor het beschrijven van andere typen informatie andere dan publicaties.
  • Vocabulaires moeten niet worden beschreven via een namespace in een authority attribuut. Vocabulaires moeten worden afgedwongen, en verwezen worden naar een schema met een enumerator via een namespace in XML structuur. Op deze manier wordt exact verteld hoe deze vocabulaire eruit gaat zien.

    Werkgroep Complexe objecten
  • XML container heet op verzoek nu DIDL document.


    Werkgroep Synchronisatie
  • De metis export functie is geregeld via XML. De import functie is alleen nog voor de URL van het object, dwz METIS kan een URL en het ID van het object in de repository importeren.

 

 

 

7 september 2006
DAI uitrol
Target: zoveel mogelijk actieve wetenschappers in METIS van een DAI voorzien.
Afgesproken wordt om de planning te laten, maar de target omlaag te halen: niet 100% maar 80% van de in Metis geregistreerde auteurs van een DAI-nummers voorzien.

PDF's op andere lokaties dan in eigen repository
Afgesproken wordt dat publicaties van eigen auteurs, naar de eigen repository worden gehaald. Externe links naar andere repositories gelden niet als object in repository cq. DAREnet.

Full text indexing
Afgesproken wordt om voorlopig af te zien van de inbouw van FTI. Nieuwe metadata records worden zoveel mogelijk aangevuld met een abstract.

 

29 augustus 2006
XML container schema locatie
De XSD file van Frank Waaien wordt geplaatst bij de KNAW.

Metadata v2.0 addendum afspraken

  • Dat alle bibliografische referenties in dc:source geplaatst moeten worden; de jump-off page en URL van het digitale object worden in dc:identifier geplaatst
  • Dat iedereen deze afspraak z.s.m. in zijn metadata doorvoert en zodra gereed dit aan KB meldt
  • Dat Martin Slabbertje z.s.m. een aangepaste versie van het addendum verspreid


    Selecties o.b.v. DAI
    Selcties worden gemaakt vanuit IR's of DAREnet, niet vanuit PICA

 

 

6 juli 2006
Metadata
KB geeft aan dat voor 3 velden een uniforme aanpak noodzakelijk is: source, relation en identifier. De DARE metadata richtlijnen versie 2.0 laten te veel ruimte en het gevolg is dat instellingen voor deze velden verschillende dingen aanleveren. Voor het E-Depot is dat niet acceptabel.

Planmatig invoeren van Updates
Besloten wordt dat er 2 maal per jaar een gecontroleerde uitrol van een nieuwe versie / aanpak verschijnt van metadata, XML container, OAI-PMH gebruik.

DIDL afspraken structuur complexe objecten

  • Korte termijn: indien sprake is van meerdere losse objectfiles, levert de IR deze in de juiste volgorde aan in de XML container (juiste volgorde: zoals bedoeld door de maker, leesvolgorde).
  • Langere termijn: er wordt een proef uitgevoerd waarbij de KB voorstellen worden toegepast op proefschriften. Hierin wordt gekeken naar technische haalbaarheid, effecten op workflow en overige impact, bijv. op de kosten. De bevindingen worden daarom ook naar KANO rapporteerd.


    XML container afspraken
    Als de naamgeving van de items 'Metadata', 'Jump-off page' en 'Objects' eenduidig is, en dat wordt met dit voorstel bereikt, dan mag je items <Item> weglaten.

 

 

30 mei 2006
Metadata
Versie 2.1 is ooit gemaakt maar geen verplichte standaard.

Afspraken KANO 4 april

  • Proefschriften worden voor Promise via dc:type als doctoral thesis gecodeerd
  • PDF's worden verwerkt zoals door auteur aangeboden; geen samenvoegen of knippen
  • Publicaties onder embargo worden niet aan DAREnet aangeboden
  • Vanuit DAREnet wordt gelinkt naar de jump-off page


    Ivm XML container afgesproken
  • Dat alle IR's de prefix dare-didl zullen gebruiken
  • Dat de name space declaratie volgens de XML standaard moet lopen
  • Dat alle IR's voor einde juni de specs 1.1.1 ingevoerd zullen hebben

31 mei 2006
Publicaties vs. Locaties

  • Afspraak: SURF gaat na of het mogelijk is een qualifier te gebruiken die aangeeft binnen welke instelling een publicatie tot stand gekomen is.
  • Afspraak: In het geval van verhuizingen van een onderzoeker naar een andere instelling, dan verhuizen zijn publicaties en objecten NIET mee. Als een object is geproduceerd door meerdere auteurs van meerdere instellingen, dan valt aan verdubbeling van het object in DAREnet niet te ontkomen.


    IEEE donkergroen uitgeverij = publisher's version
    Voor zo'n type uitgeverij moet je juist de publisher's version van een publicatie in de repository plaatsen.

    honDAREdduizend materiaal
    Alleen materiaal dat wordt opgenomen in het wetenschappelijk jaarverslag wordt meegenomen in de telling van honDAREdduizend.

 

28 maart 2006
Afspraak over Repository gebruik:
Vanaf 1 mei worden elke maand gebruikscijfers opgestuurd naar SURF/Maurice

WW zelf-evaluatie:

  • De rol van de WW groep kan niet door KANO worden overgenomen
  • Sommige thema's dienen in aparte ad hoc werkgroepen uitgewerkt te worden (vooral de technische strategie voor de langere termijn)
  • De besluitvorming over implementatie en planning moet verbeterd en verhelderd worden
  • Naar aanleiding hiervan worden de volgende verbeteringen besproken:
    • Overleg WW groep en Dspace groep zo veel mogelijk op dezelfde dag plannen (reduceert reistijd)
    • Betere taakverdeling nastreven tussen KANO en WW groep om dubbel werk te voorkomen
    • KANO zou advies moeten vragen aan WW over technische zaken en niet zelf de oplossing bedenken
    • Verder wordt geopperd dat het samenvoegen van WW en KANO, aangevuld met losse tehmatische werkgroepen, onderzocht moet worden

5 april 2006
Promise of Science

  • Promotiereglementen kunnen beschikbaar worden gemaakt op de Nationale Proefschriftensite
  • DC:type afspraakVoor de aanlevering aan DAREnet (harvesting) moet er voor proefschriften/disseraties aangeleverd worden het dc:type 'Doctoral thesis'.Het is verder aan de instelling zelf om te bepalen hoe lokaal proefschriften/dissertatie in het IR wordt opgeslagen. De overige categorieën die voor scripties worden gebruikt, zijn:
    • Bachelor thesis;
    • Master thesis;
    • Student thesis, voor theses van vóór de BaMa-structuur.
  • Grote PDF's Voorstel is om zowel een totaal PDF als opgeknipt per hoofdstuk aan te bieden. Afgesproken wordt dat er geen dwingende afspraak wordt gemaakt. Zoals de auteur het aanlevert wordt het aangeboden, zonder verdere knip- of plakacties van de UB.
  • Embargo'sAfspraak: Publicaties onder embargo worden NIET aangeboden aan de DAREnet harvester.(Overigens zal in werkgroep metadata onderzocht worden in hoeverre een date-veld (bijv. date.published of date.embargo) gebruikt kan worden om in DAREnet alleen publicaties te presenteren waarvan de emargo-release datum verstreken is.)
  • Jump-off pageVanuit DAREnet wordt er normaal gelinkt naar de jump-off page. Als de repository geen jump-off page heeft, dan wordt er direct doorgelinkt naar het object.
  • Sets Voor alle duidelijkheid, het gaat om één set voor DAREnet en één set voor Keur.



  • WW vs KANOWW club blijft bestaan met technisch hoog niveau. WW club bereidt een keuze voor. In het KANO overleg worden de beslissingen gemaakt.

 

 

24 januari 2006

  • Scripties worden wel door DAREnet geharvest, maar tellen niet mee voor honDAREdduizend
  • Afgesproken is dat er 1 (één) DAREnet set moet komen. En één voor KEUR

 

 

15 november 2005

  • Afgesproken is om actief melding te maken van storingen, reacties, klachten, etc. aan SURF
  • Documenten onder embargo tellen wel mee voor het honDAREdduizend project
  • Embargo periode is maximaal 6 maanden
  • Embargo veralt automatisch na deze embargo periode


    HonDAREdduizend
  • Afgeleide doelstelling 2: 'aantoonbaar structureel inbedden en de daarbij behorende workflow binnen de instellingen'
  • 2.1: scripties tellen niet mee. Het is lokaal beleid of men scripties opneemt in de IR, DAREnet zal ze niet harvesten.
  • Met de XML-container kan de service provider de jump-off page negeren
  • Uitbetaling volgt wanneer de target gehaald is


    DAREnet en repositories
    Duidelijkheid overlap DARE / KEUR set
    Voor alle helderheid wordt (nogmaals) afgesproken dat wanneer iets openbaar toegankelijk is, via een object in de IR of via een open link (zoals de Springerlinks in Keur) het dan wordt opgenomen in DAREnet. Lokaal moet gezorgd worden dat alle open access objecten in de DARE-set zitten en dus geharvest worden door DAREnet. De XML-container lost dit niet op.
    Waar nodig dit op orde brengen. Half januari zal DAREnet een compleet nieuwe harvest uitvoeren.

    df

    22,853
    22,860


    16,771
    DAREnet bevat alleen open toegankelijke objecten.
    Keur bevat (als enige uitzondering) ook alleen metadata voor de compleetheid van de publicatielijsten.
    Bijgevoegd ook het verhaal van Henk Ellermann 'Het gebruik van OAI-PMH Sets voor het keur der wetenschap' (ook te vinden op de DARE community site) met initiële afspraken.

    Metadata
    Belangrijk is de controle op dc.type: neem de letterlijke tekst over uit de 'DARE use of Dublin Core, version 2.0'.

    Deletes
    Het protocol bevat een (optionele) voorziening om deletes te ondersteunen.
    Afspraak: alle DARE instellingen zullen dit inbouwen en operationeel hebben per 15/01/2006.

    Publicaties vs. Locaties
    Het is van groot belang hier instellingsoverstijgende afspraken over te maken. (DAI en DOI)

    Vindbaarheid van repositories voor search engines:
    Het is een lokale actie

 

1 september 2005

  • Metadatakwaliteit is belangrijker dan architectuur
  • OAI-PMH = een SOA
  • OAI-identifier niet verplicht, maar wel pesistent aanbieden
  • 'Deleted record' optie overal gelijk
  • 'Object file by reference' wordt toegepast om het object bestand op te halen
  • UB's geven door hoe hun Springer artikelen herkenbaar zijn
  • UB's schonen links met sessie ID's op
  • SURFnet maakt een usability study voor 01/11/05 uit
  • E-Depot wordt harvestable

 

 

Workshop 05/06
Tijdschrift artikelen (korte termijn oplossing)
qdc                               oai_dc                Content elements
                                     Dc:title
                                     Dc:creator
<dcterms:                      Dc:date               Date issued*

dateIssued>
                                     Dc:relation           Issn**
<dc terms:                     Dc:identifier         Tijdschrifttitel**,

bibliographicCitation                                  volume (issue)*,
                                                               Eerste pagina*,
                                                               Laatste pagina
                                     dc:identifier          Open URL versie 1.0
                                     Dc:source


*mandatory content elements
**Use at least one of the content elements

  • 1 DC identifier = 1 objectfile = locator
  • >1 objectfile = jump-off-page verplicht
  • Uniformeren jump-off-page
  • XML container met eigenschappen: MIME type, Full text referentie, creation date
  • T.b.v. preservering, en fulltext indexing is het geoorloofd de fulltext URL mee te geven

 

 

 

30 augustus 2005
Afspraak: alle instellingen doen mee met het DAI-project. Hoe de uitrol zal gebeuren wordt nog gespecificeerd. SURF zal dit coördineren, verder is het een decentraal project.

DARE 2005/2006 (incl. 'Optimisation')

Er is binnen de DARE community consensus over:

  • Ja, we willen een DARE2 programma
  • Ja, we wllen een aansprekende slotactie DARE1
  • Ja, we willen optimalisatie van infrastructuur, met name voor koppeling Metis - IR


    Stand van discussie
  • Er is nog geen consensus over de slotactie
  • Ideeën voor een aansprekende slotactie
    • Project "alle hoogleraren"
    • Project "alles van een discipline"
    • Project "alles van een thema"
    • Project "promovendi vanaf 2000"


      Overwegingen
  • Standpunt Platformbestuur ICT & Onderzoek
    • Volume is erg belangrijk
    • In/externe bereidheid om in een DARE II te investeren hangt samen met ambitie
  • DARE gaat zeer waarschijnlijk meedoen in een Europees project (DRIVER) waarbij accent ligt op infratstructuur en niet op content


    Voorstel
  • SURF/DARE levert een maximale bijdrage aan optimalisatie
  • Volume-project zonder retro: alleen digitaal, openbaar beschikbaar materiaal.Iedere instelling kan eigen invulling geven
  • Deelnemen aan DRIVER vanaf april 2006


    Afgesproken is dat:
  • 100.000 objecten is de target. Er zal een verdeelsleutel worden opgesteld. Actualiteit is een leidend principe en belangrijker dan retro.
  • Wat andere objecten dan publicaties betreft, geldt: doen wat we kunnen doen maar er worden geen harde afspraken gemaakt. Maar beperk je niet alleen tot gepubliceerde artikelen in PDF. Op die manier wordt de target nog realistischer.
  • Meer focus op het volume project:
    • Promise of Science; zo veel mogelijk alles wat digitaal beschikbaar is en openbaar van promovendi (dus niet alleen dissertaties, maar ook datasets, artikelen, etc.) vanaf 2000. Iedereen is akkoord met dit gemeenschappelijke doel.
    • Discipline-project: optioneel. Voorstellen met elkaar delen via de DARE community site (discussie: DARE 2005/2006: discipline vulling). Pas als er meerdere instellingen samenwerken is er grond om te kijken of en zo ja wat voor rol er voor SURF is.
    • Beperkte hoogleraren insteek: bijv. eProfs medici. Via de DARE community site zal dit nog verder worden bediscussieerd (discussie: DARE 2005/2006: eProfs). Afhankelijk van gezamenlijke steun wordt dit wel of niet meegenomen


      Akkoord wordt gegaan met de volgende projecten:
      Project 1: DAI: is al gestart
      Project 2: Development of tools (middleware): verder bespreken op een aparte studiedag, begin oktober, om helder te krijgen wat de stand van zaken is bij de instellingen en of er behoefte is het project op te pakken.
      Project 3: persistent identifier: ook bespreken op aparte studiedag.
      Project 4: a) improved DARE-Metis interfacing en b) user interfacing: oppakken.
      Project 5: Redesign of architecture and workflow analysis: ook bespreken op aparte studiedag.
      Project 6: DIDL: oppakken voor de proefschriften, verdere toepassing komt in DARE II.

 

 

21 juni 2005
Afspraken over het vervolg van Keur der Wetenschap:

  • Nieuwe keurlingen kunnen worden toegevoegd als er een (formeel) verzoek ligt op faculteitsniveau. Het moet 'keur' blijven.
  • Nieuwe producties van huidige keurlingen moeten in ieder geval worden toegevoegd.


    Springer link:
    Afgesproken was dat er gelinkt kan worden naar de Springer-versie met off-campus access. Hiervoor blijkt het nodig een easy-proxy te installeren.

    Mutaties en deletes:
    Als datestamp niet verandert dan komt het record niet mee in de harvest. Controleer met je Willie Wortel of je OAI-compatible bent op dit punt.

 

 

4 april 2005
De volgende afspraken zijn gemaakt:

  • Bibliotheken sturen de twee base URL's voor resp. de DAREset en de Keurset deze week op naar erik@cq2.nl
  • Bibliotheken testen zelf de output van hun IR met de hiervoor beschreven OAI explorer en de status button
  • Bibliotheken verbeteren de beschikbaarheid van hun IR systeem voor de harvester

 

 

3 maart 2005
Architectuur
Metadatering van tijdschriften wordt verwerkt in DC v2.1
Ophalen objectfile via XML container
Complexe document structurenm waarschijnlijk in DIDL Persistent Identifier, nog veel discussie.

DAREnet2
Besloten is SSE en SURFnet omgeving te gebruiken voor DAREnet.
Doel, Doelgroep & functionaliteiten volgen later.

Keur der wetenschap
Keur-auteur presentatie op DAREnet.
Iedere Keur-wetenschapper krijgt een eigen 'etalage' met een foto, basis informatie over zijn/haar aanstelling en vakgebied, waar mogelijk een link naar de eigen website en indeling in één of meer van de NOD-discipline categorieën. Deze informatie dient aangeleverd te worden zowel in het Nederlands als Engels.
Scanning
Scanning bij Strata zal greyscale PDF's (en de vuile OCR) opleveren. De zelf-scanners hanteren ook deze kwaliteit. 300 dpi. Bij CWI, ivm wiskundige formules, wordt 600 dpi aangehouden.

Rondvraag
DC is niet slecht maar te mager. Belangrijk is nationale monitoring bij uitbouw hiervan, voordat er verschillende individuele projecten starten.

 

16 december 2004
Afgesproken wordt:

  • Bibliotheken implementeren versie 2 zo snel mogelijk; uiterste datum is 28-02-2005
  • Zodra versie 2 wordt ondersteunt stuurt de bibliotheek een e-mail naar Arjan Hogenaar met cc naar Annemiek en Mirella
  • Na ontvangst van deze mail en na test zal KNAW/NIWI de indexen van de betreffende bibliotheek in DAREnet verwijderen en de IR compleet opnieuw harvesten; eerst de DAREnet set, daarna de Keurset
  • Elke bibliotheek ondersteunt de metadata prefix ter onderscheiding van simple en qualified DC; dit is noodzakelijk omdat met versie 2 QDC optioneel is toegestaan


    Postprints
    Na enig overleg wordt besloten het oorspronkelijke voorstel van Martin, zoals verwoord in zijn e-mail van 15 november, vast te stellen als richtlijn voor de postprints. Afspraak: Marlon zal dit verwerken in de metadata richtlijnen van DARE. De publicatie van een (update)versie van de richtlijnen (dan versie 2.1 geheten) waarin de afspraak over postprints is opgenomen zal in januari of februari plaatsvinden. Mogelijk kunnen daar in dan ook de dan officieel vastgestelde rights richtlijnen opgenomen worden.

    Metadata & KB
    De KB zal bij deponering in de E-Depot syntactische en semantische checks doen op de metadata. Voor de inhoud is echter de dataprovider verantwoordelijk. In het overleg met de pilot bibliotheken voor het E-Depot (diezelfde middag) zal gesproken worden over minimum eisen metadata voor E-Depot.

13 januari 2005

  • Besloten is om met Google Scholar direct contact op te nemen voor het 'Googlebaar' maken van DAREnet.
  • Besloten is dat DAREnet een langer leven is beschoren dan de demo. Er wordt gewerkt aan meer robuustheid, o.a. i.s.m. SURFnet.
  • Besloten is om te werken aan 'DARE Use of DC' v2.1 vanwege fouten in v2.0
  • Keur der wetenschap: Besloten is om meer tijd en energie te stoppen in de kwaliteit van metadata, ipv kwantiteit. Aandacht eerst op metadata, dan pas op scannen. Er is geen DARE budget voor ondersteuning van >10 keurlingen. Ondersteuning bestaat uit scannen, niet metadatering.
  • Besloten is dat kwaliteit van de metadata de verantwoording is van iedere instelling zelf!
  • Onderzoek wijst uit dat de database van Metis moet veranderen van Oracle naar 'OpenSource'.
  • Het standaard schema van DCMI (XML QDC) is te vinden op de DCMI website.

 

21 oktober 2004
Keur der wetenschap
Bedoeld is dat de B-set het complete IR bestand omvat. In die zin is het de gehele verzameling en dus geen deelverzameling, en dus geen set. De inhoud van de gehele repository (in de sheets dus B-set genoemd) is vrij en onderhevig aan lokale afspraken en richtlijnen. DARE schrijft hierin niets voor. De inhoud van de A-set is wel binnen DARE afgesproken.
Het is niet de bedoeling om metadata ("vlaggetjes" of andere markeringen) te gaan gebruiken om Keur materiaal apart te onderscheiden binnen de A-set. Keur materiaal is gewoon onderdeel van de A-set zonder aparte markering. Op DAREnet niveau (de service provider in OAI termen) zal een aparte etalage worden gemaakt van Keur.
De A-set dient ook te bevatten de metadata records van Keur, zowel de records met een objectfile als de records zonder objectfile. Deze aanvulling i.v.m. de afspraak die de Ankerpunten hebben gemaakt om voor Keur metadata toe te staan zonder objectfiles.

Afgesproken wordt dat deze set definitie per 01/01/2005 zal gaan gelden (zoals reeds eerder afgesproken).

Metadata
Na inventarisatie van de belangrijkste openstaande punten ontstaan de volgende afspraken:

Vulling van dc:identifier

  • 1 objectfile: plaats in dc:identifier URL van objectfile OF de URL van jump-off page
  • >1 objectfile: plaats in dc:identifier URL van jump-off page


    Vulling van dc:format
  • Plaats in dc:format de info over applicatie en filetype. Neem geen URL op (oude afspraak vervalt)


    Auteursversie apart aangeven ja/nee
  • Als sprake is van een auteursversie wordt dit niet aangegeven


    Codering van open access of toll gate access ja/nee
  • Geen codering gebruiken voor onderscheid toll gate versus open access

4 november 2004
Auteursrecht antwoorden op vragen van keurlingen:
Wanneer een wetenschapper vraagt het copyright uit te zoeken en daar waar nodig toestemming van de uitgever te vragen geldt het volgende:

  • T/m 1997 ligt het copyright voor de digitale (gescande) versie bij de auteur zelf; toestemming van de uitgever is dus NIET nodig. In NL zit er geen auteursrecht op de lay-out van de uitgever. Juridische tekst hierover zal worden toegestuurd. Populaire versie is nog in de maak.
  • Na 1997 gelden verschillende: regels bij verschillende uitgevers
    • sommige uitgevers vinden pre-prints opnemen geen probleem,
    • soms kan de auteursversie (goedgekeurde versie) worden gebruikt
    • en soms kan gebruik gemaakt worden van de xml- of html-versie van de versie van de uitgever, maar niet de pdf.

      Keuze hoe om te gaan met het copyright ligt bij de Ankerpunten.

      Harvesten/sets




      E-depot Link
      Besloten is een koppeling naar het E-Depot voor allemaal te realiseren, met als 'tussenstap' Keur der wetenschap, en pas in tweede termijn de retourkoppeling aan te pakken.

      DAREnet & zichtbaarheid
      Afgesproken is dat het beleid wordt "Hoe meer zichtbaar, hoe beter". DAREnet wordt technisch crawlable gemaakt voor Google. Sirus mag DARE repositories harvesten.

      Wijzigingen Metadata guidelines v2.0:
      URL naar digitaal object verhuist van dc.format naar dc.identifier.
      Wanneer het om meerdere digitale objecten gaat, dan wordt er gelinkt naar de jump-off page. En de review status vervalt.

 

9 september 2004

  • Voorstel: SURF wordt de opdrachtgever voor de verdere ontwikkeling van Metis
  • Vraag 1: Gaan we QDC verplicht stellen per 01/01/2005?Antwoord: Nee, dat gaan we niet doen. We gaan door met Unqualified DC. Instellingen mogen natuurlijk zelf wel QDC gebruiken naar eigen inzicht. Onderzoek volgt of METS een goede kandidaat kan zijn voor uitwisseling van metadata binnen DARE vanaf eind 2005.
  • Vraag 2: Kunnen we voor DAREnet met sets gaan werken?Antwoord: Ja, per 01/01/2005
  • De DAREnet gebruiker moet via de metadata altijd binnen 1 of 2 klikkeb ij de objectfile komen
    • De objectfile bestaat meestal uit 1 file en dan is een directe link vanuit dc:identifier naar de objectfile mogelijk
    • In andere gevallen bestaat de objectfile uit meerdere losse files, ofwel omdat er meerdere formatversies zijn van dezelfde content, ofwel omdat de content is verdeeld over meerdere files (bij proefschriften gaat het bijna altijd om meerdere PDF's). In deze situatie is geen directe link vanuit dc:identifier naar de objectfile mogelijk
  • Geen consensus over de soort van URI (OpenURL of DOI of iets anders) die in dc:identifier gebruikt zou moeten worden
  • Specificatiedocument data invoer repositories:Eindconclusie is dat de WW groep zich, met enkele aanpassingen, kan vinden in de voorgestelde specificaties en aanpak, met als belangrijkste kanttekening dat men het jammer vindt dat wordt afgezien van synchronisatie
  • Functionaliteit, inhoud en vulling DAREnet 2005Naast de objecten die in DAREnet worden ontsloten kunnen instellingen ook ander materiaal aan de KB aanleveren voor opname in het E-Depot

16 september 2004

  • Besluit bestuur platform ICT en Onderzoek: Contract wordt opgesteld, RU-UCI blijft eigenaar van Metis, SURF neemt regie over
  • Commitment DAREmiles 2004
    # 50% van alle reguliere proefschriften in 2004 in de repository
    # Iedere instelling heeft alle publicaties van keurlingen in repository gezet. Alle publicaties van een keurling, bij niet haalbaar: eerst digitaal materiaal, anders: publicatie van laatste 5 jaar
    # Levering vanuit alle repositories naar het E-Depot van de KB
    * QDC niet verplicht. Documentatie volgt over richtlijnen voor QDC

 

9 juli 2004

  • Interface tussen DARE en Metis kan per instelling zelf worden ingericht
  • Van DARE naar Metis nu ook mogelijk met inlees functie via formaten RIS, DC en QDC
  • In Metis een 'upload-button' voor uploaden naar de IR
  • DIDL/OAX: Drie Tender projecten hebben behoefte aan complexe structuur. Dit wordt teruggekoppeld aan de WW>wg databestanden
  • Metadata : v2.0 zal na aanpassingen worden aangenomen op 01/10/2004
  • SURF adviseert per community/profile een metadatastandaard
  • Beleid over deleten in IR's: niet deleten, maar goed versiebeheer hanterenEvt. wel metadata beschikbaar, niet het object

 

 

 

10 juni 2004

  • Belangrijkste doel van een koppeling tussen DARE en Metis, is het voorkomen van meervoudige invoer van metadata in verschillende systemen
  • Plaatsen van zichtbare mijlpalen voor eind 2004
  • Businessplannen: elke repository maakt een eigen BP
  • Auteursrecht en IR's: Gerards van Westrienen (SURF) maakt een overzicht van (SURF)activiteiten rondom auteursrecht
  • Verslag strategische observaties VS: half juli 2004 zal een verslag verschijnen ter voorbereiding van de workshop Business plannen
  • Metadata: per oktober ook specifieke afspraken over beeldmateriaal
  • Workflow en data invoer: best practices worden bepaald door inventarissen lokale workflow
  • Samenwerking Surfnet: op 2 vlakken; zoekmachine en metadata
  • OAI architectuur: Internationaal draagvlak voor complexe objecten


    Opmerking:
    In de repositories worden alleen documenten ontsloten die ook in het wetenschappelijk jaarverslag v.d. instellingen zitten. Zo wordt minimale kwaliteit gewaarborgd.

 

15 april 2004

  • E-depot: in 2004 de aanleverkant klaar, in de 2005 de terugleverkant
  • Versiebeheer: volgens lokale policies, maar procedures op DARE niveau besproken worden

 

 

3 juni 2004

  • Workflow en data invoer: leden van de WW sturen uiterlijk 20/06/2004 een overzicht van hun data invoer workflow op naar MF
  • Lijst van Directories: leden van de WW sturen uiterlijk 20/06/2004 een overzicht van de websites waar IR's geregistreerd worden
  • Samenwerking DARE-Surfnet voor metadata:Jos en Egin in overleg voor detailafstemming. Egon maakt notitie over samenhang repository metadata en SSE (fast)

 

 

 

18 maart 2004

  • Metadata afspraken > Wwclub
  • Link DARE - status DARE/Metis > Wwclub
  • Workflow > eerst WW dan KANO
  • Lijst van repository directories centraal bijhouden
    • Aanmelden decentraal