Biblioteket kan ge stöd kring datahanteringsplaner, licenser vid öppet tillgängliggörande, val av externt dataarkiv för öppet tillgängliggörande och hitta öppen forskningsdata för återanvändning. Välkommen att kontakta oss!

En datahanteringsplan beskriver hur forskningsdata ska hanteras under ett projekt och vad man planerar att göra med datan efter projekttidens slut.

Datahanteringsplaner kan man upprätta och använda av olika anledningar. Det kan finnas krav från finansiärer, men det kan också underlätta forskningsarbetet eftersom hanteringen av data måste tänkas igenom noga.

Vetenskapsrådet kräver att det upprättas en datahanteringsplan för projekt som beviljas medel från och med 2019 (om DHP, se också de generella bidragsvillkoren). Likaså kräver Formas en datahanteringsplan (se punkt 8). Varken Formas eller VR förespråkar någon specifik mall för planen, utan det centrala är att den beskriver datahanteringen i och efter det aktuella projektet. Kontakta biblioteket för stöd.

 

Vad innehåller en datahanteringsplan?

Malmö universitet har ingen egen datahanteringsplan, och forskningsfinansiärer har alla olika planer. I en datahanteringsplan ingår ofta följande delar:

  • Juridiska och etiska överväganden - Innehåller datan personuppgifter och hur ska dessa i så fall hanteras? Behövs etikprövning? Finns det upphovsrättsliga aspekter att ta hänsyn till?
  • Insamling/produktion av data - Hur ska data samlas in/skapas? Vilken typ av data handlar det om? Finns det data som kan återanvändas?
  • Dokumentation och metadata - Hur ska datan dokumenteras och beskrivas? Finns det någon lämplig metadatastandard som kan användas?
  • Datahantering under projektet - Hur ska datan organiseras? Hur ska man hantera versionering? Var ska datan lagras under projekttiden och hur gör man med backup?
  • Kostnader - Vilka kostnader finns relaterat till datahantering och tillgängliggörande av data? Här bör både personalkostnader och kostnader för hård- och mjukvara tas upp.
  • Långtidsbevarande och arkivering - Vilken data ska arkiveras vid projektslut och vilken kan gallras? I vilket format ska datan arkiveras?
  • Tillgängliggörande av data - Om data ska tillgängliggöras efter projektet, i vilken form och var?
  • Administrativa uppgifter om projektet och dess deltagare.

Att dela eller sprida forskningsdata kan göras på olika sätt. Ofta görs det informellt mellan kollegor eller samarbetspartners. Att tillgängliggöra forskningsdata i dataarkiv (med eller utan restriktioner) gör det möjligt att hitta, återanvända och citera data.  

Fördelar med att lägga sin data i ett dataarkiv

  • Underlättar hanteringen av din data 
  • Möjliggör citering av din data (via unik identifierare, t.ex. DOI) 
  • Gör det lättare för andra att upptäcka din data 
  • Långsiktig bevaring av din data 

Om din data innehåller personuppgifter, och framförallt känsliga personuppgifter, kan det påverka dina möjligheter att tillgängliggöra din data. Se vidare här

Tänk på att dokumentationen bör vara så omfattande att det är möjligt att bedöma och återanvända data. En annan viktig aspekt är filformat. Läsning av data bör om möjligt inte kräva specifik programvara som riskerar att bli inaktuell i framtiden. Likaså är tydlig versionshantering och versionsnumrering viktig om data tillgängliggörs i olika versioner.  

Att tänka på när du väljer dataarkiv 

Fundera på vad du vill uppnå med att tillgängliggöra din data. Har du specifika krav på dig från t.ex. finansiär eller tidskrift? Det kan även vara bra att tänka på följande aspekter: 

Anseende: Har du hört talas om tjänsten förut? Vem står bakom arkivet? Används det ofta och har gott rykte inom ditt fält?  

Synlighet: Tillhandahåller arkivet en DOI (eller motsvarande unik identifierare) så att andra kan citera din data? Kan datan hittas även via t.ex. Google och DataCite?  

Användbarhet: Hur användarvänligt och intuitivt är gränssnittet (både att lägga in och hitta/citera data?   

Funktioner: Kan data från arkivet integreras med tjänster som t.ex. GitHub och Open Science Framework? Är det enkelt att ta fram statistik på hur många gånger din data laddats ner etc?

Rättigheter: Hur ser avtalet mellan mig och arkivet ut? Använder arkivet standardlicenser, som t.ex. Creative Commons, som gör det enkelt för andra att förstå vad de får göra med din data?

 

För tillgängliggörande av forskningsdata rekommenderas någon av nedanstående typer av dataarkiv: 

Ämnesspecifika dataarkiv 

För vissa ämnen finns dedikerade dataarkiv som växt fram ur inomvetenskapliga behov. Exempel är: 

  • CPSR (The Inter-university Consortium for Political and Social Research), ett samhällsvetenskapligt (amerikanskt) dataarkiv.
  • Dryad Digital Repository har ett fokus på biologi och ekologi.  

Nationella dataarkiv 

Svensk Nationell Datatjänst (SND) är ett dataarkiv för tillgängliggörande av forskningsdata inom samhällsvetenskap, humaniora samt medicin och hälsa.  

Våra nordiska grannländer har också nationella dataarkiv, vilka kan vara relevanta för tillgängliggörande i samarbetsprojekt. 

Generella dataarkiv 

Generella dataarkiv tar emot alla typer av data och ämnen. Ofta sker det genom självpublicering och därmed är beskrivningarna ibland väldigt basala (och okontrollerade). Exempel är:

  • Zenodo finansieras av EU och drivs av CERN
  • Figshare drivs av ett brittiskt akademiskt förlag.

Hitta dataarkiv för tillgängliggörande 

Se Använda data för söktjänster och databaser. Vi på biblioteket hjälper gärna till att välja.

Öppna forskningsdata återfinns idag på olika ställen, det kan vara nationella datacenter, institutionella eller ämnesbaserade dataarkiv eller på forskningsprojektens webbplatser. Varken infrastrukturen eller praxis kring hantering är idag fullt utvecklad. Generellt sett hittas data på flera sätt:

  • I den vetenskapliga litteraturen, som citeringar eller andra hänvisningar till dataset, dataarkiv eller databaser. Eller i texten som tabeller och diagram, alternativt som supplement. 
  • På webben, till exempel på webbplatser för forskningsprojekt.
  • I bibliografiska databaser där information om tillgängliggjord forskningsdata från olika källor är sökbar samtidigt. Den viktigaste är Data Citation Index (DCI) som finns tillgänglig via Web of Science-plattformen. Här kan du hitta dataset, datastudier och dataarkiv. Det finns en koppling mellan DCI och Web of Science Core Collection så att man ibland kan länkas mellan dataset och publikationer.
  • I dataarkiv som är specialiserade på tillgängliggörande av forskningsdata, se till exempel

    Svensk Nationell Datatjänsts (SND) katalog. Här kan du hitta svenska dataset inom humaniora, samhällsvetenskap och medicin. 

  • I Re3data kan söka efter fler arkiv med öppen data inom alla forskningsdiscipliner. 

     

Finansiärers krav

Idag, 2018, är det få svenska forskningsfinansiärer som kräver tillgängliggörande av forskningsdata. Men med forskningspropositionen Kunskap i samverkan som bakgrund kommer troligen att fler finansiärer komma med krav eller riktlinjer kring forskningsdata. Krav kan komma röra att data ska tillgängliggöras öppet, men datahanteringsplaner kan också bli ett kommande krav vid ansökningar.

EU:s Horisont 2020 har under 2017 utvidgat kraven kring datahanteringsplaner och tillgängliggörande av forskningsdata (pdf) , se även riktlinjerna för öppen tillgång till publikationer och data inom H2020 (pdf).

Brittiska Digital Curation Center (DCC) har en lista på finansiärer (brittiska samt Horizon2020 och NSF) som kräver datahanteringsplaner. De har också en lista över finansiärer som har data policys.

Tidskrifter krav

Allt fler vetenskapliga tidskrifter ställer krav på att underliggande forskningsdata ska vara tillgänglig, antingen helt öppet eller för peer-reviewers.

I vissa fall ska data tillgängliggöras före ett artikelmanuskript sänds in till tidskriften, se exempelvis Dryads lista över tidskiftskrav inom biologi-medicin.

Även på förlagsnivå så finns policys. Förlagsgruppen Springer-Nature har fyra olika policy-typer, från att datadelning och citering uppmuntras (typ 1) till att det krävs (typ 4), se Research Data Policy Types. Elsevier har en policy som bygger på fem principer, men den är väldigt öppen och kanske mer riktad till deras tidskriftsredaktioner, se Research data.  

Begreppet forskningsdata saknar en entydig definition. Ibland används det för enbart insamlad och analyserad data (källmaterial, empiri), ibland för allt insamlat och skapat material i forskningsprocessen förutom publikationerna som presenterar forskningsresultat. I den breda betydelsen kan enskilda objekt som diagram eller tabeller ses som forskningsdata (och därmed spridas enskilt).

Vad som bör betraktas som forskningsdata är ämnes- och metodberoende. För somliga är begreppet helt naturligt, andra använder källmaterial eller empiri. En del samlar inte in material utan genererar data utifrån beräkningsmodeller, och då bör modellerna ses som forskningsdata då de är utgångspunkten för forskningsresultaten. I bred bemärkelse är data mer än det som samlas in, det kan också vara annan output från forskningsprocessen än rena publikationer, som enskilda illustrationer eller en presentation. Vilken forskningsdata som åsyftas är också otydligt i många sammanhang, det kan röra sig om rådata eller bearbetad data, eller bara det utval av data som ligger till grund för en forskningspublikation.

Öppen forskningsdata är en del av begreppet öppen data, där även t.ex. öppen myndighetsdata ingår. Öppen forskningsdata är också en av pelarna i öppen vetenskap (Open Science).

Varför tillgängliggöra forskningsdata?

Det finns olika argument att motivera att data ska eller bör tillgängliggöras. Vetenskapsrådet motiverar öppen tillgång till forskningsdata i sitt förslag till riktlinjer för öppen tillgång till vetenskaplig information som följer (ur VR:s Förslag till nationella riktlinjer för öppen tillgång till vetenskaplig information):

  • Forskning. Öppen tillgång till forskningsdata kan leda till nya forskningsmöjligheter, särskilt inom tvärvetenskapen. Med öppen tillgång till forskningsdata behöver experiment i vissa fall inte upprepas, utan tidigare resultat kan återanvändas. Data kan också användas inom nya forskningsfält och genom att kombinera olika datamängder kan forskare adressera nya frågeställningar. Vidare underlättas utvecklandet av nya analysmetoder om forskare har tillgång till experimentella data. För dataintensiv forskning (populärt kallat big data) där olika datakällor integreras för att se nya samband är det en förutsättning med tillgång till stora datamängder.
  • Citering. Forskare som återanvänder forskningsdata ska referera till den som ursprungligen tagit fram forskningsdata. Det kan ske genom referens till en publikation som beskriver data eller direkt till datamängden. Öppen tillgång till forskningsdata kan därmed leda till ökat antal citeringar, vilket då blir meriterande för forskargruppen som producerat den. Även flera betydelsefulla tidskrifter ställer kravet på att tillgängliggöra forskningsdata, exempelvis PLOSOne och BioMed Central (förlag). 
  • Demokrati och transparens. Forskningsresultat bekostade av offentliga medel bör av princip vara tillgängliga för medborgarna. Tillgång till de data som använts för att påvisa ett resultat som presenteras i till exempel en artikel är nödvändig för att kontrollera att slutsatserna stämmer.
  • Innovation och användning utanför forskningen. Lättillgänglig data har också potential att kunna användas utanför forskarsamhället till exempel av företag, privatpersoner och andra myndigheter.

Argumentationen är i dagsläget till stor del baserad på den politiska inriktningen mot öppen vetenskap och drivs främst uppifrån. Utvecklingen drivs också av Big Data-trenden där stora datamängder analyseras efter mönster. Formellt sett är det ännu ingen merit att öppet tillgängliggöra forskningsdata varken på Malmö universitet eller nationellt sett. Men det finns vinster för enskilda forskare och forskargrupper, olika incitament är:

  • Direkt nytta
    • för forskningen självt (mer robust)
    • för forskarens karriär (erkännande)
    • för disciplinen (bli klokare)
    • för vetenskapen (bättre vetenskap)
  • Normer i projektet, forskargrupper och/eller disciplinen
  • Yttre drivkrafter: policies och förväntningar från forskningsfinansiärer och förlag

Se rapporten Sowing the seed: Incentives and motivations for sharing research data, a researcher’s perspective (pdf) för en diskussion kring de olika incitamenten baserat på de undersökta forskningsprojekten.