FAIR i forskningen – vad betyder det?
2024-10-01
FAIR är en akronym som bildats av de engelska orden Findable, Accessible, Interoperable och Reusable. Syftet med FAIR-principerna är att göra forskning tillgänglig och användbar för fler. Tanken är att forskningsdata, metoder och outputs ska vara möjliga att söka, hitta och komma åt (findable och accessible). Det innebär också att forskningsdata ska vara möjliga att återanvända, alltså att data är lagrad på ett sådant sätt att det går att öppna och arbeta med den i/med olika system, men även kombineras med dataset från andra forskningsprojekt (interoperable och reusable).
FAIR och öppen vetenskap
Öppen vetenskap är ett brett paraplybegrepp som syftar till att göra så mycket forskning som möjligt öppen och tillgänglig för alla, vilket ökar transparens, replikationsmöjligheter och möjligheten till samarbete. Begreppet täcker in flera rörelser kring öppenhet, bland annat öppen tillgång till vetenskapliga publikationer, öppna metoder och öppen källkod.
FAIR-principerna nämns ofta i samband med öppen vetenskap, men det är viktigt att förstå att FAIR inte handlar om att all data ska vara öppen för alla (d.v.s. inget krav på full öppenhet). Principerna handlar istället om att forskningsdata ska vara sökbara, tillgängliga, kompatibla och återanvändbara, men alltså inte nödvändigtvis öppna.
Både öppen vetenskap och FAIR-principerna bidrar till att förbättra kvaliteten, transparensen och reproducerbarheten i forskningen, något som av många anses främja forskning och innovation. Dessutom har regeringen en uttalad målsättning att resultatet av all offentligt finansierad forskning ska bli omedelbart öppet tillgängligt (”så öppet som möjligt, så stängt som nödvändigt”) och uppfylla FAIR-principerna senast 2026.
FAIR i praktiken
För att kunna uppnå FAIR-principerna krävs det digital infrastruktur så att publicering av forskningsdata kan ske. All forskningsdata kan, och ska, inte publiceras öppet tillgängligt, särskilt inte om de innehåller känsliga och skyddsvärda data, men metadata om datasetet i fråga kan oftast publiceras. Och det blir tydligt när man tittar på varje princip att bra metadata är viktigt för samtliga av de fyra FAIR-principerna.
Sökbarhet (Findable)
För att göra forskningsdata sökbara krävs bra och omfattande metadata, det vill säga tydliga, strukturerade och detaljerade beskrivningar av datasetet och dess innehåll. Det handlar exempelvis om titel, skapare, plats för insamling, vilka publikationer som är kopplade till datasetet med mera. Metadatat ska följa erkända standarder och varje dataset måste ha en unik och beständig identifierare (kallas också för PID efter engelskans persistent identifier). Med en beständig identifierare är det lättare att göra dataset sökbara genom att länka publikationer med dataset.
För att underlätta sökning av dataset bör standardiserade vokabulär och termer används i metadatabeskrivningarna (exempelvis MESH inom medicin).
Tillgänglighet (Accessible)
Tillgänglighet betyder att dataset ska vara åtkomliga på ett säkert och kontrollerat sätt, de ska dessutom bevaras över tid. För att göra detta behöver man använda tekniska lösningar som är välkända och som kommer att hålla en längre tid.
Det är viktigt att vara tydlig med vilka åtkomstvillkor och begränsningar som gäller för datasetet. Detta görs via licenser som förmedlar om ett dataset är öppet eller tillgängligt enbart under vissa villkor. Om ett dataset är helt öppet kan exempelvis Creative Commons-licenser användas. Oavsett om ett dataset kan publiceras öppet eller inte bör metadata för datasetet publiceras. Metadata visar att datasetet existerar och vad det innehåller. Det gör att potentiella användare kan hitta information om datasetet och få reda på hur de kan söka åtkomst till datasetet (om det inte redan är publicerat öppet).
Utöver detta krävs också att alla dataset har en tydlig dokumentation som beskriver nerladdning, tolkning och användning, samt vilka verktyg eller program behövs för att öppna och analysera datasetet.
Kompatibilitet (Interoperable)
Dataset görs kompatibla genom att säkerställa att data kan förstås, användas och kombineras med andra dataset, verktyg och system, men också av andra människor. Denna princip är den mest tekniska av FAIR-principerna eftersom mycket handlar om tekniska standarder och protokoll.
Genom att lagra datasetet i ett standardiserat format skapas möjlighet att öppna och arbeta med data i olika verktyg och system. Dessutom vill man se till att datat är kompatibelt så till vida att det är begripligt för andra forskare/personer. Det uppnås genom användning av standardiserad vokabulär och terminologi för det aktuella ämnesområdet (exempelvis MESH i medicin). I metadatat behöver det finnas information om hur datasetet är strukturerat och vilket format datat är lagrat i.
Återanvändbarhet (Reusable)
Denna del av FAIR-principerna ”knyter ihop påsen”. När de andra principerna är uppfyllda blir dataset möjliga att återanvända för andra forskare. I detta steg blir det tydligt att en datahanteringsplan är till stor hjälp i arbetet med att uppnå FAIR-principerna. Genom att skapa en datahanteringsplan redan från början påminns forskaren om att göra medvetna val när det kommer till filformat, rika metadatabeskrivningar med mera.
Viktigt för återanvändbarheten är att datakvaliteten säkerställs. Det innebär att datat städats från felaktiga inmatningar och dubbletter, och att eventuella felkällor eller begränsningar i datasetet dokumenteras i metadatan. Detta hjälper andra att bedöma om datasetet är lämplig att användas i deras specifika forskningsprojekt.
Bibliotekets roll i strävan mot FAIR forskningsdata
Bibliotek och bibliotekarier spelar en viktig roll i att stödja forskare i arbetet med FAIR-principerna. De har expertis att hantera information och metadata och kan assistera med metadatastandarder, beskrivning av forskningsdata, och hur man gör dem sökbara och användbara. Bibliotekarier kan också hjälpa till med dokumentation, publicering av metadata och dataset, samt val av repositorier. De kan bistå med att utforma och implementera datahanteringsplaner och kolla med andra experter som arkivet för planering av långsiktig arkivering och bevarande.
Utmaningar vid införandet av FAIR-principerna
Implementeringen av FAIR-principerna medför tekniska, organisatoriska och kulturella utmaningar, samtidigt som en framgångsrik implementation erbjuder stora möjligheter när det kommer till förbättrad forskningskvalitet och ökat internationellt samarbete.
Behovet av infrastruktur för datalagring, publicering och arkivering av forskningsdata är stort. Däremot saknas det ofta resurser för sådan infrastruktur och såväl de initiala investeringarna och de efterföljande löpande kostnader upplevas som höga. Det finns också bristande resurser för utbildning, trots att utbildningsinsatser är nödvändiga för att förmedla kunskaper om FAIR-principerna och deras praktiska tillämpning.
Eftersom öppenhet och delning är relativt nya delar av forskningsdatahanteringen är det många som kan oroas av oklarheter kring konkurrens, upphovsrätt och ansvar kring datadelning. Vidare kan forskare sakna förtroende för hur data kommer hanteras, används och citeras, vilket kan göra dem tveksamma till att dela sina dataset. De som ändå vill dela data kan stöta på juridiska och etiska hinder. Dessutom saknas det idag överlag incitament för att dela dataset och följa FAIR-principerna.
Förhoppningarna är dock att framtiden ska bjuda på tydliga och rimliga incitament för öppna data och FAIR från såväl forskarsamhället som forskningsfinansiärerna. Med mer information och utbildning om frågan ökar dessutom kunskaperna om FAIR-principerna vilket bör leda till att infrastrukturen för lagring och publicering utvecklas. Kan vi dessutom få hjälp av AI-lösningar som bidrar till automatisering av metadata, standardisering och kvalitetskontroll ser framtiden ändå lite ljus ut för mer FAIR data i världen.
Läs mer
Svensk nationell datatjänsts information om FAIR-principerna
Pieta Eklund, Signe Wulund & Katharina Nordling