Life on the dark side eli Theseuksen pimeän arkiston pitkä marssi

Totuudessa pysymiseksi korjataan heti otsikossa olevat virheet:. Ensinnäkään Theseus ei ole oikeasti julkaisuarkisto, ainakaan tällä hetkellä, sillä pitkäaikaissäilytysratkaisu (PAS) on tavoitteista ja toiveista huolimatta vielä toteuttamatta. Theseus on Arenen palvelu, johon tallennetaan ammattikorkeakoulujen opinnäytetyöt ja julkaisut. Kansallisarkisto on kyllä linjannut, että Theseus on opinnäytetöiden välivarastoksi sopiva PAS-ratkaisua odotellessa. Pimeä Theseus on puolestaan käyttörajattu kokoelma, jossa osa opinnäytetöistä piilotetaan avoimesta verkosta rajatumpaan käyttöön. Pimeä Theseus tarkoittaa käytännössä IP-rajauksella toteutettua kokoelmaa.

Theseuksen kehittäminen aloitettiin jo 2006, SAMKin kirjasto oli jo silloin pilottihankkeessa mukana. Tästä on kertomus esim. tämän blogin aikaisemmassa artikkelissa. Varsinaisesti opinnäytetöiden tallennus aloitettiin 2009 alusta, mutta SAMKin osalta tehtiin silloin takautuvaakin tallennusta, meidän opinnäytetöitämme löytyy Theseuksesta melko kattavasti jo 2006 alkaen. Jo pilottihankkeen aikana oli puhetta siitä, että osa opinnäytetyön tekijöistä ei halua työtään julkisuuteen vaan tarvitaan joku toinen vaihtoehto avoimen julkistamisen rinnalle. Pilottihankkeen aikana tämä jäi kuitenkin toteuttamatta, koska se “ei olisi edistänyt Open Accessia”. Oli siis tehtävä muita ratkaisuja Theseuksen rinnalle, SAMKissa otettiin vastaan ei-julkaistavat opinnäytetyöt kansitettuina ja sähköinen versio tallennettiin Twebiin. Käytännössä opiskelijalle tuli eräänlaisena rangaistuksena (tai Open Access -kannustimena, kuinka vaan) kansituskustannukset, lomakkeiden täyttö ja käynti kirjastossa. Tästä ylimääräisestä vaivasta huolimatta kansitettuina on tuotu kirjastoon vuositasolla joka kymmenes opinnäytetyö.

Muutama vuosi sitten alettiin taas uudestaan viritellä ajatusta pimeän Theseuksen pystyttämisestä. Theseuksen taustalla oleva järjestelmä on DSpace ja ammattikorkeakouluissa huomattiin, että yliopistot ovat luoneet sillä rajoitetun käytön kokoelmia graduistaan yms. Nyt saatiin vihdoin hanke toden teolla liikkeelle. Koska Theseus on Arenen hallinnoima palvelu ja Amkit-konsortio määritelty vastuulliseksi toimijaksi, alettiin asiaa edistää konsortion kautta. Talvella 2020 näyttikin siltä, että asia etenee hyvää vauhtia, kun teknisesti kyseessä ei ole iso muutos ja palvelun tuottaja Kansalliskirjasto on tehnyt vastaavia toteutuksia jo muihin hallinnoimiinsa DSpace-toteutuksiin.

Kevään 2021 aikana oli selvinnyt, että kahdeksan ammattikorkeakoulua on lähdössä mukaan ensimmäisessä vaiheessa. Aikataulu oli tuolloin vielä auki, touko-kesäkuuta veikattiin ajankohdaksi. Samalla piti kuitenkin tehdä muutamia muutoksia kirjautumiseen jne., joten loppujen lopuksi Theseus päivitettiin 31.8.2021 ja siinä yhteydessä halukkaille lisättiin käyttörajattu kokoelma avoimen kokoelman rinnalle. Syöttölomakkeen Haka-kirjautumiseen muutettiin attribuutteja sen verran, että valittavaksi tuli vain kaksi kokoelmaa eikä enää ole mahdollista vahingossakaan syöttää opinnäytetyötään väärän ammattikorkeakoulun kokoelmaan.

Ja mitä sitten käytännössä

Opiskelija valitsee itse kumpaan kokoelmaan tallentaa työnsä – avoimeen vai käyttörajattuun. Kumpaankin kokoelmaan tallennetut työt näkyvät SAMKin Finnassa, metatiedot ovat siis julkisia (Laki viranomaisten toiminnan julkisuudesta). Käyttörajatun kokoelman töitä ei kuitenkaan saa auki muuta kuin erikseen määritellyistä IP-numeroista. SAMKissa päädyimme sellaiseen ratkaisuun, että käyttörajatun kokoelman työt ovat luettavissa koko SAMKin IP-avaruudessa olevilla työasemilla.

Valmistuvan opiskelijan kannalta prosessi yksinkertaistui, koska syöttölomake tunnistaa nyt hänen oman organisaationsa ja valintalistalla on vain kaksi kokoelmaa. Käyttörajattuun kokoelmaan haluttavan opinnäytetyön tekijän ei tarvitse enää myöskään kansittaa työtään, vaan kaikki menevät saman prosessin mukaan.

Kirjasto säästää työaikaa, kun enää ei tarvitse siirtää kansitettuna toimitettujen töiden tiedostoa Theseuksesta Twebiin. Itse tarkastusprosessi on kirjaston kannalta yksi yhteen valitusta kokoelmasta riippumatta.

Kun töiden metadata on julkista, näkevät kaikki (mm. opiskelijapalvelut) tiedot välittömästi kirjaston tarkastettua Theseuksen tallennuksen. SAMKin palvelujen henkilöstö näkee nyt myös aiempaa helpommin koko opinnäytetyön, näitähän pitää silloin tällöin tarkastaa, kun todistusanomuksessa ja muualla on kirjoitettu vaikkapa opinnäytetyön nimi eri tavalla. Opinnäytetöistä kiinnostuneen tiedonhakijan kannalta on yksinkertaisempaa, että kaikki työt ovat samalla Finnan haulla löydettävissä.

samk.fi/theseus

Kuva: Soumil Kumar / Pexels


Posted

in

by