Opinnäytetyön liitettä skannataan.

Skannaaminen kannattaa aina

Ammattikorkeakoulujen opinnäytetyöt ovat julkisuuslain perusteella julkisia.  Julkisuuden lisäksi ne ovat myös pysyvästi säilytettäviä asiakirjoja (30.9.1994 asti Valtionarkisto, 1.10.1994–31.12.2016 Arkistolaitos), joten niitä säädellään arkistolaissa. Nämä reunaehdot ohjaavat opinnäytetöiden tallentamista, säilyttämistä, arkistointia ja käyttöön saattamista. SAMKissa opinnäytetöiden tallennus ja arkistointi on kirjaston vastuulla.

SAMKin kirjasto on tallentanut opinnäytetöitä Theseus.fi-palveluun vuodesta 2006, kattavammin 2009 lähtien. Tätä kirjoitettaessa siellä on opinnäytetöitämme avoimessa kokoelmassa 10 800 ja käyttörajatussa kokoelmassa 450. Avoimen ja käyttörajatun kokoelman eroista voi lukea Theseuksen sivuilta tai aikaisemmista blogikirjoituksistamme.

SAMKin ensimmäiset opinnäytetyöt valmistuivat vuonna 1995. Tuohon aikaan opinnäytetyöt toimitettiin kirjastoon kansitettuina versioina. Arkistokappaleet sen sijaan toimitettiin silloisten käytäntöjen mukaan paperimuotoisina opettajalle, toimistoon tms. Kirjasto ylläpiti tuolloin opinnäytetöiden tiivistelmistä Tiivis-tietokantaa, myöhemmin tiivistelmiä alettiin kuvailla Voyager-kirjastojärjestelmään. Vuosituhannen vaihteen jälkeen alkoi arkistokappaleita tulla myös CD-ROM-levyillä ja näistä olikin myöhempinä vuosina paljon iloa, kun arkistokappaleet sai siirrettyä suoraan sähköiseen arkistoon. Tämäkään työ ei tietenkään ollut ihan niin yksinkertaista kuin voisi kuvitella, sillä laadunhallinta oli jäänyt puolitiehen ja rompulla saattoi olla opinnäytetyö useana tiedostona ja erikoisissa formaateissa. Näiden yhdisteleminen olikin ihan oma projektinsa, eikä tiedostojen avautuminen vuosien viiveellä ollut lainkaan itsestään selvää. Jälkikäteen ajatellen toimipisteiden vähentämisillä ja arkistojen kokoamisilla yhteen paikkaan oli iso vaikutus, kun siivousvaiheessa huomattiin eri toimipisteistä lähettää nurkissa lojuvat romppulaatikot kirjastoon – jossain paikassa oli ihan aakkosiin tai aikajärjestykseen järjestetty kokoelma, mutta suurin osa tuli erilaisissa laatikoissa. Näitä työstimme ja tallensimme lähinnä harjoittelijavoimin sähköiseen arkistoon eli Twebiin ja julkaisuluvan antaneiden opiskelijoiden töitä myös Theseukseen.

Vuodesta 2006 lähtien opinnäytetyömme ovat jo pääsääntöisesti sähköisessä arkistossa tai Theseuksessa. Jäljelle jäi enää ensimmäisen kymmenen toimintavuoden opinnäytetöiden sähköistäminen ja arkistointi. Vanhoja opinnäytetöitä setviessä paljastui, ettei läheskään kaikista opinnäytetöistä ole tallella arkistokappaletta, vaan ainoastaan kirjastoon toimitettu lainakappale. Mihin lie osasta silloisia toimipisteitä kadonneet, tai onko niitä alun alkaenkaan toimitettu arkistoihin? Selvittelyn tuloksena siirsimme vanhat opinnäytetyöt kirjaston hyllyistä arkistoon suojaan, etteivät ainakaan enää pääse katoamaan. Kaikkiaan ensimmäisen kymmenen vuoden aikana valmistui 9 000 opinnäytetyötä ja niille siis piti alkaa tekemään jotain.

Seulontapäätös

Keväällä 2021 SAMK sai Kansallisarkistolta päätöksen analogisten asiakirjojen säilytysmuodosta (KA/24167/07.01.01.03.01/2020). Päätöksessä todetaan, että “asiakirjat eivät ole analogiselta säilytysmuodoltaan kulttuurihistoriallisesti arvokkaita ja ne säilytetään digitoinnin jälkeen yksinomaan digitaalisessa muodossa”. Digitoinnista annetaan päätöksessä vielä tarkemmat ohjeet. Analogisten asiakirjojen hävittäminen on mahdollista, kun digitaalinen ilmentymä on varmistettu. Työt määriteltiin tallennettavaksi Tweb-järjestelmään, Theseus ei ole vielä arkistokelpoinen tallennuspaikka. Näillä spekseillä siis eteenpäin.

Poistetaan sähköisesti arkistoidut hyllyistä

Seulontapäätöksen jälkeen tehtiin suunnitelmia ja mietittiin parhaita käytäntöjä opinnäytetöiden sähköistä arkistointia varten. Testasimme mm. ohjelmistorobotin mahdollisuuksia etenkin tiedoston siirtämiseksi Twebiin. Tämä jäi nyt ainakin toistaiseksi hyödyntämättä teknisen toteutuksen vaikeuden vuoksi, eli botti ei kykene tunnistamaan erimuotoisista kansilehdistä tarvittavia tietoja.

Saimme kirjastoon alkuvuodesta 2022 henkilön tekemään skannauksen käytännön tehtäviä. Opinnäytetöiden skannaaminen on hidasta puuhaa, siksi ajattelimme välttää tuplatyötä ja siivota ensin hyllyistä pois kaikki ne, joita ei tarvitse skannata. Twebistä ja Theseuksesta otettiin listaukset. Kaikkineen Twebissä oli tässä vaiheessa tallennettuna 7 000 opinnäytetyötä, näistä osa kansitettuina kirjastoissa ja osa Theseuksessa. Näiden listojen perusteella poistettiin kirjaston hyllyistä Twebiin jo tallennetut opinnäytetyöt, kaikkineen lähes 3 000 opinnäytetyötä väheni tässä vaiheessa pelkästään Porin kokoelmasta. Eli ei muuta kuin listan mukaan hyllystä pois ja hävitykseen. Tähän projektityöntekijältämme meni aikansa, kun samalla rakennettiin muutenkin toimintatapaa jatkoa ajatellen. Tässä vaiheessa myös muista kampuskirjastoista siirrettiin vanhoja opinnäytetöitä Poriin arkistoon, jotta kaikki olisi yhdessä ja samassa paikassa. Myös arkistossa olevat opinnäytetyöt tarkistettiin samalla tavalla, tosin niitä löytyi Twebistä vain pieni osuus.

Arkistossa olevien opinnäytetöiden skannaaminen

Skannaus aloitettiin testimielessä Taidekoululla olevista opinnäytetöistä. Näiden kohdalla näkyvyys olikin ennen todella pientä, sillä työt löytyivät vain Taidekoulun kirjastosta. Työ etenee manuaalisesti niin, että skanneriin laitetaan tekstintunnistus (OCR) päälle ja skannatut PDF-tiedostot lähetetään sähköpostilla eteenpäin ja sitten tallennetaan kirjaston yhteiseen verkkokansioon. Kansiosta opinnäytetyöt nimetään uudelleen, tarvittaessa korjataan, sekä tallennetaan ja kuvaillaan Twebiin.

Suurin osa skannattavista opinnäytetöistä (n. 5 000 kpl) on päätearkistossa Porin kampuksella, niin arkistokappaleet kuin muilta kampuksilta aikaisemmin siirretyt kirjastokappaleet. Skannaus aloitettiin helpoimmasta päästä eli irtolehtinä olevista arkistokappaleista. Näin päästiin heti hyvään vauhtiin ja saatiin hiottua prosessin jatkovaiheita ja irtolehtien skannaaminen sujuikin varsin rivakasti.

Kansitettuina olevien opinnäytetöiden skannaaminen onkin selvästi hitaampi työvaihe, tätä mietimme alkuun pitkään ja testasimme erilaisia laitteita ja toimintamalleja. Kannet ovat pahvia ja niiden selkämys on metallia. Loppujen lopuksi sadan euron paperileikkuri osoittautui riittävän hyväksi laitteeksi ja sillä alettiin rikkomaan kansia ja irrottamaan lehdet liimapinnasta. Työ etenee muutaman kymmenen työn päivävauhtia, mikäli opinnäytteissä on kunnon marginaalit ja ne ovat muutenkin hyvässä kunnossa. Liitteet ovat osoittautuneet varsin tehokkaaksi hidasteeksi skannaamisessa, varsinkin tekniikan alan töissä on toisinaan isoja lakanoita kuten rakennuspiirustuksia, joiden asettelu A3-kokoiseen skanneriin on luovuutta vaativa toimenpide. Onneksi monitoimilaitteemme ovat varsin hyviä ja luotettavia, niiden puolesta työ sujuu näppärästi. Ensimmäisen reilun vuoden aikana on leikattu, skannattu ja tallennettu tiedostona parisen tuhatta opinnäytetyötä.

Twebbaus eli varsinainen siirto sähköiseen arkistoon

Opinnäytetöiden vienti Tweb-järjestelmään ja riittävä kuvailu hoidetaan sekin manuaalisesti kirjastohenkilöstön toimesta, lähinnä etätyöpäivinä muiden tehtävien ohessa. Tässä etenemisvauhti on sama kuin skannauksessa eli maksimissaan parikymmentä työtä päivän aikana. Tiedostot otetaan jaetusta kansiosta ja tallennetaan Twebiin. Samalla lisätään sovittu metadata, jotta töiden löytyminen varmistetaan. Ennen Twebiin tallentamista monille töille joudutaan tekemään tiedostojen yhdistämistä tai muuta hiomista. Joskus töitä joutuu esim. laittamaan väärin päin skanneriin tai liian paksu työ pitää skannata monessa erässä. Myös liitteiden yhdistäminen itse opinnäytteen tiedostoon on tehtävä tässä vaiheessa Adoben työkaluilla. Ensimmäisen vuoden aikana on Twebiin tallennettu 1 500 opinnäytetyötä.

Seuraavat vaiheet

Skannauksen jatko riippuu paljolti siitä, kuinka kauan saamme pitää projektityöntekijän tehtävässään. Ainakin syksyyn 2023 mennään nyt tällä tavalla ja sitten nähdään, paljonko jää vielä skannaamatta. Luultavasti arkiston osalta pääsemme aika pitkälle, mutta kirjastoissa lainattavissa olevien skannaamiseen tuskin ehditään. Kun opinnäytetyö on skannattu ja tiedostot Twebissä, saamme seulontapäätöksen mukaan hävittää työn. Tämä onkin hyvä juttu, koska rikotut kansitetut työt ovat kovin hankalasti hyllytettäviä arkistossa. Kirjastoissa olevat opinnäytetyöt ovat sitten aikanaan seuraavassa vaiheessa työn alla. Ensin tietenkin käydään taas läpi ne, jotka on vuodesta 2022 alkaen tallennettu Twebiin ja voidaan hävittää.

Twebiin tallentaminen etenee omaa vauhtiaan, se ei ole kenenkään ykköstehtävä, vaan tehdään muiden töiden ohella. Twebissä olevat opinnäytetyöt ovat henkilöstön käytettävissä, oikeastaan samaan tapaan kuin Theseuksen käyttörajatussa kokoelmassa olevat. Saammeko jatkossa Twebistä tiedostot siirrettyä metadatan kanssa toiseen järjestelmään (esim. Alma-kirjastojärjestelmän kautta Finnaan) helpommin löydettäväksi, jää nähtäväksi. Jos Theseuksesta saataisiin arkistokelpoinen, niin sittenhän nämä opinnäytetyöt olisi hyvä siirtää sinne, jotta kaikki olisi yhdessä paikassa katsottavissa. Tuo ei taida olla kovin todennäköistä, mutta kahdessa paikassa olevat työt ovat jo huomattavasti parempi versio kuin aikaisempi monen kirjaston ja tallennusformaattien sekamelska.

Teksti: Jussi Kärki

Kuva: Harri Salminen


Posted

in

by