Tekijä: Teppo Hjelt

  • From search words to search questions?

    From search words to search questions?

    Are you good at asking questions but not a fan of ANDs and ORs and brackets? Then you might like what is happening with the search engines.

    Information retrieval instructions traditionally start by finding out the keywords of your topic and combining them into a search query. Then, synonyms and other related terms are considered and added to the search query using Boolean operators (AND, OR). This is still the most effective method, for example, when conducting information retrieval through SAMK-Finna. Finna doesn’t yet try to think on behalf of the searcher. Not yet.

    Google, on the other hand, has been trying to think on behalf of the searcher for a long time – often successfully. The same goes for its scholarly version, Google Scholar. Up until now, I have believed that it’s worth starting searches there with simple keyword combinations and then progressing to more advanced search queries. However, now it might be time to approach information retrieval also a bit differently.

    Let’s do a little test with the topic of ”treating knee arthritis without surgery”. It’s a good topic to test a search engine’s natural language understanding because it includes the concept of ”without surgery”. If the search engine understands natural language, it should be able to retrieve studies on treatment methods other than surgery. If it doesn’t understand natural language, it may miss the meaning of the word ”without” and search only for the term ”surgery”, providing especially surgical treatment-related studies.

    If you search directly with the phrase treating knee arthritis without surgery, you’ll find results related to treatment without surgery, but also results related to surgery. Pretty good, but it could be better.

    Let’s change the search query to the form of a question: How can knee arthritis be treated without surgery? The question doesn’t use the most scientifically precise vocabulary, but still, all the articles at the top of the result list deal with treatment without surgery. They use terms like ”non-surgical”, ”nonoperatively”, ”non-arthroplasty” etc. instead of ”without surgery.” Even a simple question posed in natural language helped Google Scholar figure the type of information we were looking for. The search results can be refined by refining the questions: What are the best evidence-based non-surgical treatment methods for knee osteoarthritis? This is absolutely worth experimenting more.

    Google Scholar is, in that sense, a traditional search engine in that it provides a list of sources as a result (at least for now). In addition, there are now search engines available that also respond to questions based on research. In our example case, they would tell you about treatment options and what studies say about them. For instance, Consensus is one free option (requires logging in). As paid options, you can get better ones like ChatGPT Plus extensions.

    In the future, will it be more important to know how to ask the right questions from a search engine than to rely on keywords and their combinations? The question doesn’t have to be spot on immediately — getting started with something sufficiently good is enough. Perhaps in the future, we will begin our searches with well-formed questions and then continue with traditional search techniques if needed. However, the fundamental principle remains that you must be able to express your information needs clearly and concisely — one way or another.

    P.S. If you haven’t linked Google Scholar results to SAMK Library yet, please do so. You’ll get access to a lot more full texts from your search results. This video explains how to do it.


    Text: Teppo Hjelt, Information Specialist at SAMK Library, who works on guidance related to information retrieval
    Image: Teppo Hjelt, created with DALL-E 3 AI

  • Hakusanoista hakukysymyksiin?

    Hakusanoista hakukysymyksiin?

    Oletko hyvä kyselemään, mutta et sulkeiden, ANDien ja ORien suurin fani? Saatat ehkä pitää siitä, mitä hakukonemaailmassa on meneillään.

    Tiedonhakuohjeistukset ovat perinteisesti lähteneet liikkeelle siitä, että ensin mietitään oman aiheen avainsanat ja yhdistetään ne hakulausekkeeksi. Sen jälkeen mietitään sanoille synonyymejä ja muita rinnakkaisia termejä ja lisätään nämä sopivasti Boolen operaattoreilla (AND, OR) hakulausekkeeseen. Tämä on yhä toimivin tapa, kun tiedonhakua tehdään esimerkiksi SAMK-Finnasta. Finna ei vielä yritä ajatella tiedonhakijan puolesta. Ei vielä.

    Googlen haku sen sijaan on yrittänyt ajatella hakijan puolesta jo pitkään – usein onnistuneestikin. Samoin sen tieteellinen versio Google Scholar. Tähän asti olen jaksanut uskoa, että sielläkin kannattaa haut aina aloittaa yksinkertaisilla sanahauilla ja edetä sitten vähän kehittyneempiin hakulausekkeisiin. Nyt taitaa kuitenkin olla aika lähestyä tiedonhakua myös toisin.

    Tehdään pieni testi. Otetaan aiheeksi ”polven nivelrikon hoitaminen ilman leikkausta”. Se on hyvä aihe testata hakukoneen luonnollisen kielen ymmärtämistä, koska mukana on käsite ”ilman leikkausta”. Jos hakukone ymmärtää luonnollista kieltä, se tosiaan osaa hakea tutkimuksia muista hoitokeinoista kuin leikkaus. Jos se ei ymmärrä luonnollista kieltä, se kadottaa sanan ”ilman” merkityksen ja hakee sanalla ”leikkaus” ja antaa nimenomaan leikkaushoitoon liittyviä tutkimuksia.

    Aloitetaan suomeksi. Jos hakulausekkeena on polven nivelrikon hoitaminen ilman leikkausta, tuloslistan kärjessä on tuloksia liittyen leikkaushoitoon. Tätä ei haluttu.

    Muutetaan seuraavaksi hakulauseke kysymyksen muotoon: Miten polven nivelrikkoa voidaan hoitaa ilman leikkausta? Tulokset liittyvät yhä leikkaushoitoon. Suomeksi tämä ei Google Scholarilta oikein vielä onnistu.

    Jos vaihdetaan englantiin ja haetaan lausekkeella treating knee arthritis without surgery, tuloslistan kärjestä alkaa löytyä tuloksia, joissa aiheena on hoito ilman leikkausta, mutta myös tuloksia liittyen leikkaukseen. Vähän parempi siis, mutta ontuu yhä.

    Lopuksi muutetaan tämäkin hakulauseke kysymyksen muotoon: How can knee arthritis be treated without surgery? Kysymys ei käytä mitenkään tarkkaan harkittua tieteellistä sanastoa, mutta silti tuloslistan kärjessä kaikki artikkelit käsittelevät hoitoa ilman leikkausta. Niissä ei käytetä termiä ”without surgery” vaan non-surgical, nonoperatively, non-arthroplasty jne. Jo yksinkertainen luonnollisella kielellä esitetty kysymys sai Google Scholarin hahmottamaan, millaista tietoa oltiin hakemassa. Hakutulosta voidaan tarpeen mukaan tarkentaa kysymystä parantamalla: What are the best evidence-based non-surgical treatment methods for knee osteoarthritis? Tätä kannattaa ehdottomasti kokeilla lisää. Ja jos tämä nyt toimii näin hyvin englanniksi, eiköhän se joskus ala toimia suomeksikin.

    Google Scholar on siinä mielessä perinteinen hakukone, että se antaa tulokseksi listan lähteitä (ainakin toistaiseksi). Sen lisäksi alkaa olla tarjolla hakukoneita, jotka myös vastaavat kysymyksiin tutkimukseen perustuen. Esimerkkitapauksessamme ne siis kertovat, mitä hoitomuotoja on ja mitä tutkimukset kertovat niistä. Esimerkiksi Consensus on yksi ilmainen tällainen (vaatii kirjautumisen). Maksullisina saa parempia vaikkapa ChatGPT Plussan lisäosina.

    Onko tulevaisuudessa hakusanoja ja niiden yhdistelemistä tärkeämpää osata kysyä hakukoneelta oikeat kysymykset? Eikä kysymyksen tarvitse olla heti kohdillaan – riittävän hyvällä pääsee alkuun. Ehkä jatkossa aloitamme haut hyvin muodostetuilla kysymyksillä ja jatkamme sitten tarvittaessa perinteisin hakutekniikoin. Se perusasia ei kuitenkaan muutu, että oma tiedontarve pitää pystyä ilmaisemaan selkeästi ja ytimekkäästi – tavalla tai toisella.

    P.S. Jos et ole linkittänyt Google Scholarin tuloksia SAMKin kirjastoon, tee se. Saat hakutuloksista paljon enemmän kokotekstejä auki. Tämä video kertoo, miten se tehdään.


    Teksti: Teppo Hjelt, SAMKin kirjaston tietoasiantuntija, joka työskentelee tiedonhaun opastukseen liittyvien asioiden parissa

    Kuva: Teppo Hjelt, luotu DALL-E 3 -tekoälyllä

  • Osaisin kyllä hakea lähteitä, mutta…

    Osaisin kyllä hakea lähteitä, mutta…

    Tympäiseekö hakeminen? Jatkokertomuksemme ensimmäisessä osassa keskityttiin hakujen tekemiseen liittyviin kompastuskiviin. Tässä osassa käsittelemme tilanteita, joissa ajatus menee joko niin, että tiedonhakuja ei tehdä (miksi hakea, kun se on ihan turhaa) tai haku tyssää alkumetreillä (tämä on tosi vaikeaa, kun aiheesta ei ole kirjoitettu mitään).

    (lisää…)
  • Voi kuule – ei noin, vaan näin! Oletko sinäkin mennyt tekemään nämä perusvirheet hakiessasi tietoa?

    Voi kuule – ei noin, vaan näin! Oletko sinäkin mennyt tekemään nämä perusvirheet hakiessasi tietoa?

    Eivät tässä artikkelissa listatut asiat oikeasti virheitä ole. Ne ovat kuitenkin tehokasta tiedonhakua hankaloittavia kompastuskiviä, jotka kannattaa tiedostaa. Kun ne tiedostaa, hakujaan voi seuraavalla kerralla ajatella vähän laajemmin, ja ehkä löytää enemmän ja parempia lähteitä.

    (lisää…)