Nr 51

Laadi alla

Jaga

Prindi

Riigikogu Toimetiste 50 numbrit andmeteaduse vaatevinklist

Andmeteaduse kiire areng on muutnud võimalikuks suurte andmekogude analüüsimise, mille käigus saadud tulemusi on võimalik rakendada nii lühi- kui ka pikaajaliste otsuste tegemisel. Riigikogu Toimetiste 50. numbri ilmumise järel on ajakirjast endast saanud teadlaste uurimisobjekt.

Andmeteadus avab ajakirja tekstiga töötamiseks mitmeid võimalusi, pakkudes uut lähenemist, et analüüsida sisu, leida seoseid ja uurida trende. Tekstianalüüsi rakendamine ajakirja sisul aitab valitsemiskogemust mõtestada.

Ajakiri Riigikogu Toimetised on ilmunud alates 2000. aastast ning selle peamine eesmärk on mõtestada parlamendi põhiseaduslikke ja sotsiaalseid ülesandeid ning võimendada ühiskondlikke diskussioone, kaasates seadusandjaid, teadlasi, poliitikuid, ametnikke ja kodanikuühiskonna esindajaid.

Ajakirja 50 numbri sisu peegeldab Eesti ühiskonna ja poliitika arengut, aktuaalseid teemasid ja tulevikutrende. Väljaandes on oluline osa teaduspõhisel infol, avaldatud artiklid tuginevad akadeemilistele uuringutele ja ekspertide teadmistele. Ajakirjale teevad kaastööd ka rahvusraamatukogu spetsialistid. Kõige pikemaajalisem on „Parlamentaarsete uudiste“ rubriik, mis käsitleb välismaiste parlamentide tööd.

KÕIGE SAGEDASEMAD SÕNAD

Sõnade üldise sageduse uurimine võimaldab saada esmase ülevaate Riigikogu Toimetiste artiklites kirjutatust. Sisulisemaks analüüsiks on ajakirja tekstid eelnevalt puhastatud, näiteks on kõik sõnad muudetud väiketähelisteks ja viidud algvormi (lemmatiseeritud). Samuti on tekstist eemaldatud stoppsõnad (Uiboaed, 2018) ehk sõnad, mis ei ole sisuliselt informatiivsed, näiteks osad tegu-, side- ja asesõnad, ning muud ebavajalikud tähe- ja kirjavahemärgid. Puhastatud tekstist selgub, et kõige sagedasemad sõnad Riigikogu Toimetiste artiklites on „eesti“, „aasta“, „riik“, „euroopa“, „riigikogu“, „seadus“, „liit“, „inimene“, „aeg“ ja „uus“.

Võimalik on vaadelda ka sõnade koosesinemist. Näiteks sõna „eesti“ esineb kõige sagedamini sõnapaarides „Eesti Vabariik“, „eesti keel“, „Eesti riik“, „Eesti Pank“ ja „Eesti Rahvusraamatukogu“. Ajakirjas kõige sagedamini esinevad sõnapaarid on „Euroopa Liit“, „Riigikogu Toimetised“, „Tartu Ülikool“, „kohalik omavalitsus“ ja „Riigikogu liige“. Sõnade konteksti saab uurida ka selle kaudu, millised on otsitavale sõnale statistiliselt kõige sarnasemad sõnad, näiteks sõnal „Euroopa“ on sarnane kasutusmuster sõnadega „liikmesriik”, „liit“, „euroliit“, „EL“ ja „majandusühendus“. 

KONKREETSETE SÕNADE KASUTAMISE SAGEDUSE MUUTUMINE

Konkreetsete sõnade kasutamise sageduse varieerumine illustreerib nii päevakajaliste teemade kui ka keelekasutuse muutumist. Olulise tähtsusega sündmused Eestis ja kogu maailmas kajastuvad sõnade mainimissageduse tõusus, mis tuleneb asjakohaste artiklite ilmumisest ajakirjas. Kuna sõnade arv ajakirja numbrite lõikes erineb, siis on sõnade sagedust mõistlik uurida suhtelise sageduse kaudu. Näiteks tõuseb sõnade „Ukraina“ ja „Venemaa“ kasutus samaaegselt 2014. aastal, kui Venemaa annekteeris Krimmi. Sõna „Venemaa“ sagedat kasutust 2017. aastal saab põhjendada mitme asjakohase artikli ilmumisega. 2022. aastal on sõnade „Ukraina“ ja „Venemaa“ samaaegne tõus seotud Venemaa täiemahulise sõja algusega Ukrainas, sama aasta esimene ajakirjanumber on pühendatud julgeolekule ja alanud sõjale.

JOONIS 1. Sõnade „Ukraina“ ja „Venemaa“ suhteline sagedus Riigikogu Toimetistes.

Joonis 1
Allikas: autorite arvutused

Märksõnade „Euroopa Liit“ ja „NATO“ puhul on 24 aasta jooksul enam mainitud Euroopa Liitu. Ainus periood, mil NATO esinemissagedus ületas EL-i oma, on 2022. aasta paiku, mida võib taaskord seostada sõjalise olukorra eskaleerumisega ning sellest tulenevate kaitsepoliitika teemade esiletõusuga. Euroopa Liidu teemade käsitlemine ajakirjas on olnud üsna ebaühtlane – on olnud nii tõuse kui ka langusi. 2003.–2004. aastal on näha selget tõusu ja seda seoses Eesti saamisega EL-i liikmesriigiks. Kuigi Eesti ühines ka NATO-ga 2004. aastal, ei ole sõnakasutuses seda märgata. Väike tõus on nähtav 2001. aastal, kui ilmusid mõned julgeolekuteemalised artiklid, järgnevatel aastatel jääb sõna „NATO“ esinemissagedus stabiilselt madalaks ja seda kuni 2022.–2023. aastani.

JOONIS 2. Sõnade „Euroopa Liit“ (sh „EL“) ja „NATO“ suhteline sagedus Riigikogu Toimetistes.

Joonis 2
Allikas: autorite arvutused

Riigikogu Toimetised on eelkõige parlamendi ajakiri ja seetõttu on huvitav jälgida ka parlamendiga seotud sõnade esinemist tekstides. Kui sõna „parlament“ kasutussagedus on aja jooksul püsinud üsna ühtlane, siis „Riigikogu“ esinemissagedus on olnud muutlikum. Järsk tõus sõnakasutuses 2019. aastal on tingitud riigireformiga seotud teemadest, millele on pühendatud terve ajakirja number. Arusaadav on ka 2000. aasta kõrge kasutussagedus seoses ajakirja esimese numbri ilmumisega. Riigikogu sagedase mainimise taga on kindlasti ka ajakirja nimi.

JOONIS 3. Sõnade „parlament“ ja „Riigikogu“ suhteline sagedus Riigikogu Toimetistes.

Joonis 3
Allikas: autorite arvutused

AJAKIRJAS LEIDUVAD TEEMAD

Teemamudeli abil on võimalik leida teemasid ehk statistiliselt sageli samas kontekstis koosesinevaid sõnu. Niiviisi on suurest tekstikogust võimalik tuvastada abstraktseid alamteemasid. Samas jääb teemade lahtimõtestamine ja tõlgendamine siiski uurija ülesandeks. Teemamudelite loomiseks on Riigikogu Toimetiste sisu jagatud ilmumisaja järgi kolmeks, et jälgida teemade ajalist muutumist. Teemad kattuvad osaliselt üle aastate, mistõttu on igast ajavahemikust välja toodud neli kõige ilmekamat. Kaasatud ei ole väga sagedasi ehk enam kui pooltel lehekülgedel esinevaid sõnu. Illustreerivatel graafikutel (joonis 4) on iga teema puhul eraldi ridadel teemasse kuuluvad sõnad, sealhulgas näitab sõna kõrval oleva tulba pikkus, kui iseloomulik on sõna konkreetsele teemale.

JOONIS 4. Riigikogu Toimetiste märkimisväärsed teemad 2000–2009.

Joonis 4
Allikas: autorite arvutused

Teemade kaardistamine aitab välja tuua vaadeldava ajaperioodi olulisemad punktid, mille üle arutleti ja mis olid ühiskonnas aktuaalsed. Ajakirja 2000.–2009. aastate numbrites saab ühe teemana välja tuua parlamenditöö kajastamise, millega seotud märksõnu leidub sageli ka teistes teemades. Tõenäoliselt tuleneb see ka ajakirja ilmumise algusest, kui ajakirja sisu oli tihedalt seotud parlamendi enda tegevuse ja üldiselt riigivalitsemisega.

Ülejäänud teemade seast saab välja tuua pere ja toimetulekuga seonduva teema, millele viitavad sõnad „laps“, „(keskmine) palk“, „pere“, „pension“, „kroon“, „toetus“ ja „sissetulek“. Ühe teema moodustavad Euroopa Liiduga liitumise ja rahvusvahelise koostööga seotud sõnad. Mõne teema puhul võib näha mitut erinevat suunda, näiteks on tumesiniselt kujutatud teema moodustunud haridust („kool“, „õpilane“, „õppekava“, „õpetaja“) ja õigusloomet („õigus“, „seadus“) tähistavatest sõnadest. Lisaks väljatoodud teemadele on kirjutatud ka põhiseadusest, ülikoolidest, valimistest, avalikust sektorist ja omavalitsustest.

2010.–2019. aastal saab taaskord eraldada üldise riigi valitsemist puudutava teema, kuhu on lisandunud ka sõnad „Euroopa“ ja „Venemaa“, mis lisavad rahvusvahelist mõõdet. Ühele teemadest võib anda ühisnimetajaks teadus, kuna see sisaldab sõnu „teadus“, „ülikool“ ja „uuring“. Sel kümnendil hakati Riigikogu Toimetistesse lisama ka artiklite ingliskeelseid kokkuvõtteid, milles sisalduvaid sõnu saab samuti vaadelda eraldiseisva teemana. Tekkinud on ka Venemaa agressioonile Ukrainas viitav teema, mis omakorda vihjab selle tõttu muutunud välispoliitilisele olukorrale. Visualiseerimata teemade seas on selliseid märksõnu nagu „eelnõu“, „komisjon“, „(kohalik) omavalitsus“, „haridus“ ja „laps“. Kümnendit iseloomustavad teaduspõhisuse tähtsustamine ja muutunud rahvusvahelised suhted.

JOONIS 5. Riigikogu Toimetiste märkimisväärsed teemad 2010–2019.

Joonis 5
Allikas: autorite arvutused

Viimase viie aasta puhul on ajakirja numbrid muutunud temaatilisemaks, näiteks viitavad märksõnad „elekter“ ja „hind“ Riigikogu Toimetiste numbrile, mille fookuses on energeetika. Lisaks sellele moodustub vaadeldava ajaperioodi sisust kohalikele omavalitsustele ja noortele viitavatest sõnadest koosnev teema. Üks teemadest kombineerib hariduse ja teaduse, kuid annab aimu ka artiklite autorite taustast (nt sõna „professor“ näol) ning sagedasest viitamisest teadusuuringutele. Teiste seas esineb ka välispoliitikale keskenduv teema, sisaldades geograafilisi viiteid Euroopale, Hiinale ja Venemaale.

JOONIS 6. Riigikogu Toimetiste märkimisväärsed teemad 2020–2024.

Joonis 6
Allikas: autorite arvutused

Põhjuseks võib olla Euroopa Liidule pühendatud ajakirja number, samuti Venemaa agressioon Ukrainas. Viimase kümnendi teemad jätkavad juba eelnevalt esinenud teemasid – endiselt on olulised teadusega seotud märksõnad ning järjest enam ka välispoliitika ja rahvusvahelised suhted.

Endiselt on olulised teadusega seotud märksõnad ning järjest enam ka välispoliitika ja rahvusvahelised suhted.

„PARLAMENTAARSETE UUDISTE“ RUBRIIGIS MAINITUD RIIGID

Rubriigis „Parlamentaarsed uudised“ kajastatakse välisriikide parlamentide seadusandlikku tegevust. Sisu loomisel kasutatakse nii parlamentide kodulehti kui ka uudisteagentuuride ja meediaväljaannete materjale. Riigikogu Toimetiste ajakirja kontekstis saab huvi erinevate riikide parlamentide tegevuse vastu uurida riikide esinemissageduse kaudu rubriigis „Parlamentaarsed uudised“. Kokku mainitakse rubriigis 138 riiki, seega on enamike maailma riikide parlamenditöö Riigikogu Toimetistes vähemalt korra esindatud.

Kõige enam mainitud riigid (sh nende koosseisu kuuluvad piirkonnad):

  • Suurbritannia ja Põhja-Iiri Ühendkuningriik (Ühendkuningriik + Šotimaa + Gibraltar) – 52 mainimist
  • Venemaa Föderatsioon (Venemaa + Tatarstan) – 46 mainimist
  • Prantsuse Vabariik (Prantsusmaa + Korsika) ja Leedu Vabariik – mõlemad 44 mainimist
  • Saksamaa Liitvabariik ja Läti Vabariik – mõlemad 41 mainimist
  • Ukraina – 38 mainimist

Edetabelist nähtub, et kõige enam on mainitud Euroopa riike ja Venemaad. See on ka üsna oodatav tulemus, sest suurem tähelepanu on lähiriikidel ja maailma suurriikidel. Esikohta hoiavad Ühendkuningriigi parlamendi uudiseid, kuigi tulemus on mõneti tinglik, sest siia on arvestatud ka Šotimaa ja Gibraltari parlamentide mainimised. Üllataval kombel ei ole Ameerika Ühendriigid edetabeli tippu jõudnud. Hoolimata fookusest Euroopale on parlamendiuudiste rubriigis esindatud kõik maailmajaod. Näiteks on 16 korda kirjutatud Kõrgõzstani parlamendist, viis korda on mainitud Bangladeshis toimuvat ja ühe korra Paapua Uus-Guinea uusi poliitilisi suundi.

Joonis 7
Allikas: autorite arvutused

Eesti Rahvusraamatukogu digilabor

RaRa digilabor ühendab humanitaarteaduste andmeid infotehnoloogia meetoditega, et uurida digiteeritud või digitaalsena sündinud kultuuripärandit. Digilabori eesmärk on muuta rahvusraamatukogu digiaines paremini kättesaadavaks ja hõlpsamini kasutatavaks. Digilabori veebilehel https://digilab.rara.ee/ on võimalus tutvuda rahvusraamatukogu andmestike ja nende põhjal loodud tööriistadega. Peale selle saab digilaboris lugeda kultuuriandmete ja digimeetodite ühendamisel sündinud andmelugusid, mille abil on võimalik näha eesti kultuuri avastamata mustreid.

KASUTATUD ALLIKAS

Tagasiside