tiistai 31. maaliskuuta 2020

Matemaatikkona työelämässä: Tutkimusavustaja, INAR

Työpöytä toimistossa, pöydällä läppäri, näyttö ja kirjoja.

Olen ollut nyt pari kuukautta töissä, tarkemmin sanottuna siviilipalveluksessa, Helsingin yliopiston Ilmakehätieteiden tutkimuskeskus INARissa. (Keskus ei kuitenkaan sijaitse Inarissa.) Vaikka henkilöstöhallinnolle olenkin siviilipalvelusmies, varsinainen työnkuvani on tutkimusavustaja.

Pari vuotta takaperin kirjoitin siitä, millaista on olla ohjelmistokehittäjänä sädehoidon parissa. Nyt vuorossa olisi yksi kuvaus työstä yliopistolla. Pidin viikon ajan päiväkirjaa tekemisistäni, ja tulokset ovat alla. En helmikuussa tätä ideoidessani arvannut, että työskentelisin koko viikon kotona – mutta samapa se, minkä pöydän ääressä nakuttaa läppäriä. Ehdinkin jo hetken nauttia työn ja vapaa-ajan erosta, jota opiskellessa on vaikea saavuttaa...

Yleiskuva

Tutkimusavustaja on akateemisen urapolun ensimmäinen askel. Tutkimusprojekteissa mukana olevat kandi- ja maisteriopiskelijat ovat yleensä tämän nimikkeen alla. Tohtorintutkintoa suorittavat jatko-opiskelijat kantavatkin jo seuraavaa (ja hieman paremmin palkattua – eikä edes puhuta omasta päivärahastani) titteliä.

INAR on kolmatta sataa henkeä työllistävä tutkimusyksikkö. Se toimii fysiikan ja ympäristötieteiden välimaastossa; minun varsinainen työpöytäni on Kumpulan kampuksella eli lähempänä fyysikoita. Työskentelen ilmakehän luonnollisten pienhiukkasten parissa. Ihmiskunnan taivaalle tuuttaamien päästöjen lisäksi pieniä hiukkasia syntyy jatkuvasti luonnossa, esimerkiksi metsissä. Metsän tuoksu on vähemmän romanttisesti ilmaistuna kokoelma monoterpeenejä ja muita orgaanisia molekyylejä.

Näiden hiukkasten syntyä on alettu ymmärtää paremmin vasta tällä vuosituhannella. Merkitystä niillä on, koska kasvaessaan hiukkasista tulee tiivistymisytimiä vesipisaroille, jotka muodostavat pilviä. Kyseessä on siis yksi osa palapeliä, jota myös ilmastoksi kutsutaan. Hyytiälän metsäntutkimusasemalla Juupajoella on 125-metrinen torni, jossa näiden hiukkasten syntyä on mitattu kohta neljännesvuosisadan ajan.

Minähän en ole fyysikko. Yliopistotason fysiikan opintoja minulla on takanani tasan nolla tuntia. Työni onkin olla tilastotieteilijä siinä määrin, minkä luonnontieteiden kandidaatin tutkinto matematiikassa, tilastotiede sivuaineena, mahdollistaa. Olen kuitenkin lueskellut sen verran kirjallisuutta, että tajuan tutkimusalan perusteet; illat Lapinjärvellä kun olivat pitkiä...

Maanantai

Läppäri, jonka päällä pino muistilappuja.

8:10. Siirryn keittiöstä olohuoneeseen ja aloitan uuden työviikon kirjoittamalla tehtävälistan. Tapoihini kuuluu pitää sekä viikottaista päiväkirjaa että päivittäisiä tehtävälistoja. Yleisesti ottaen ajatuksia on hyvä kirjata ylös myöhempää käyttöä varten. Laboratoriotöissä päiväkirjat noudattavat erittäin tarkkaa kaavaa, jotta tulokset voidaan tarkistaa myöhemmin. Matemaatikoita ei tietenkään päästetä lähellekään labraa, joten omat merkintäni ovat vapaamuotoisempia. Selailen läpi myös yliopiston intranetin otsikot.

8:30. Kirjaudun INARin uuteen Slack-työtilaan, jonka tarkoitus on toimia virtuaalisena kahvihuoneena. Protokollan mukaisesti sieltä löytyy kanava lemmikkikuville. Kanavien joukosta löytyy pari myös tieteelliselle keskustelulle, mutta ne ovat hiljaisempia.

10:10. Taukojumpan aika. Olen piirrellyt paljon kuvaajia viime perjantaina ajamastani analyysista.

Tutkimusprojektinani on selvittää, sopisiko eräs tilastollinen menetelmä muuttujien välisten yhteyksien havaitsemiseen meidän datassamme. Sitä varten olen ohjelmoinut viime viikot Python-kielistä työkalua. Nyt välineet alkavat olla kunnossa ja ohjelmointityö on enemmän pienten skriptien kirjoittamista datan siistimiseen, analysointiin ja piirtämiseen.

Koodia ja kuvaajia tietokoneen ruudulla.

14:00. Ryhmäpalaveri. INAR on jakautunut pienempiin ryhmiin eri teemojen ympärille. Meidänkin ryhmässämme tehdään silti hyvin monenlaista tutkimusta. Kukin kertoo vuorollaan, mitä on parina viime viikkona tehnyt, ja käymme läpi tulevia (tällä kertaa lähinnä peruttuja) konferensseja ja rahoitushakuja.

Tiistai

10:00. Olen puolisoni kanssa S-Marketissa. Näinä aikoina tällainen jousto ei yllätä ketään, mutta yleensäkin akateemiset työajat ovat hyvin vapaasti määriteltyjä. Itse asiassa yliopiston varsinaisilla tutkijoilla on vuosityöaika: vuoden aikana pitää tehdä tietty tuntimäärä ja omille luennoille olisi hyvä ilmestyä – muuten tapa on vapaa. Sivarina minulla on viikkotyöaika ja pidän näpit irti työkoneesta virka-ajan ulkopuolella. En tiedä, pystyisinkö jatko-opiskelijana samaan; toivottavasti.

13:00. Taas etäkokouksessa, tällä kertaa kolmen hengen kesken. Juttelemme tutkimusprojektin edistymisestä ja ideoimme, mitä seuraavaksi kannattaisi tehdä. Menetelmä vaikuttaa lupaavalta, mutta tulokset eivät vielä vakuuta. Vuodenaikojen ja säätilojen vaihtelu peittää alleen vielä todellisen "signaalin". Saan myös pari muuttujaa lisättäväksi aineistooni.

16:00. Käsittelen saamaani dataa. Datan siistiminen on tilastotieteen ylivoimaisesti vähiten hohdokas osa. Se on myös se osa, johon menee suurin lohko ajasta. Aineistossani muuttujia mitataan eri aikavälein: joitakin minuutin ja joitakin kuuden välein, joitakin ihan milloin sattuu. Olen tehnyt skriptin, joka tuottaa niistä rivit tasan kymmenen minuutin välein. Uusista muuttujista toinen solahtaa mukaan ilman mitään vaikeuksia, mutta toinen ei sisälläkään sarakkeita Year–Month–Day vaan paljon "loogisemmat" X2.1–X2.2–X2.3. Nimeän ne uudelleen.

16:37. Skripti kaatuu johonkin täysin mystiseen virheeseen. Turhaudun. Ei kun lueskelemaan.

Matemaatikon pää kohtaa pöydän.

Keskiviikko

9:00. Virkeämmin silmin saan selville, mikä aiheutti eilisen ongelman. Jostain täysin tuntemattomasta syystä osa havainnoista on tiedostossa kahteen kertaan. Lisään skriptiin rivin, joka poistaa kaksoiskappaleet tästä muuttujasta, ja nyt ulos tulee tiedostollinen havaintoja tasavälein ja järkevästi nimetyin sarakkein.

10:00. Pistän analyysiskriptin pyörimään uusin datoin. Analyysi varaa seuraavat pari tuntia työläppärini kokonaan. Laitoksella olisi kyllä palvelimiakin, joille tehtävän voisi lähettää, mutta kukapa ei pitäisi parin tunnin kahvitauosta?

...Ei vais, oikeasti käytän ajan lueskellen. Tutkimustyöhön kuuluu lukeminen, sekä oman alan artikkelien seuraaminen että menetelmiin perehtyminen. Nyt toteutan jälkimmäistä. Seuraan erästä kiinnostavaa tilastotieteen kurssia, josta on hyötyä varsinkin tulevissa projekteissa ja osin tässäkin. Siviilipalveluksen sääntöjen mukaan en saa saada työstä opintopisteitä, joten teen tehtäviä erikseen vapaa-ajallani.

Yhden läppärin ruutu on täynnä komentorivejä, toinen näyttää sinistä ruutua.

10:10. Tai siis, olisin ladannut uusimmat materiaalit e-kirjalleni, mutta myös omalla läppärilläni on näköjään keskiviikko.

15:00. Yleensä kävisin hakemassa kupin teetä ja tuoreimmat kuulumiset tilastotieteen opiskelijahuone Survomosta, nyt se ei tietenkään onnistu. Vaikka identifioinkin itseni matemaatikoksi, olen juurtunut paremmin tilastotieteilijöiden seuraan. Eikä ulkonäon kannata antaa pettää: olen käynyt ehdottomasti kovimmat matemaattiset keskusteluni juuri Survomossa. Tietenkään useimmat aiheet eivät ole yhtä henkeviä...

Torstai

8:40. Neljän seinän sisällä oleminen alkaa hieman painaa. Aamu käynnistyy vähän hitaasti seuraavia tehtäviä suunnitellen.

11:00. Teen tilastollista analyysia varsinaisen työn tueksi. Käyttämäni menetelmä on luonnostaan hieman epätarkka; siihen liittyy tavallaan mittausvirhe. Simuloin erilaisia aineistoja, joiden pitäisi tuottaa nollaa, ja selvitän, minkä suuruisia lukuja menetelmä antaa milläkin otoskoolla. Tällä tavoin saan vähän apua varsinaisten tulosten tulkintaan.

13:00. Selailen latinaa lukeneen puolisoni kirjahyllystä Plinius nuoremman (n. 63–113 jaa.) Kirjeitä. Kirjassa on ainoa säilynyt kuvaus Pompejin tuhosta. En voi olla miettimättä, onko kahdentuhannen vuoden päästä tämä teksti ainoa aikalaiskuvaus koronaviruksesta.

14:15. Akateeminen vartti pätee myös virtuaalisesti. Suuri osa yksiköstä on kokoontunut seminaariin. Seminaari on akateemisen tiedonvälityksen yksi muoto: viikon tai parin välein pidettävä luento jostain ajankohtaisesta aiheesta. INARin seminaareissa puhutaan tutkimuskysymyksistä, opiskelijaseminaarissa on lyhyempiä esityksiä eri aiheista ja itse seuraan myös tilastotieteen seminaaria.

Tavallisesta poiketen aihe ei tänään ole tieteellinen vaan koskee pandemian vaikutuksia työntekoon. Akateeminen työ on kansainvälistä: tutkijat reissaavat pitkin palloa konferenssien ja yhteistyön merkeissä. Meillä kysymyksiä herättää myös matkustaminen Suomen sisällä tutkimusasemille. Kaikki opetus on siirtynyt verkkoon muutaman päivän varoitusajalla ja tenttien järjestäminen mietityttää.

Yksikön johtaja demonstroi etätyön haasteita tippumalla linjoilta useampaan otteeseen.

Läppärin kannessa on sydäntarra, jossa lukee DATA, sekä etualalla kumiankka.

Perjantai

8:45. Olen kerännyt tämän päivän täyteen ohjelmointihommia. Tehtävälistalla olisi selkeyttää työkalun paria virheilmoitusta ja laajentaa yhtä ominaisuutta paljon isommaksi. Siispä kuulokkeet päähän ja musiikki soimaan! Jostain syystä kuuntelen musiikkia lähes pelkästään ohjelmoidessani. C418:n Excursions on ollut jo monen koodirivin taustalla.

Yritän olla mahdollisimman ammattimainen ohjelmoija myös yliopistolla. Se tarkoittaa muun muassa, että ennen kutakin koodimuutosta lisään pienen testitapauksen. Alkuun testi ei mene läpi, sitten teen muutokseni, ja nyt testin pitäisi onnistua. Kun jokaista toimintoa vastaa testi, voin luottaa siihen, etteivät muutokseni riko mitään. Samalla testikokoelma toimii esimerkkinä siitä, miten työkalua käytetään. Tavoitteeni on, että projektin lopuksi voimme julkaista tulosten lisäksi helpon ja toimivan työkalun muidenkin käyttöön.

Mitä kumiankkaan muuten tulee, se on ohjelmoijien perinnettä: Hankala ongelma ratkeaa usein sillä, että sen selittää kollegalle ääneen. Ja jos kollegaa ei ole käden ulottuvilla, samaan tulokseen pääsee selittämällä pulmansa kumiankalle. Tahtoo sanoa, juttelen kumiankalle ihan ilmankin eristystä ulkomaailmasta.

10:15. Pienet parannukset tehty. Lataan päivitetyn version koodista pilveen. Automaattinen prosessi ajaa kaikki testit läpi useammassa eri ympäristössä, jotten joutuisi "se toimii minun koneellani"-tilanteeseen. Ehdin jaloitella hetken, kunnes ruudulle ilmestyy viesti: kaikki muutaman kymmentä testiä onnistuivat niin Linuxilla kuin Macillakin. Siirryn tekemään suunnitelmaa isompaa ominaisuutta varten.

13:50. Työ etenee, mutta hitaasti. Muutan aiemmin kolmiulotteisessa avaruudessa toiminutta koodia käsittelemään kuinka montaa ulottuvuutta tahansa. Ohjelmointia tuntevat voivat miettiä, miten kolme sisäkkäistä for-silmukkaa muutetaan mielivaltaisen moneksi sisäkkäiseksi silmukaksi. Vaihdan musiikin raskaampaan genreen.

16:00. Koodi toimii mutta törkeän hitaasti. Kirjoitan jäljellä olevat jutut ja parannusideat muistiin maanantaiksi ja siistin vielä langanpäitä kasaan.

17:02.30. Lähden töistä (olohuoneesta).

17:02.35. Saavun kotiin (keittiöön). Viikonloppu!

Lopuksi

Tämä viikko oli hyvin tyypillinen esimerkki kahdesta viime kuukaudestani. Siihen mahtui niin ohjelmointia, analysointia, opiskelua kuin keskustelua. Soveltavissa luonnontieteissä ohjelmointi on käytännössä pakollinen taito. Työkalujen kehittäminen sopii minun kiinnostuksiini, mutta valtaosaan riittää yhdistellä olemassaolevia palikoita. Datan siistiminen, analyysi ja selkeiksi kuviksi saattaminen on olennainen osa nykytiedettä, eli myös tilastotiede on välttämättömyys.

Aivan ehdoton taito on kommunikointi, jonka merkitys korostuu erityisesti etätyössä. Ei riitä, että itse näkee kuvioita tuloksissaan. Niistä pitäisi osata viestiä myös kollegoille ja projektin lopussa myös kaikille muille alan tutkijoille. Tutkimuksen lopullisista rahoittajista eli veronmaksajista puhumattakaan – ja toivottavasti tämä oli kiinnostava välähdys täältä ruohonjuuritasolta!

2 kommenttia:

  1. Kirjoitat edelleen hyvin mielenkiintoisesti, mutta aiheet alkavat olla lukiomatikan tasoiselle hieman liian edistyneitä. Koitahan myös saada niistä valmiista aiheista kirjoitettua, kyllä edelleen lukijoita on!

    VastaaPoista
    Vastaukset
    1. Kiitos palautteesta! Olen ihan samaa mieltä siitä, että tasapaino aiheiden kanssa on vaikeaa, itse kun sokeutuu matikan tasolle. Toinen pulma on ajan löytäminen kirjoittamiselle (etenkin kun viettää jo työpäivänsä tietokoneen ääressä), mutta eiköhän sekin järjesty. Ongelma on tiedossa!

      Poista

Kommentit ovat moderoituja — yritän hyväksyä kommenttisi mahdollisimman pian. Voit kirjoittaa kommenttiin LaTeX-koodia tai yksinkertaista HTML-merkintää: lue lisää Kommentointi-sivulta.