Nollakohta: Kuinka Bayesin kaava pelastaa noutajan, tutkijan ja siinä sivussa maailman

(Yumi/Flickr. CC-BY-NC 2.0.)

Kuvittele vastikään uunista vedetty, lämpöä, makeutta ja rakkautta hehkuva pellillinen vastustamattomia kaurakeksejä. Hetken keittiöstä poissa oltuasi huomaat, että pelliltä on kadonnut muutama suupala. Talossa on lisäksesi kaksi kolmevuotiasta: yksi labradorinnoutaja ja yksi ihmislapsi. Kumpaa syyttäisit?

Astut hieman lähemmäs rikospaikkaa ja huomaat pöydän eteen siirretyn tuolin. Labradori yltäisi pöydälle ilmankin, lapsi ei. Kumpaa nyt syyttäisit?

Kävelet naapurihuoneeseen, jossa lapsi pitää kädessään tuoretta kaurakeksiä, kovin läheisesti kadonnutta muistuttavaa sellaista. Kumpaa nyt syyttäisit?

Ihmisen arkinen päättely perustuu hypoteesien päivittämiseen havaintojen pohjalta. Aluksi lapsi ja koira voivat olla yhtä todennäköisesti syyllisiä, mutta tuoli on vahva aihetodiste ja rysän päältä kiinni jääminen sinetöi tapauksen. Tällainen ajattelu on kovin luonnollista. Saman voi pukea myös matemaattisempaan muotoon, ja silloin puhutaan bayesilaisesta päättelystä. Tässä on yksi työkalu täydentämään viimekertaisia p-arvoja.

Alussa on hypoteesi. Tämä hypoteesi ei voi olla satavarmasti tosi, koska silloinhan sitä ei tarvitsisi koetella. Sen sijaan sillä on jokin todennäköisyys: koira on vaikkapa varastanut keksin 60 % todennäköisyydellä.

Sitten käsittelyyn otetaan ensimmäinen todiste. Jos koira olisi varastanut keksin, tapahtumapaikalla ei luultavasti olisi tuolia. Sen sijaan jos lyhytkasvuinen lapsi olisi syyllistynyt luvattomaan keksin haltuunottoon, tuoli todennäköisesti liittyisi tapaukseen. Ja kuten aineisto osoittaa, tuoli todella on paikalla.

Tuoli on siis aihetodiste lapsen syyllisyyden puolesta. Seuraavaksi lisätään ripaus matematiikkaa ja arvioidaan todennäköisyydet tuolin läsnäololle kummassakin tapauksessa. Ideaalisessa tapauksessa nämä olisi arvioitu jo ennen tapahtumaa aiemman tiedon pohjalta, mutta keittiöoikeudessa se olisi yliampuvaa. Siksi turvaudutaan arvauksiin: koira käyttäisi tuolia todennäköisyydellä $P(\text{tuoli, kun koira}) = 0.1$ ja lapsi tekisi saman todennäköisyydellä $P(\text{tuoli, kun lapsi}) = 0.9$.

Seuraavaksi, yllätys yllätys, sijoitetaan lukuja kaavaan. Kyseisen kaavan tausta on 1700-luvulla ja se on saanut nimensä Thomas Bayesilta. Kuten kaikki parhaat matemaattiset kaavat, sekin on aika helposti johdettavissa — harjoitustehtävä lukijalle — ja toimii luotettavasti joka kerta. Tässä esimerkissä se ottaa tämänkaltaisen muodon:

\[ \begin{align*} P(\text{koira, kun tuoli}) &= \frac{P(\text{tuoli, kun koira}) P(\text{koira})}{P(\text{tuoli, kun koira}) P(\text{koira}) + P(\text{tuoli, kun lapsi}) P(\text{lapsi})}\\ &= \frac{0.1 \cdot 0.6}{0.1 \cdot 0.6 + 0.9 \cdot (1 - 0.6)}\\ &\approx 0.14. \end{align*} \]

Alkuoletus koiran syyllisyydelle oli 60 %, mutta tuolin havaitsemisen myötä todennäköisyys tippui 14 prosenttiin. Parasta tässä on se, että saman voi toistaa: otetaan uudeksi alkuoletukseksi 14 % ja arvioidaan todennäköisyys löytää keksi lapsen kädestä kummassakin tapauksessa. Yksi kaavaansijoitus ja eiköhän tämä tapaus ole taputeltu.

Labradorinnoutaja kurkistaa pöydän alla ja on siinä sivussa kaataa tuolin.

Bayesin kaava siis heijastelee ihmisen arviointiprosessia. Alkuoletus, todiste sen puolesta tai vastaan, uusi todennäköisyys alkuoletukselle, toista. Tietenkään tämäkään kaava ei muuta vettä viiniksi eikä arvauksia faktoiksi, mutta sillä on tehokas ominaisuus. Jos kaavaan sijoitetut todennäköisyydet ovat edes sinnepäin, toistojen kertyessä lopputulos lähestyy todellista arvoa.

Koska kaava on tämän lisäksi helposti laajennettava, moni tekoälyksi laskettava menetelmä pohjautuu siihen. Arkinen esimerkki on roskapostin automaattinen tunnistaminen: lähtötietoina on muun muassa eri sanojen suhteelliset osuudet spämmissä ja normipostissa, mitä sitten verrataan viestin tekstiin. Myös omaa arviointiprosessiaan voi parantaa menetelmän avulla.

Nate Silverin erinomainen kirja Signaali ja kohina (lukuvinkki) tarjoaa runsaasti esimerkkejä. Kuvitellaan esimerkiksi positiivinen löytö nuoren naisen rintasyöpäseulonnassa. Ensimmäinen reaktio saattaisi olla järkytys, mutta tarkempi ajattelu lohduttaa: Kyllä, valtaosalla todellisista potilaista ja vain pienellä osalla (2–3 %) terveistä on positiivinen tulos. Kuitenkin nuorella iällä terveitä on valtavasti sairaita enemmän, joten Bayesin kaavan mukaan kyseessä luultavasti on väärä hälytys. Juuri tästä syystä seulontaan kutsutaan vasta yli viisikymppisiä.

Palataan viime kerran yksinkertaistukseen tieteellisestä tutkimuksesta. Kolikkoa heittämällä yritimme selvittää, onko kyseinen lantti mystisesti kirottu tai muuten vain väärennetty. Kaikilla kymmenellä heitolla kolikko laskeutui kruunalle. Laskimme p-arvon, mutta epäselväksi jäi, onko tulos luotettava. Bayesilainen tutkija tekisi näin:

Kuten viimeksi todettiin, tavallinen kolikko tuottaa kymmenen kruunaa todennäköisyydellä $1/1024$.
Jos kolikko on kirottu tai tökerösti väärennetty, se laskeutuu joka kerta kruunalle. Silloin kymmenen kruunan todennäköisyys on $100~\%$.
Tilastojen mukaan noin yksi miljoonasta eurokolikosta on väärennetty. Oletetaan, että kirottuja on saman verran, yhteensä siis kaksi miljoonasta.

Sitten vain paukautetaan luvut Bayesin kaavaan:

\[ P(\text{kirottu, kun kruunat}) = \frac{P(\text{kruunat, kun kirottu}) P(\text{kirottu})}{P(\text{kruunat, kun kirottu}) P(\text{kirottu}) + P(\text{kruunat, kun tavallinen}) P(\text{tavallinen})}, \]

ja tulokseksi saadaan noin 0,2 prosenttia. Vaikka todisteet puhuvatkin epämääräisen kolikon puolesta, todelliselle kolikolle sattuva sattuma on alkuoletuksen mukaan tätä vaihtoehtoa paljon yleisempi. Tarvittaisiin siis lisää todisteita.

Yksi ilmeinen tapa on toistaa koe ja katsoa, saadaanko sama tulos. Tämä on sama juttu kuin kolikon heittäminen kahdestikymmenesti, ja tuloksena on, että kolikossa on jotain mätää kahden kolmasosan todennäköisyydellä.

Viimeksi mainitsin, että p-arvo väärinkäsitetään helposti väärän positiivisen todennäköisyytenä. Nyt meillä on oikeaa tietoa. Pienellä yhtälönratkaisulla saadaan, että 24 kruunan putken myötä kolikko on kummallinen 95 % todennäköisyydellä. P-arvona se ei ole 0,05 vaan 0,00000005. Kuten tavataan sanoa, hämmästyttävät väitteet vaativat hämmästyttäviä todisteita. (Ja silti voi käydä huono tuuri, kuten Monte Carlossa taannoin huomattiin.)

P-arvojen ongelma oli, etteivät ne kerro väitteen uskottavuudesta. Bayesilaisella päättelyllä on mahdollista valita järkevä rajapyykki, kunhan pystyy etukäteen arvioimaan eri skenaarioiden uskottavuuksia. Tässä on siis yksi hyvä lisä niin tieteentekijän kuin arkisen arvioijan arsenaaliin.

2 kommenttia:

Anonyymi04 maaliskuuta, 2018 15:07
Ihanan piristävä löytö, kun yritin pääsykokemateriaalin tueksi löytää lisämateriaalia Bayesin kaavaan. Nyt ainakin ymmärsin asian. :D
Taidan jäädä lukemaan tätä blogia enemmänkin.
VastaaPoista
Vastaukset

Lisää kommentti

Kommentit ovat moderoituja — yritän hyväksyä kommenttisi mahdollisimman pian. Voit kirjoittaa kommenttiin LaTeX-koodia tai yksinkertaista HTML-merkintää: lue lisää Kommentointi-sivulta.

torstai 11. tammikuuta 2018

Kuinka Bayesin kaava pelastaa noutajan, tutkijan ja siinä sivussa maailman

2 kommenttia: