tiistai 8. toukokuuta 2018

Mitä on todennäköisyys?

Todennäköisyyksien yhteenlaskukaava.

Yksi ekan opiskeluvuoden absurdeimmista kokemuksista tapahtui tammikuussa. Oli aivan tavallinen luento, kurssin Todennäköisyyslaskenta I ensimmäinen. Luvassa oli kurssi, jonka ohjelmasta ainakin puolet olisi lukiosta tutun jutun kertaamista.

Niinpä luennoitsija riipusti taululle tuttuja todennäköisyyden ominaisuuksia: todennäköisyys on aina nollan ja ykkösen välillä, tapahtuman ja sen vastatapahtuman todennäköisyyksien summa on $1$, ja niin edelleen. Selvää tavaraa, vaikka useampi lukio-opettaja kannustaakin välttämään yo-kokeen todennäköisyystehtävää.

Sitten luennoitsija totesi, että matemaatikoina yliopistossa meitä toki kiinnostaa, mistä nämä ominaisuudet tulevat. Siispä hän alkoi kirjoittaa todennäköisyydelle oikeaa määritelmää (tässä tiivistettynä):

Olkoon kokoelma perusjoukon $\Omega$ osajoukkoja $\mathcal F$ sigma-algebra. Nyt kuvaus $\mathrm P : \mathcal F \to \mathbb R$ on todennäköisyys, jos
  1. $\mathrm P(A) \geq 0$ kaikilla $A \in \mathcal F$,
  2. $\mathrm P(\Omega) = 1$,
  3. jos $A_i \in \mathcal F$ kaikilla $i \in \mathbb N_+$ ja $A_i \cap A_j \neq \emptyset$ kun $i \neq j$, niin \[ \mathrm P \left( \cap_{i=1}^\infty A_i \right) = \sum_{i=1}^\infty P(A_i). \]
Kolmikko $(\Omega, \mathcal F, P)$ on todennäköisyysavaruus.

Mitä ihmettä juuri tapahtui? Äsken puhuttiin kivoista laskukaavoista, nyt jostain joukko-opin infernaalisesta serkusta!

Luennoitsija vieläpä lisäsi, että tämä on yksi tuoreimmista kandiopintojen aiheista. Suurin osa sisällöstä, muun muassa koko analyysi, on 1800-luvulla valmiiksi taputeltua. Vaikka todennäköisyyksien laskennan historia on yhtä pitkä, kunnon matemaattinen pohja alalle kehitettiin vasta 1930-luvulla mm. neuvostoliittolaisen Andrei Kolmogorovin toimesta.

Syy tähän on se, että todennäköisyyden perusteleminen yleisesti on kaikkea paitsi helppoa. Kaikki käytännön jutut kyllä onnistuvat, mutta matemaatikoille ei kelpaa yksityiskohtien ohittaminen raivokkaalla käsien heiluttelulla.

Otetaan esimerkki, joka havainnollistaa ongelmaa. Kaivetaan esiin mittanauha, mennään kadulle ja pysäytetään ensimmäinen vastaantulija. Kuinka suurella todennäköisyydellä valittu (ja hieman vaivaantunut) ihminen on 175 cm pitkä?

Terve, nyt mitataan!

175-senttisten ihmisten lukumäärä varmaan löytyy jostain tietokannasta, joten tehtävä ei ole kovin vaikea. Aika usein ihmisen pituus rekisteröidään sentin tarkkuudella, joten oikeammin kysymys on, onko uhrimme 174,5–175,5 senttiä pitkä.

Mutta lisätäänpä tarkkuutta. Vetäistään takataskusta kunnollinen mittalaite ja mitataan millin tarkkuudella. Nyt siis sallittu vaihteluväli on 174,95–175,05 senttiä. Selvästi todennäköisyys, että henkilö on millin tarkkuudella 175-senttinen on pienempi kuin sentin tarkkuudella leikittäessä.

Piipahdetaanpa sitten fysiikan laitoksella lainaamassa jokin huipputarkka ihmisenmittari ja metrologi sitä käyttämään. Millä todennäköisyydellä Satunnainen Henkilö on ihan tasan 175 senttimetriä pitkä?

METROlogi, ei meteorologi.

Sen perusteella, että todennäköisyys pienenee mittanauhan parantuessa, ei ole vaikea arvata oikeaa vastausta. Se on nolla. Saman ajatusleikin voi tietenkin toistaa mille tahansa pituudelle samoin tuloksin. Kuitenkin jokaisella ihmisellä on pituus[lähde?], joten pakkohan niiden lukujen on olla nollaa suurempia. Mikä on vialla?

Vaikeus johtuu kolmen asian yhdistelmästä: jokaisella pituudella on oltava todennäköisyys, äärettömän tarkasti mitattavia pituuksia on äärettömän monta, ja pituuksien todennäköisyyden summan pitää olla $1$. Tässä siis oikeastaan halutaan, että $\infty \times 0 = 1$.

Jo lukiossa tämä ongelma opitaan kiertämään tiheys- ja kertymäfunktioiden avulla. Tiheysfunktio on ei-negatiivinen funktio, jonka alle jäävä pinta-ala on tasan $1$. Kuitenkaan tiheysfunktion arvo jossakin pisteessä ei tarkoita kyseisen pisteen todennäköisyyttä — se voi jopa olla ykköstä suurempi.

Normaalijakauman tiheysfunktio.

Nyt kuitenkin meillä on pieni teoreettinen ongelma. Jos pituutta mitataan sentin tarkkuudella, jokaiselle pituudelle on todennäköisyys. Jos pituus ajatellaan jatkuvaksi suureeksi, täytyy pyöritellä tiheysfunktiota. Miten nämä kaksi lähestymistapaa voidaan yhdistää yhdeksi käsitteeksi nimeltä todennäköisyys?

Tässä kohtaa $\sigma$-algebrat astuvat kehään. Eri tapahtumat voidaan ilmaista joukkoina ja niiden todennäköisyys joukon mittana. Nyt kahdessa tapauksessa kyse onkin vain siitä, ovatko joukot äärellisiä vai äärettömiä. Ainoa ongelma kiinnostuneelle pikku matemaatikolle on se, että mitan käsite tulee vastaan matematiikan kandiohjelman viimeiseksi tarkoitetulla kurssilla.

Mitta ja integraali - suoraan hornasta!

Tämä on mielestäni yhtä aikaa todella kiehtovaa ja todella kauhistuttavaa. Suht helposti käsiteltävä, välillä jopa intuitiivinen, asia vaatiikin taustalleen valtavan raskasta matemaattista koneistoa, jonka perusteleminen on maisterikurssien juttu. Käytännössä kaikki muu lukiomatematiikka pystytään todistamaan ensimmäisen opiskeluvuoden aikana.

Samalla siinä kuitenkin on jotain kaunista. Helpotkin kysymykset voivat vaatia vaikeita vastauksia, ja matematiikka todella onkin kuin jäävuori, josta alkuun näkyy vain pieni osa. Kaikkein parasta on, että näihin kysymyksiin voi vastata. Ja siksi minut nähdään myös Todennäköisyyslaskenta kakkosella.

Ei kommentteja:

Lähetä kommentti

Kommentit ovat moderoituja — yritän hyväksyä kommenttisi mahdollisimman pian. Voit kirjoittaa kommenttiin LaTeX-koodia tai yksinkertaista HTML-merkintää: lue lisää Kommentointi-sivulta.