sunnuntai 14. maaliskuuta 2021

Paljon iloa osittaisintegroinnista

Pitkän matematiikan oppimäärä yllättää. Mikä aikanaan oli vain näppärä temppu vaikeiden laskujen laskemiseen, onkin avain todella nerokkaaseen ja kauniiseen teoriaan.

Tai ainakin yllätti. Niin pitkälti kuin minä tiedän, oppikirjoissa ei enää puhuta tästä kaverista. Pitkää matikkaa, kuten montaa muutakin ainetta, on viime vuosina kevennetty. Käsinlaskemista on korvattu ohjelmistojen käyttämisellä, joten tätäkään työkalua ei enää tarvita.

Kyse on siis osittaisintegroinnin kaavasta

\[ \int_a^b f(x)g'(x) \,\mathrm dx = \bigg/_{\hspace{-0.6em}a}^{\,b} f(x)g(x) - \int_a^b f'(x)g(x) \,\mathrm dx. \]

Siis mikä, ja miksi tästä on valtavasti iloa?

(Varoituksen sanana: tässä tekstissä pyöritellään integraaleja. Ensi kerralla taas helpompaa kamaa!)

Vaikeiden laskujen helpottaja

Kaava itsessään näyttää hirveän abstraktilta, joten otetaan alkuun esimerkki. (Jos integrointi ei ole tuttua, tämä esimerkkikään ei välttämättä valaise liikaa. Integroinnissa on siis kyse funktion kuvaajan alle jäävän pinta-alan laskemisesta.)

Otetaan funktioksi vaikka $x e^x$. Tämän integroiminen on pelkän määritelmän avulla aika toivotonta. Osittaisintegroinnin idea on, että funktio jaetaan kahden funktion – tässä $x$ ja $e^x$ – tuloksi. Jos toinen näistä on tutun funktion derivaatta, niin derivoinnit voidaan vaihtaa päikseen.

Tässä esimerkissä $e^x$ on derivaatta funktiosta nimeltä $e^x$. Aika helppoa. Derivaatan vaihto antaa meidän derivoida funktiota $x$, ja sen derivaatta on tutusti $1$. Tällöin integraali saadaan muotoon

\[ \int_a^b x e^x \,\mathrm dx = \bigg/_{\hspace{-0.6em}a}^{\,b} x e^x - \int_a^b e^x \,\mathrm dx. \]

Oikealla puolella on sijoitus (tämä merkintätapa on muuten käytössä lähinnä Suomessa) sekä integraali, jonka jokainen integraalilaskennan kurssin käynyt osaa laskea. Lopputulokseksi saadaan

\[ b e^b - a e^a - e^b + e^a. \]

Mitä iloa tästä sitten on? No, valtaosa elämässä eteen tulevista integraaleista – ja niitähän tulee vastaan lähinnä jos olet luonnontieteilijä tai insinööri – vaatii järeämpiä aseita kuin lukiokurssilta tutut määritelmät. Näiden aseiden nimet ovat sijoitus, osamurtohajotelma ja osittaisintegrointi.

Niin, ja nykyaikana tietenkin Wolfram|Alpha, mikä lienee syy perinteisten tekniikoiden katoamiseen opetussuunnitelmasta.

Kuvitteellinen matikankirja, jonka kannessa Wolfram Alphan logo.

Miksi matemaatikko välittää?

Nämä laskukaavat ovat edelleen olennainen osa matemaatikon peruskoulutusta. Keksin äkkiseltään siihen ainakin kolme syytä.

Syy numero yksi: jonkun täytyy ohjelmoida se Wolfram|Alphakin. Yliopiston kirjastosta löytyy paksuja hakuteoksia, joissa on esitetty valtavasti erilaisia integroimis- ja summasääntöjä. Nämä olivat olennaisia käsinlaskemisen avuksi aikana ennen tietokoneita. Nyt on olemassa algoritmeja, jotka huolehtivat tästä työstä (jota kovin moni tuskin kaipaisi), mutta kuuluu ihan yleissivistykseen tietää kaavoista tärkeimmät.

Asia nimittäin on niin, että suuri osa matemaatikon koulutuksesta on intuition muodostamista. Toki opinnoissa on paljon substanssia, mutta harva muistaa yksityiskohtia kuin juuri omalta erityisalaltaan. Pointti onkin tietää, mistä etsiä. Todistuksista jää käteen nippu erilaisia lähestymistapoja ja tekniikoita.

Yllättävän moni näistä tekniikoista perustuu tutunnäköisen integraalin tunnistamiseen. Tätä voi olla vähän vaikea selittää, mutta näin se on ainakin minun erikoisalallani (matemaattinen analyysi eli nimenomaan derivaattojen ja integraalien kanssa nuhjaaminen).

Syy numero kaksi: totta kai insinöörihommat kannattaa tehdä laskimella, mutta matematiikassa on kyse suuremmasta. Tämä kaava toimii, vaikka $f$ ja $g$ olisivat täysin tuntemattomia. Sitä kautta voi lähteä ratkomaan, kuinka suuren arviointivirheen insinöörin laskuohjelma tuottaa, tai ratkaista vaikean kaavan nopeammin laskettavaan muotoon.

Vaikka tietokoneet ovat nopeita, kaavat kannattaa yhä pyöritellä helpommin laskettaviksi – muuten se koirankorvat lisäävä Snapchat-filtteri tarvitsisi pari minuuttia pähkäilyyn.

Syy numero kolme: osittaisintegroinnin kaavalla on syvä matemaattinen merkitys. Niin on yllättävän monella lukiomatikan asialla, vaikka sen tajuaakin vasta viisi vuotta myöhemmin.

Miten itseisarvoa derivoidaan

Tätä ihmettä varten meidän pitää loikata integroinnista derivointiin. Kuten kaikki varmasti muistavat, derivointi tarkoittaa hetkellisen kulmakertoimen määrittämistä, suomeksi sanottuna siis tangentin piirtämistä funktion kuvaajalle:

Mutta sitten on sellaisia pirskutin funktioita, joita ei voi derivoida. Vaikkapa itseisarvofunktio, jonka kärkeen voisi piirtää tangentin keikkumaan kuin lähimmän leikkipuiston keinulaudalla. (Jos lähimmässä leikkipuistossa keinulauta sattuu olemaan ylösalaisin.)

Itseisarvofunktiota ei voi derivoida origossa.

Tätä asiaa korosti muinoinen matikanopettajani.

Tämän asian sisäistimme niin, että jopa abivideossamme vitsailimme itseisarvofunktion derivoinnista.

Tälle väitteelle haistatan nykyään pitkät.

Kyllähän itseisarvofunktion derivointi on mielekästä. Nollan vasemmalla puolella derivaatta on $-1$. Nollan oikealla puolella derivaatta on $1$. Ja nollassa derivaatta on "mitä väliä".

Nyt abit tarkkana, tätä ei kirjoiteta yo-kokeeseen. Mainittu "mitä väliä" nimittäin on erittäin tarkasti spesifioitu "mitä väliä", jonka määrittelyyn tarvitaan pari kolme vuotta matematiikan yliopisto-opintoja. Jos väität yo-kokeessa mitään tässä mainittua, niin sinun on parempi vetää esiin perustelut Lebesguen mitasta ja $L^p$-funktioiden ekvivalenssiluokista.

Miksi "mitä väliä" on hyvin perusteltu? No, derivointi ja integrointi ovat toistensa vastakohtia. Ja jos integroimme funktiota

\[ f(x) = \begin{cases} -1,& x < 0,\\ 1,& x > 0,\\ \text{ihan sama},& x=0, \end{cases} \]

niin tulokseksi tulee $|x|$ (plus vakio). Koska integroinnissa on kyse pinta-alan määrittämisestä, ja $x=0$ on vain yksi piste, niin siinä kohdassa pinta-ala on $0 \cdot \text{ihan sama} = 0$.

Kuten sanottua, tämän määrittely matemaattisesti on vähän hienovaraisempaa. Ei mennä siihen.

Sen sijaan derivoidaan jotain vielä karmivampaa.

Miten jotain kamalaa derivoidaan

Otetaan uusiksi tuo edellinen kuva.

Minä väitän, että tätäkin funktiota voi derivoida.

Ja nyt siis tarkkana: derivaatta on kuvaajalle piirretty tangentti. Mutta origossa tuo kuvaaja tekee hypyn. Ei ole mitään kohtaa, mihin piirtää tangenttia! Olenko lopullisesti seonnut?

Vastaus: varmaankin, mutta fyysikot olivat jo sata vuotta sitten.

Tuon kuvaajan derivaatan pitää olla jotain, jossa on yhteen pisteeseen ängetty niin paljon "massaa", että pinta-ala kasvaa kahdella yksiköllä. Siis $0 \cdot \text{jotain} = 2$, jos sallit merkintöjen väärinkäytön.

Fysiikassa on yllättävän paljon tällaisia tilanteita. Otetaan esimerkiksi yksittäinen elektroni. Elektronilla on yhden yksikön suuruinen sähkövaraus, jonka vaikutusta ympäristöön on kiva laskea. Samaan aikaan elektronit ovat aivan hillittömän pieniä. Ne ovat paljon atomeita pienempiä, ja atomit vuorostaan ovat todella pieniä.

Miksi siis väittää elektronia aivan himputin pieneksi palloksi, kun kukaan ei voi edes nähdä sen muotoa? (Eikä edes mennä siihen, että nykytiedolla asia on vähän monimutkaisempi.) On kaikille helpompaa, jos se vain oletetaan pistemäiseksi.

Mutta sitten tulee ongelma. Jos elektronilla on sähkövaraus ja massa, mutta tilavuus nolla, niin tiheydeksi tulee ääretön. Ääretöntä ei voi käyttää laskuissa, kuten nollalla jakaessa huomasimme oikein hyvin.

Ja nyt, erittäin pitkällisen johdattelun jälkeen, osittaisintegroinnin kaava astuu takaisin näyttämölle. (Tšehovin sanoin: jos lavastukseen kuuluu osittaisintegraali, sillä pitää ampua jossain vaiheessa.)

Olkoon $f$ kiltein kuviteltavissa oleva funktio, sellainen lukiosta tuttu kaveri jota voi derivoida äärettömän monta kertaa. Ja olkoon $g$ tämä meidän problemaattinen kuvaajamme. Kaava meni siis näin:

\[ \int_a^b f(x)g'(x) \,\mathrm dx = \bigg/_{\hspace{-0.6em}a}^{\,b} f(x)g(x) - \int_a^b f'(x)g(x) \,\mathrm dx. \]

Katsotaan ihan ensiksi tuota sijoitusta. Sovitaan, että $a$ on nollaa pienempi ja $b$ nollaa suurempi. Nollan oikealla puolella kuvaaja on ykköstä, vasemmalla puolella miinus ykköstä. Siispä

\[ \bigg/_{\hspace{-0.6em}a}^{\,b} f(x)g(x) = f(b) \cdot 1 - f(a) \cdot (-1) = f(a) + f(b). \]

Entäs sitten tuo oikealla puolella oleva integraali? Siinä ei ole mitään pahaa. Koska $f$ on kiltein kuviteltava funktio, sitä voi derivoida, eikä kuvaaja ole hypystä huolimatta kovin hankala tapaus sekään. Äärettömyyksiä ei ole lähimaillakaan.

Mutta mitenkäs käy, kun $a$ ja $b$ menevät lähemmäs nollaa? Alue, jonka pinta-alaa lasketaan, käy aina pienemmäksi. Siksi oikeanpuoleinen integraali voidaan unohtaa. Sijoituksesta sen sijaan tulee

\[ f(a) + f(b) \to 2 \cdot f(0). \]

Nyt siis kaava väittää, että

\[ \int_a^b f(x)g'(x) \,\mathrm dx \to 2 \cdot f(0). \]

Sitten vielä viimeinen isku. Jos $f$ on kiltti vakiofunktio $1$, niin tällöin saadaan

\[ \int_a^b g'(x) \,\mathrm dx \to 2. \]

Löysimme siis tavan sanoa, että $g'$ on juuri se "jotain" kaavassa $0 \cdot \text{jotain} = 2$.

Tämä "jotain" on kaksi kertaa Diracin massa ($\delta_0$), joka on saanut nimensä kuuluisan fyysikko Paul Diracin (1902–1984) mukaan. Se on määritelty sellaiseksi joksikin, joka on yhden yksikön kokoisen hypyn derivaatta. Kuvaajalla siis

Nollassa nuoli jonnekin äärettömyyksiin.

Mutta nyt ne varoitukset. Kuten useampaan kertaan sanoin, $0 \cdot \text{jotain} = 2$ ei ole mahdollista. Diracin massa kuulostaa kaverilta nimeltä $\infty$, mutta ääretön ei ole luku vaan käsite ja vieläpä erittäin epämääräinen sellainen.

Abstraktia humpuukia taas kerran

Tämä derivaatta $g'$ ei nimittäin ole funktio. Ei ole mahdollista kirjoittaa $g'(0)$ ja odottaa saavansa jotakin lukua ulos. Pikemminkin $g'(f) = 2f(0)$, kuten kaavasta saatiin. Kyse on niin sanotusta yleistetystä funktiosta eli distribuutiosta: funktiosta joka ottaa sisäänsä funktion ja antaa ulos luvun (tietyin lisäehdoin).

Yksityiskohdat ovat toisen vuoden maisteritason matematiikkaa, ja siksi en niitä tässä esitä. Asia liittyy kuitenkin funktionaalianalyysiin, josta kirjoittelin syksymmällä (Vähän kaikki on vektoria).

Tätä teoriaa sovellettiin jo 1900-luvun alkupuolella, mutta lopullisen siistimisen hoiti ranskalainen Laurent Schwartz (1915–2002) 1950-luvulla. Hän sai piakkoin työstään Fieldsin mitalin, matematiikan ehkä arvostetuimman palkinnon.

Minun täytyy todeta, että palkinto taisi olla ansaittu. Vaikka teorian yksityiskohdat ovatkin hankalia, tulokset ovat erittäin kauniita. Kävin viime syksynä kurssin aiheesta, ja tämä teoria on ehdottomasti kauneinta näkemääni matematiikkaa (tähän mennessä).

Osittaisintegroinnin kaavan avulla kaikki kiltin funktion ominaisuudet siirtyvät vähemmän mukavalle funktiolle. Jos kilttiä funktiota voi derivoida äärettömän monta kertaa, niin voi derivoida mitä tahansa muutakin funktiota. Kääntöpuoli on, että tulos ei ole enää "oikea funktio" vaan jotain mutkikkaampaa.

Tätä teoriaa tarvitaan, koska matematiikka yksinkertaistaa maailmaa. Elektroni ei ehkä ole pistemäinen, mutta sitä voi arvioida sellaisena. Suuri osa fysiikassa ja insinööritieteissä tarvittavista yhtälöistä perustuu tällaisiin helpotuksiin. Schwartzin teoria sanoo, että yhtälöt todella toimivat silloinkin.

Joku voisi kysyä, että eikö riitä, että yhtälöt näyttävät toimivan käytännössä. Sellainen on joskus matemaatikon osa.

Ei kommentteja:

Lähetä kommentti

Kommentit ovat moderoituja — yritän hyväksyä kommenttisi mahdollisimman pian. Voit kirjoittaa kommenttiin LaTeX-koodia tai yksinkertaista HTML-merkintää: lue lisää Kommentointi-sivulta.