Differentiaali- ja integraalilaskenta 2

Site: Aalto OpenLearning
Course: Differentiaali- ja integraalilaskenta 2, kevät 2022 (Aalto MOOC)
Book: Differentiaali- ja integraalilaskenta 2
Printed by: Guest user
Date: Thursday, 21 November 2024, 4:11 PM

Description

Copyright Harri Hakula, Antti Rasila, Pekka Alestalo

Licence CC BY-SA

1. Käyrän parametrisointi

Parametrisointi

Muodollisesti käyrällä tarkoitetaan parametrisoitua joukkoa \(C\subset \mathbb{R}^n, n \geq 2\), joka voidaan esittää muodossa \[C=\lbrace \mathbf{r}(t) : t\in I\rbrace = \mathbf{r}(I) = \mathbf{r}\text{:n arvojoukko},\] missä \(I\subset\mathbb{R}\) on väli ja funktio \(\mathbf{r}\colon I\rightarrow\mathbb{R}^n\) on jatkuva. Vektoriarvoisen funktion \(\mathbf{r}\) jatkuvuus tarkoittaa, että sen kaikki koordinaattifunktiot ovat jatkuvia missä tahansa kantaesityksessä.

Funktio \(\mathbf{r}=\mathbf{r}(t)\) on eräs käyrän \(C\) parametrisointi ja \(I\) on tätä parametrisointia vastaava parametriväli. Väli \(I\) voi olla avoin \((a,b)\), suljettu \([a,b]\) tai puoliavoin \((a,b],\,[a,b)\).

Avaruuskäyrän (\(n=3\)) parametrisointi voidaan antaa muodossa \[\mathbf{r}(t)=(x(t),y(t),z(t)) \in \mathbb{R}^3, \text{ kun } t\in I.\] Vaihtoehtoisesti voidaan myös käyttää koordinaattimuotoa \[\mathbf{r}(t)=\begin{cases}x=x(t),\\y=y(t),\qquad t\in I\\z=z(t),\end{cases}\] tai vektorimuotoa \[\mathbf{r}(t) =x(t)\mathbf{i}+y(t)\mathbf{j}+z(t)\mathbf{k},\] jossa \(\mathbf{i}=(1,0,0), \mathbf{j} = (0,1,0),\) ja \(\mathbf{k}=(0,0,1)\) ovat \(\mathbb{R}^3\):n luonnolliset kantavektorit.

Edellä funktion \(\mathbf{r}\) jatkuvuus tarkoittaa siis koordinaattifunktioiden \(x,y,z\) jatkuvuutta parametrivälillä \(I\).

Huomautus. Samalla käyrällä on useita eri parametrisointeja. Miksi? Kuinka pääset yhdestä parametrisoinnista toiseen?

Esimerkki, suora tasossa

Kahden \(xy\)-tason pisteen \(P_0=(x_0,y_0)\) ja \(P_1=(x_1,y_1)\) kautta kulkeva suora voidaan parametrsioida \[\mathbf{r}(t) = \begin{cases} x(t)=(1-t)x_0+tx_1 \\ y(t)=(1-t)y_0+ty_1, \end{cases} \text{ kun } t\in I=(-\infty,\infty).\] Havaitaan, että \[\mathbf{r}(t=0)=(x_0,y_0)\quad \text{ ja }\quad \mathbf{r}(t=1)=(x_1,y_1),\] joten valitsemalla parametriväliksi \(I=[0,1]\) saadaan pisteitä \(P_0\) ja \(P_1\) yhdistävä jana.

Esimerkki, reaalifunktion kuvaaja

Jatkuvan funktion \(f\colon[a,b]\rightarrow\mathbb{R}\) kuvaaja \(y=f(x)\) voidaan ajatella \(xy\)-tason käyränä. Tämä käyrä voidaan parametrisoida \[\mathbf{r}(t) =\begin{cases} x(t)=t \\ y(t)=f(t), \end{cases}\] missä \(t\in[a,b]\). Tai vastaavasti vektorimuodossa \[\mathbf{r}(t) =x(t)\mathbf{i}+y(t)\mathbf{j}= t\mathbf{i}+f(t)\mathbf{j}.\]

Esimerkki, Helix-käyrä eli kierrejousi

Helix-käyrä eli kierrejousi voidaan parametrisoida \[\mathbf{r}(t)=\begin{cases} x(t)=a\cos t, \\ y(t)=a\sin t, \qquad t\in I \\ z(t)=bt, \end{cases}\] missä \(a,b > 0\) ovat parametreja. Parametri \(a\) on jousen säde ja parametria \(b\) voidaan ajatella jousen venymänä.

Vaihtoehtoisesti voidaan tietysti tässäkin käyttää myös vektorimuotoa \[\mathbf{r}(t)=x(t)\mathbf{i}+y(t)\mathbf{j}+z(t)\mathbf{k} =a\cos t\mathbf{i}+a\sin t\mathbf{j}+bt\mathbf{k}.\]

Suunnistus

Usein parametriväli on suljettu väli \(I=[a,b]\). On lisäksi mahdollista, että \(a < b\) tai \( b < a\).

Parametrisointi määrää käyrälle positiivisen suunnan, jolloin \(\mathbf{r}(a)\) on käyrän alkupiste ja \(\mathbf{r}(b)\) sen päätepiste. Käyrää, jonka alku- ja päätepiste ovat samoja kutsutaan suljetuksi.

Voidaan muodostaa myös vastakkainen parametrisointi, jossa käyrä pysyy samana, mutta sen kulkusuunta vaihtuu. Tällöin myös parametrisointiin liittyvät alku- ja päätepiste vaihtuvat toisikseen.

Esimerkiksi tapauksessa \(\mathbf{r}\colon[0,1]\rightarrow C\) vastakkainen parametrisointi \(\mathbf{r}_{-}\) saadaan helposti kaavalla \[\mathbf{r}_{-}(t)=\mathbf{r}(1-t), \quad t\in [0,1].\]

Esimerkki, ympyrän kehä tasossa

Olkoon \(P_0=(x_0,y_0)\) ja \(r_0>0\). \(P_0\)-keskisen ja \(r_0\)-säteisen ympyrän kehän parametrisoinniksi saadaan \[\mathbf{r}(t) =\begin{cases}x(t)=x_0+r_0\cos t,\\ y(t) = y_0+r_0\sin t.\end{cases}\] Jos halutaan parametrisoida koko kehä, voidaan parametrisointiväliksi valita esimerkiksi \([0,2\pi]\) tai \([-\pi,\pi]\). Lisäksi havaitaan, että \[\mathbf{r}(0)=\mathbf{r}(2\pi)=(x_0+r_0,0)\] ja \[\mathbf{r}(-\pi)=\mathbf{r}(\pi)=(x_0-r_0,0),\] joten käyrä on suljettu.

Suunnistus voidaan vaihtaa päinvastaiseksi korvaamalla \(t\mapsto -t\) parametrisoinnissa. Tällöin \(\cos(-t)=\cos t\), \(\sin(-t)=-\sin t\) ja \[\mathbf{r}_{-}(t)=\begin{cases}x(t)=x_0+r_0\cos t,\\ y(t)=y_0-r_0\sin t.\end{cases}\]

Implisiittinen muoto

Tasokäyrän yhtälö voidaan usein ilmaista myös implisiittisessä muodossa \(F(x,y)=0\), missä \(F\) on jokin kahden muuttujan lauseke. Konkreettisia esimerkkejä ovat funktion kuvaaja \(y=f(x)\), joka voidaan määritellä muodossa \(F(x,y)=y-f(x)=0\), ja \(R\)-säteinen ympyrä \(F(x,y)=x^2+y^2-R^2=0\).

Huomautus. Yhtälön \(F(x,y)=0\) määräämä tasojoukko ei ole läheskään aina tasokäyrä. Esimerkiksi, jos \(A\subset\mathbb{R}^2\) on mikä tahansa suljettu tasojoukko (reunapisteet kuuluvat joukkoon), niin funktio \[F(x,y)=\text{ pisteen } (x,y) \text{ pienin etäisyys joukosta } A\] \[=\min\big\{\sqrt{(x-x_0)^{2}+(y-y_{0})^2} : (x_{0},y_{0})\in A\big\}\] on jatkuva, mutta yhtälö \(F(x,y)=0\) esittää koko alkuperäistä joukkoa \(A\).

Käyrän tangentti

Tarkastellaan 3-ulotteista parametrisointia \(\mathbf{r}\), joka on jatkuvasti derivoituva. Tämä tarkoittaa, että vektorin \(\mathbf{r}\) jokaisen koordinaattifunktion täytyy olla derivoituva ja derivaatan lisäksi jatkuva.

Parametriväliä \([t,t+\Delta t]\) vastaava käyrän sekantti on vektori \[\Delta\mathbf{r}=\mathbf{r}(t+\Delta t) - \mathbf{r}(t).\] Kun \(\Delta t \rightarrow 0\), niin \(\Delta\mathbf{r}\) kääntyy yhä enemmän käyrän tangentin suuntaiseksi, mutta samalla sen pituus kutistuu kohti nollaa. Skaalamalla kertoimella \(\Delta t\) saadaan kuitenkin erotusosamäärää vastaava lauseke, josta nähdään, että raja-arvo \[\mathbf{r}'(t) = \lim_{\Delta t\rightarrow 0} \frac{\Delta \mathbf{r}}{\Delta t}\] on olemassa ja se voidaan käytännössä laskea kaavalla \[\mathbf{r}'(t) = x'(t)\mathbf{i}+y'(t)\mathbf{j}+z'(t)\mathbf{k}.\] Vektorin \(\Delta\mathbf{r}/\Delta t\) ensimmäinen koordinaatti on nimittäin \[\frac{x(t+\Delta t)-x(t)}{\Delta t} \longrightarrow x'(t), \text{ kun }\Delta t \rightarrow 0,\] ja samoin käy myös muissa koordinaateissa. Tästä seuraa määritelmä.

Määritelmä. Jos käyrällä \(C\subset\mathbb{R}^3\) on jatkuvasti derivoituva parametrisointi \(\mathbf{r}\), niin pisteessä \(\mathbf{r}(t)\), \[ \mathbf{r}'(t)=x'(t)\mathbf{i}+y'(t)\mathbf{j}+z'(t)\mathbf{k} \] on käyrän tangenttivektori ja funktiot \(x,y,z\) ovat parametrisoinnin koordinaattifunktiot. Tason tapauksessa \(z\)-koordinaatti jää pois. Voidaan ajatella, että \(\mathbf{v}(t)=\mathbf{r}'(t)\) on käyrää \(C\) pitkin liikkuvan kappaleen nopeus ja \(\|\mathbf{v}(t)\|\) kappaleen vauhti hetkellä \(t\).

Kokeile erilaisia käyrän parametrisointeja. Musta nuoli kuvaa käyrän tangenttivektoria valitulla arvolla.


\(\mathbf{r}(t) = \begin{cases}\\ \\ \\ \\\end{cases}\)
\(x(t)=~\)\(,\)
\(y(t)=~\)\(,\)
\(\quad\) \(\le t \le\) .

Huomautus. Tangenttivektorin määritelmästä saadaan lisäksi hyödyllinen approksimaatio: \[\mathbf{r}'(t)\approx \Delta\mathbf{r}/\Delta t \Leftrightarrow \Delta\mathbf{r}\approx \mathbf{r}'(t)\Delta t, \text{ kun } \Delta t\approx 0.\]

Esimerkki

Sykloidi voidaan parametrisoida kulman \(t\) avulla muodossa \[ \mathbf{r}(t)=\begin{cases}x(t)=a(t-\sin t)\\ y(t)=a(1-\cos t).\end{cases} \] Tangenttivektoriksi saadaan tällöin \[ \mathbf{r}'(t) = a(1-\cos t)\mathbf{i}+a\sin t\mathbf{j}, \] ja edelleen voidaan ratkaista kiihtyvyys \[ \mathbf{a}(t)=\mathbf{r}''(t)=a\sin t\mathbf{i} + a\cos t\mathbf{j}. \] Tästä seuraa \(\|\mathbf{a}(t)\| = \lvert a\rvert =\) tasaisen pyörimisliikkeen kiihtyvyys.

Pyörivän ympyrän kaarelta valitun pisteen liikerata muodostaa sykloidin

Huomautus. \(\mathbf{r}'(2\pi n)=\overline{0}\), eli hetkellinen nopeus on nolla. Tällöin käyrän suunta voi muuttua jyrkästi, vaikka sen parametrisointi onkin jatkuvasti derivoituva.

Kaarenpituus

Olkoon \(\mathbf{r}\colon[a,b]\rightarrow\mathbb{R}^n\) käyrän \(C\) jatkuvasti derivoituva parametrisointi. Jos käyrää approksimoidaan sekanteista muodostetulla murtoviivalla ja annetaan approksimaation tihentyä, voidaan havaita murtoviivan pituuden suppenevan kohti kaaren pituutta \(\ell(C)\).

Kaarenpituus voidaankin määrittää integraalina \[\ell(C)=\int_a^b \|\mathbf{r}'(t)\|\,dt,\] missä merkintä \(\|\cdot\|\) tarkoittaa vektorin (euklidista) normia, eli vektorin pituutta, avaruudessa \(\mathbb{R}^n\).


Perustelu. Olkoot \(a= t_{0} < t_{1} < \dotsc < t_{n}=b \) välin \([a,b]\) ositus. Tällöin vektorien \(\mathbf{r}(t_{k-1})\) ja \(\mathbf{r}(t_{k})\) välisen sekanttivektorin lauseke on \[\Delta \mathbf{r}_{k} = \mathbf{r}(t_{k}) - \mathbf{r}(t_{k-1})\] (vrt. aiempaan määritelmään, kun \(\Delta t = t_{k}-t_{k-1}\)).

Toisaalta sekanttivektorien pituudelle pätee approksimaatio \[\|\Delta\mathbf{r}_{k}\| \approx \|\mathbf{r}'(t_{k-1})\|(t_{k}-t_{k-1}),\] joten kaarenpituuden approksimaatioksi \(n\) kappaleella sekanttivektoreita saadaan \[\ell(C) \approx \sum_{k=1}^{n}\|\Delta\mathbf{r}_{k}\| \approx \sum_{k=1}^{n}\|\mathbf{r}'(t_{k-1})\|(t_{k}-t_{k-1}).\] Vaaditaan lisäksi, että jokaisen jakovälin pituus \(t_{k}-t_{k-1}\) suppenee kohti nollaa, kun \(n\to\infty\), jolloin edellinen lauseke on funktion \(\|\mathbf{r}'(t)\|\) Riemannin summa. Toisaalta, kun jakovälejä tihennetään, lähestyy approksimaatio kaaren todellista pituutta. Näin ollen integraalin määritelmästä seuraa \[\ell(C) = \lim_{n\to\infty}\sum_{k=1}^{n}\|\mathbf{r}'(t_{k-1})\|(t_{k}-t_{k-1}) = \int_{a}^{b}\|\mathbf{r}'(t)\|\,dt.\]

Kaarenpituuden approksimointia välillä \([a,b]\), kun sekanttivektoreita \(n\) kappaletta

Jos käyrän parametrisointi on ainoastaan paloittain jatkuvasti derivoituva, saadaan koko käyrän kaarenpituus laskemalla osien kaarenpituudet yhteen.

Vaikka käyrällä onkin aina äärettömän monta eri parametrisointia, voidaan osoittaa, ettei kaarenpituus riipu parametrisoinnin valinnasta eikä suunnasta.

Esimerkki

Määritetään Helix-käyrän \(\mathbf{r}(t)=(\cos t,\sin t,t)\) kaarenpituus parametrivälillä \(t\in[0,2\pi]\). Tangenttivektoriksi saadaan

\[\mathbf{r}'(t)= \mathbf{i}(-\sin t) + \mathbf{j}\cos t + \mathbf{k},\] joten \[\|\mathbf{r}'(t)\| = \sqrt{((-\sin t)^2+\cos^2t+1)}=\sqrt{2}.\] Ja siten kaarenpituus on \[\ell = \int_0^{2\pi} \|\mathbf{r}'(t)\|dt = 2\sqrt{2}\pi.\]

Esimerkki

Johdetaan kaava funktion kuvaajan \( y=f(x) \) kaarenpituudelle välillä \([a,b]\). Asetetaan \(\mathbf{r}(t)=(t, f(t))\), kun \(t\in[a,b]\). Tällöin \[\mathbf{r}'(t)=(1,f'(t))\quad\text{ ja }\quad \|\mathbf{r}'(t)\| = \sqrt{1+f'(t)^2},\] joten kaarenpituudeksi saadaan \[\ell = \int_a^b \sqrt{1+f'(t)^2}\,dt.\]

Huomautus. Kaarenpituutta voidaan tutkia myös sellaisille käyrille, joiden parametrisointi on muodostettu rajoittamattomalla välillä tai käyrä on "rajoittamaton" tai "itsensä päälle laskostuva" avoimen parametrivälinsä päätepisteen läheisyydessä. Kaarenpituusintegraalista tulee tällöin epäoleellinen. Jos tämä integraali on suppeneva, niin käyrää kutsutaan suoristuvaksi.

Esimerkki

Olkoot käyrällä parametrisointi \(\mathbf{r}(t)=(e^{-t},e^{-t})\), kun \(t\in[0,\infty[\). Lasketaan tälle kaarenpituus.

Tangenttivektorin \(\mathbf{r}'(t)=(-e^{-t},-e^{-t})\) pituus on \(\|\mathbf{r}'(t)\|=e^{-t}\sqrt{2}\), joten kaarenpituudeksi saadaan nyt

\[\ell = \int_{0}^{\infty}\|\mathbf{r}(t)\|\,dt = \int_{0}^{\infty}e^{-t}\sqrt{2}\,dt = \sqrt{2}.\]

2. Usean muuttujan funktiot

Usean muuttujan funktiot

Usean muuttujan reaaliarvoisella funktiolla tarkoitetaan funktiota \(f:D\rightarrow\mathbb{R}\), missä \(D\subset\mathbb{R}^n\), \(n\geq2\) on funktion määrittelyjoukko. Tällainen funktio siis liittää reaalisiin parametreihin \(x_1,\ldots,x_n\) reaaliluvun \(y=f(x_1,\ldots,x_n)\). Joskus (erityisesti fysiikassa) tällaista funktiota sanotaan skalaarikentäksi.

Esimerkiksi kaava \(f(r,h)=\pi r^2h\) määrittelee kahden muuttujan \(r,h\) funktion. Tämän funktion arvo on sylinterin tilavuus, kun \(r\) on sen säde ja \(h\) korkeus. Tähän sovellukseen liittyvä funktion määrittelyjoukko on tason ensimmäinen neljännes, \[ D=\{(r,h)\in \mathbb{R}^2 : r\ge0,\,h\ge 0\}, \] mutta funktion määräävä matemaattinen kaava on kuitenkin määritelty ja mielekäs kaikilla \((r,h)\in \mathbb{R}^2\), siis myös negatiivisilla luvuilla.

Esimerkki

Funktion \(z=f(x,y)\) kuvaaja, kun


\(f(x,y)=-\frac{6x}{2+x^2+y^2}\)


\(f(x,y)=x^2-y^2\)

Tasa-arvokäyrät

Olkoon \(c\in\mathbb{R}\) vakio, \(D\subset\mathbb{R}^2\) ja \(f\colon D \to \mathbb{R}\) funktio. Tällöin joukko \[C= \{(x,y) : f(x,y)=c\}\] on usein tasokäyrä. Kyseinen pistejoukko voi olla myös tyhjä (jos \(f\) ei saa arvoa \(c\)) tai vaikkapa koko taso (jos \(f\) on vakio). Mikäli joukko \(C\) on tasokäyrä, sitä sanotaan funktion \(f\) arvoon \(c\) liittyväksi tasa-arvokäyräksi.

Esimerkiksi korkeuskäyrät kartalla ovat tasa-arvokäyriä funktiolle, joka liittää kartalla olevaan pisteeseen \((x,y)\) korkeuden meren pinnasta kyseisessä pisteessä.

Kolmiulotteisessa tapauksessa pistejoukot \[S= \{(x,y,z) : f(x,y,z)=c\}\] ovat yleensä pintoja (eivät siis avaruuskäyriä).

Esimerkki
Funktion \[z=f(x,y)=-\frac{6x}{2+x^2+y^2}\] tasa-arvokäyriä:


Raja-arvo monen muuttujan tapauksessa

Olkoon \(D\subset \mathbb{R}^n\), \(n \geq 2\) ja \(f\colon D\to \mathbb{R}\) funktio. Oletetaan lisäksi, että piste \(\textbf{y}_0\in \mathbb{R}^n\) on joukon \(D\) kasaantumispiste eli kaikilla \(r>0\) joukko \[D\cap \{\textbf{x} \in \mathbb{R}^n : 0< \|\textbf{x} - \textbf{y}_0\| < r\}\] on epätyhjä. Tällöin sanotaan, että funktiolla \(f\) on raja-arvo \(L\) pisteessä \(\textbf{y}_0\) ja merkitään \[ \lim_{\textbf{x} \to \textbf{y}_0} f(\textbf{x})=L, \quad \text{missä } \textbf{x} = (x_1,\ldots,x_n)\in D, \] jos kaikilla \(\varepsilon>0\) on olemassa luku \(\delta = \delta(\varepsilon)\) siten, että \(| f(\textbf{x}) -L|<\varepsilon\) aina, kun \(0<\|\textbf{x} - \textbf{y}_0\|<\delta\) ja \(\textbf{x} \in D\).
Laskusääntöjä

Olkoot \(D\subset \mathbb{R}^n\), \(n\geq2\), \(\textbf{y}_0\) joukon \(D\) kasaantumispiste ja \(f,g\colon D \to \mathbb{R}\) sellaisia funktiota, että \(\lim_{\textbf{x} \to \textbf{y}_0} f(\textbf{x}) =L\) ja \(\lim_{\textbf{x} \to \textbf{y}_0} g(\textbf{x}) =M\). Tällöin: \[ \lim_{\textbf{x} \to \textbf{y}_0} \big(f(\textbf{x}) \pm g(\textbf{x})\big) = L \pm M. \] \[ \lim_{\textbf{x} \to \textbf{y}_0} f(\textbf{x}) g(\textbf{x}) = LM. \] \[ \lim_{\textbf{x} \to \textbf{y}_0} \frac{f(\textbf{x})}{g(\textbf{x})} = \frac{L}{M},\text{ jos }M \neq 0. \] Jos \(L\in(a,b)\) ja \(F\colon (a,b)\to \mathbb{R}\) on jatkuva pisteessä \(L\), niin \[ \lim_{\textbf{x} \to \textbf{y}_0} F\big(f(\textbf{x})\big) = F(L). \]

Raja-arvon tutkiminen käyrien avulla

Yhden muuttujan tapauksessa raja-arvoa tutkitaan yleensä oikean- ja vasemmanpuoleisen raja-arvon avulla. Tämä ajatus ei kuitenkaan toimi usean muuttujan tapauksessa, koska yleensä on olemassa äärettömän monta suuntaa (eli kyseisen pisteen kautta kulkevaa käyrää), joista pistettä \(\textbf{y}_0\) voidaan lähestyä joukossa \(D\subset \mathbb{R}^n\), \(n\geq2\).

Mikäli kuitenkin on olemassa kaksi käyrää \(\textbf{r}_1,\textbf{r}_2\colon [a,b]\to D\cup \{\textbf{y}_0\}\), siten että \(\textbf{r}_1(b)=\textbf{r}_2(b)=\textbf{y}_0\) mutta \[ \lim_{t\to b} f\big(\textbf{r}_1(t)\big) \neq \lim_{t\to b} f\big(\textbf{r}_2(t)\big), \] tai jompaa kumpaa kyseisistä raja-arvoista ei ole määritelty, niin tällöin funktiolla \(f\colon D\to\mathbb{R}\) ei voi olla raja-arvoa pisteessä \(\textbf{y}_0\).

Esimerkki

Tutkitaan funktion \(f(x,y)\) raja-arvoa origon ympäristössä, kun \[ f(x,y) = \frac{2xy}{x^2+y^2} \]

Jos origoa lähestytään \(x\)-akselin suunnasta, eli pitkin käyrää \(\mathbf{r}_1(t)=t\mathbf{i}\), saadaan \[ \lim_{t\to0^+}f(t,0) = \lim_{t\to0^+}\frac{2t\cdot 0}{t^2+0^2} = 0. \] Toisaalta suoralla \(x=y\), joka voidaan parametrisoida \(\mathbf{r}_2(t)=t\mathbf{i}+t\mathbf{j}\), saadaan \[ \lim_{t\to0^+}f(t,t) = \lim_{t\to0^+}\frac{2t\cdot t}{t^2+t^2} = \lim_{t\to0^+}\frac{2t^2}{2t^2} = 1. \] Näin ollen funktiolla \(f\) ei ole raja-arvoa origossa.

Esimerkki

Tutkitaan funktion \[ f(x,y) = \frac{2x^2y}{x^4+y^2} \] raja-arvoa origossa.

Koska funktion arvo on nolla koordinaattiakseleilla, sen raja-arvon on oltava nolla (jos se on olemassa). Itse asiassa kaikilla origon kautta kulkevilla suorilla \(\mathbf{r}(t)=t\mathbf{i}+kt\mathbf{j}\) saadaan \[ f(t,kt) = \frac{2kt^3}{t^4+k^2t^2} = \frac{2kt}{t^2+k^2} \to 0, \text{ kun } t\to 0. \] Kuitenkin valinnalla \(\mathbf{r}_1(t) = t\mathbf{i}+t^2\mathbf{j}\) saadaan \[ \lim_{t\to0}f(t,t^2) = \lim_{t\to0}\frac{2t^4}{t^4+t^4} = 1. \] Siten tälläkään funktiolla ei ole raja-arvoa origossa.

Esimerkki
Osoitetaan, että \[ \lim_{(x,y)\to(0,0)} \frac{x^2y}{x^2+y^2} = 0. \] Käyttämällä epäyhtälöä \(x^2\leq x^2 + y^2\) saadaan \[ \left|f(x,y)-0\right| = \left|\frac{x^2y}{x^2+y^2}\right|\leq |y|\leq \sqrt{x^2+y^2} \to 0, \text{ kun } (x,y)\to(0,0). \] Formaalisti: Raja-arvon määritelmän ehto toteutuu, jos valitaan \(\delta=\epsilon\).

Jatkuvuus

Olkoon \(D\subset \mathbb{R}^n\), \(n\geq 2\) ja \(\textbf{x}_0 \in D\). Funktio \(f\colon D\to \mathbb{R}\) on jatkuva pisteessä \(\textbf{x}_0\), jos \[ \lim_{\textbf{x} \to \textbf{x}_0} f(\textbf{x}) = f(\textbf{x}_0). \] Funktio on jatkuva joukossa \(D\), jos se on jatkuva jokaisessa joukon \(D\) pisteessä.

3. Osittaisderivaatta

Osittaisderivaatta

Olkoon \(D\subset \mathbb{R}^n\), \(n \geq 2\) ja \(f\colon D\to \mathbb{R}\) funktio. Tällöin kaikille \(j=1,\ldots,n\) funktion \(f\) osittaisderivaatta muuttujan \(x_j\) suhteen on \[ \frac{\partial}{\partial x_{j}}f(\mathbf{x}) = \lim_{h\to0}\frac{f(\mathbf{x} + h\mathbf{e}_j) -f(\mathbf{x})}{h}, \] jos kyseinen raja-arvo on määritelty. Tässä \(\mathbf{e}_j\) on \(j\):s yksikkökantavektori.

Käytännössä osittaisderivointi jonkin muuttujan suhteen tapahtuu samaan tapaan kuin yhden muuttujan tapauksessa, muistetaan vain pitää muita muuttujia ikään kuin ne olisivat vakioita.

Esimerkki

Olkoon funktio \(f\colon \mathbb{R}^2\to \mathbb{R}, f(x_{1},x_{2})=x_{1}x_{2}\). Tällöin \[\frac{\partial}{\partial x_{2}}f(x_{1},x_{2}) = \lim_{h\to0}\frac{f(x_{1},x_{2}+h)-f(x_{1},x_{2})}{h} = \lim_{h\to0}\frac{x_{1}(x_{2}+h)-x_{1}x_{2}}{h} = x_{1}.\]

Huom. Erityisesti, kun \(\mathbf{x}\in\mathbb{R}^{n}\) ja \(n=2\) tai \(n=3\), käytetään osittaisderivaatoille yleensä indeksimerkintöjä \[\frac{\partial}{\partial x_{1}}f(\mathbf{x}) = f_{x}(\mathbf{x}),\quad\frac{\partial}{\partial x_{2}}f(\mathbf{x}) = f_{y}(\mathbf{x}) \quad\text{ja}\quad \frac{\partial}{\partial x_{3}}f(\mathbf{x}) = f_{z}(\mathbf{x})\]

Esimerkki

Olkoon funktio \(f\colon \mathbb{R}^2\to \mathbb{R}\), \(f(x,y)=x^2\sin y.\) Sen osittaisderivaatat ovat \[ f_{x}(x,y) = 2x\sin y \quad \text{ ja }\quad f_{y}(x,y) = x^2 \cos y. \]

Merkintätavat osittaisderivaatoille

Funktion \(f\colon D\subset\mathbb{R}^n\to \mathbb{R}\) osittaisderivaattaa muuttujan \(x_j\) suhteen merkitään mm. seuraavilla tavoilla \[ \frac{\partial}{\partial x_j} f(x_1,\ldots,x_n) = \frac{\partial f}{\partial x_j} = D_jf(x_1,\ldots,x_n) = \partial_{j}f(x_{1},\ldots,x_{n}).\]

Tapauksessa \(n=2\) usein kirjoitetaan \(z=f(x,y)\), jolloin voidaan myös käyttää merkintöjä \[ f_{x}(x,y)=\frac{\partial z}{\partial x} \quad \text{ ja }\quad f_{y}(x,y)=\frac{\partial z}{\partial y}. \]

Osittaisderivaatalle käytetään erillistä symbolia \(\partial\) ("doh"), jotta se ei sekoittuisi tavalliseen (kokonais)derivaattaan. Palataan tähän vähän myöhemmin ketjusäännön yhteydessä.

Osittaisderivaatan arvo

Funktion \(f\colon D\subset\mathbb{R}^n\to \mathbb{R}\) osittaisderivaatan \(f_j\) arvoa pisteessä \(\mathbf{x}_0\in D\) merkitään \[ \bigg(\frac{\partial f}{\partial x_j}\bigg)\bigg|_{\mathbf{x}_0} = \frac{\partial z}{\partial x_j}\bigg|_{\mathbf{x}_0} = D_jf(\mathbf{x}_{0}) = \partial_{j}f(\mathbf{x}_{0}), \] jossa muuttuja \(z\) määritellään \(z = f(x_1, x_2, \ldots , x_n)\).

Esimerkiksi, jos \(f(u,v)=u^2v\) ja \(\mathbf{w} = x^2\mathbf{i} + xy\mathbf{j}\), niin \begin{align} f_{u}(\mathbf{w})&=f_{u}(x^2,xy) =\left.\bigg(\frac{\partial}{\partial u}f(u,v)\bigg)\right|_{(x^2,xy)} \\ &=2uv\Big|_{u=x^2,\,v=xy}= 2(x^2)(xy)=2x^3y. \end{align}

Esimerkki

Lasketaan \[ \frac{\partial z}{\partial x}\quad \text{ ja }\quad \frac{\partial z}{\partial y}, \] kun \(z=x^3y^2+x^4y + y^4\). Tällöin saadaan \[ \frac{\partial z}{\partial x} = 3x^2y^2+4x^3y \quad \text{ ja }\quad \frac{\partial z}{\partial y} = 2x^3y+x^4+4y^3. \]

Esimerkki

Etsitään \(f_{x}(0,\pi)\), kun \(f(x,y)=e^{xy}\cos(x+y)\). Tästä saadaan \[ f_{x}(x,y)=ye^{xy}\cos(x+y)-e^{xy}\sin(x+y). \] Siten \[ f_{x}(0,\pi) = \pi e^0\cos(\pi)-e^0\sin(\pi) = -\pi. \]

Ketjusäännön soveltaminen

Tavallisiin derivaattoihin liittyvä ketjusääntö \[ (f\circ g)'(x)= f'\big(g(x)\big)g'(x) \] on voimassa myös osittaisderivaattojen tapauksessa. Jos esimerkiksi \( f\colon \mathbb{R}\to\mathbb{R}\) ja \(g\colon \mathbb{R}^2\to\mathbb{R},\) niin \[ \frac{\partial }{\partial x}f\big(g(x,y)\big) = f'\big(g(x,y)\big)g_{x}(x,y) \] ja \[ \frac{\partial }{\partial y}f\big(g(x,y)\big) = f'\big(g(x,y)\big)g_{y}(x,y). \] Myöhemmin esitetään myös ketjusääntö monen muuttujan funktioille.

Esimerkki

Osoitetaan, että derivoituva funktio \(f\colon \mathbb{R}\to\mathbb{R}\) toteuttaa seuraavan osittaisdifferentiaaliyhtälön, kun \(z=f(x/y)\): \[ x\frac{\partial z}{\partial x} + y\frac{\partial z}{\partial y}=0 \] Ketjusäännön perusteella \[ \frac{\partial z}{\partial x} =f'\bigg(\frac{x}{y}\bigg)\bigg(\frac{1}{y}\bigg) \text{ ja } \frac{\partial z}{\partial y} =f'\bigg(\frac{x}{y}\bigg)\bigg(\frac{-x}{y^2}\bigg). \] Siten \[ x\frac{\partial z}{\partial x} + y\frac{\partial z}{\partial y} = f'\bigg(\frac{x}{y}\bigg)\bigg(x\cdot \frac{1}{y}+y\cdot\frac{-x}{y^2}\bigg)=0. \]

Korkeammat osittaisderivaatat

Funktiolle \(f\colon \mathbb{R}^n\to\mathbb{R}\) voidaan määritellä myös korkeampia osittaisderivaattoja. Jos \(z=f(x,y)\), niin saadaan esimerkiksi \[ \frac{\partial^2 z}{\partial x^2} = \frac{\partial }{\partial x} \frac{\partial z}{\partial x} =f_{xx}(x,y) \] ja \[ \frac{\partial^2 z}{\partial x\partial y} = \frac{\partial }{\partial x} \frac{\partial z}{\partial y} =f_{yx}(x,y). \] Vastaavasti, jos \(w=f(x,y,z)\), saadaan vaikkapa \[ \frac{\partial^5 w}{\partial y\partial x\partial y^2\partial z} = \frac{\partial }{\partial y}\frac{\partial }{\partial x}\frac{\partial }{\partial y} \frac{\partial }{\partial y}\frac{\partial w}{\partial z} = f_{zyyxy}(x,y,z). \]

Esimerkki

Etsitään funktion \(f(x,y)=x^3y^4\) toiset osittaisderivaatat. Saadaan aluksi \[ f_{x}(x,y)=3x^2y^4\quad\text{ ja }\quad f_{y}(x,y)=4x^3y^3. \] Siten \begin{align*} f_{xx}(x,y)&=\frac{\partial }{\partial x}3x^2y^4=6xy^4, \\ f_{yx}(x,y)&=\frac{\partial}{\partial x}4x^3y^3=12x^2y^3, \\ f_{xy}(x,y)&=\frac{\partial}{\partial y}3x^2y^4=12x^2y^3, \\ f_{yy}(x,y)&=\frac{\partial }{\partial y}4x^3y^3=12x^3y^2. \end{align*}

Huom. Edellisestä voidaan havaita, että \(f_{xy}(x,y)=f_{yx}(x,y)\). Tämä ei ole sattumaa!

Jos funktio \(f\) sekä sen osittaisderivaatat \(f_{x},f_{y},f_{xy}\) ja \(f_{yx}\) ovat kaikki jatkuvia, niin \[\frac{\partial^{2}f}{\partial x\partial y} = \frac{\partial^{2}f}{\partial y\partial x}.\] Toisin sanoen derivoimisjärjestyksellä ei ole tällöin väliä. Vastaava tulos pätee myös yleisesti kaikilla \(n\ge2\).

3.1. Tangenttitaso ja normaalisuora

Pinnan tangentti ja normaali

Yhden muuttujan tapauksessa derivaatan avulla voidaan löytää lauseke derivoituvan funktion tangentille annetussa pisteessä. Normaali on kohtisuorassa tangenttia vastaan. Pinnalle \(z=f(x,y)\) saadaan puolestaan kaksi tangenttivektoria pisteessä \((a,b)\) käyrien \(t\mapsto(t,b,f(t,b))\) ja \(t\mapsto(a,t,f(a,t))\) tangentteina: \[ \mathbf{T}_1 = \mathbf{i} + f_{x}(a,b)\mathbf{k} \quad\text{ ja }\quad \mathbf{T}_2 = \mathbf{j} + f_{y}(a,b)\mathbf{k}. \]

Pinnan (ylä)normaalivektori \(\mathbf{N} = \mathbf{N}(a,b)\) on kohtisuorassa näitä molempia tangenttivektoreita vastaan. Siksi se saadaan ristitulona \begin{align*} \mathbf{N} &= \mathbf{T}_1\times \mathbf{T}_2 = \begin{vmatrix} \mathbf{i} & \mathbf{j} & \mathbf{k} \\ 1 & 0 & f_{x}(a,b) \\ 0 & 1 & f_{y}(a,b) \end{vmatrix} =-f_{x}(a,b)\mathbf{i} - f_{y}(a,b)\mathbf{j} + \mathbf{k}. \end{align*} Mikä on yksikkönormaali \(\mathbf{n}\)?

Tangenttitaso

Olkoon \(D\subset \mathbb{R}^2\), \(f\colon D\to \mathbb{R}\) ja \((a,b)\in D\). Pinnan \(z=f(x,y)\) tangenttitaso pisteessä \((a,b)\) on aina kohtisuorassa normaalia \(\mathbf{N} = \mathbf{N}(a,b)\) vastaan ja se kulkee pisteen \(P=(a,b,f(a,b))\) kautta. Merkitään pisteen \(P\) paikkavektoria \(\mathbf{r}_{0}\). Tällaisen tason vektorit \(\mathbf{r} = (x,y,z) \in \mathbb{R}^3\) toteuttavat yhtälön \[(\mathbf{r} - \mathbf{r}_{0}) \cdot \mathbf{N} = 0. \] Tangenttitasolle saadaan siis yhtälö \[ z=f(a,b) + f_{x}(a,b)(x-a) + f_{y}(a,b)(y-b). \]

Normaalisuoran yhtälöt

Normaalisuora pinnalle \(z=f(x,y)\) pisteessä \(P = (a,b,f(a,b))\) on normaalivektorin \(\mathbf{N}(a,b) = -f_{x}(a,b)\mathbf{i} - f_{y}(a,b)\mathbf{j} + \mathbf{k}\) suuntainen.

Merkitään taas pisteen \(P\) paikkavektoria \(\mathbf{r}_{0}\). Tällöin normaalisuoran pisteet ovat pistejoukko \[ \{ \mathbf{r}_{0} + t \mathbf{N}(a,b) \, : \, t \in \mathbb{R} \}. \] Jos sekä \(f_{x}(a,b) \neq 0\) ja \(f_{y}(a,b) \neq 0\), niin voidaan eliminoida parametri \(t\) ja saadaan yhtälöt \[ \frac{x-a}{f_{x}(a,b)} = \frac{y-b}{f_{y}(a,b)} = \frac{z-f(a,b)}{-1}. \]

Esimerkki

Etsitään tangentti ja normaali pinnalle \(z=\sin(xy)\), kun \(x=\pi/3\) ja \(y=-1\). Tangentti ja normaali kulkevat pisteen \((\pi/3,-1,-\sqrt{3}/2)\) kautta.

Lasketaan osittaisderivaatat: \[\frac{\partial z}{\partial x} = y\cos(xy)\text{ ja } \frac{\partial z}{\partial y} = x\cos(xy).\] Pisteessä \((\pi/3,-1)\) saadaan \[\frac{\partial z}{\partial x} = -\frac{1}{2} \text{ ja } \frac{\partial z}{\partial y} = \frac{\pi}{6}.\] Siten kyseisellä pinnalla on normaalivektori \[ \mathbf{N} = \frac{1}{2}\mathbf{i} - \frac{\pi}{6}\mathbf{j} + \mathbf{k}. \] Tangenttitaso on \[ z= \frac{-\sqrt{3}}{2} - \frac{1}{2}\Big(x-\frac{\pi}{3}\Big) + \frac{\pi}{6}(y+1). \] Ja normaalisuoran yhtälöiksi saadaan \[ \frac{6x-2\pi}{-3} = \frac{6y+6}{\pi} = \frac{6z+3\sqrt{3}}{-6}. \]

4. Ketjusäännöt ja lineaarinen approksimointi

Motivaatio

Yleistetään derivoinnin ketjusääntö \[ \frac{d}{dx}f\big(g(x)\big) = f'\big(g(x)\big)g'(x) \] usean muuttujan funktioille \(f\).

Ketjusääntö liittyy suoraan myös moniin käytännön sovelluksiin. Voidaan ajatella fysikaalista suuretta kuten lämpötilaa, mekaanisen systeemin kokonaisenergiaa, jotka riippuvat useista eri toissijaisista muuttujista (kuten ajasta, paikasta, tai nopeudesta). Nämä muuttujat voivat riippua edelleen kolmansista muuttujista (paikka ja nopeus esimerkiksi ajasta). Halutaan tarkastella kiinnostavan fysikaalisen suureen muutosnopeutta mainittujen kolmansien muuttujien suhteen.

Esimerkki

Retkeilijä liikkuu karttaa käyttäen mäkisessä maastossa. Olkoon \((x,y)\) retkeilijän paikka kartalla, \(z=f(x,y)\) kulloinenkin korkeus meren pinnasta ja \[ \mathbf{r}(t)=\left(u(t),v(t)\right) \] retkeilijän paikka kartalla hetkellä \(t\). Retkeilijän paikan korkeus eli etäisuus meren pinnan tasosta hetkellä \(t\) on siis yhdistetty funktio \[ z=f\left(u(t),v(t)\right) = g(t). \] Kuinka nopeasti retkelijän paikan korkeus muuttuu ajan kuluessa?

Ilmeisestikin vastaus kysymykseen on funktion \(g(t)\) derivaatta. Lasketaan: \begin{align*} \lim_{h\to 0}\frac{g(t+h)-g(t)}{h} &= \lim_{h\to 0}\frac{f(u(t+h),v(t+h))-f(u(t),v(t))}{h} \\ &= \lim_{h\to 0}\frac{f(u(t+h),v(t+h))-f(u(t),v(t+h))}{h}\\ &\quad + \lim_{h\to 0}\frac{f(u(t),v(t+h))-f(u(t),v(t))}{h} \end{align*} Yhden muuttujan ketjusäännön perusteella \[ g'(t)=f_{x}\big(u(t),v(t)\big)u'(t)+f_{y}\big(u(t),v(t)\big)v'(t). \]

Ketjusäännöt

Olkoon \(z\) muuttujien \(x,y\) jatkuvasti derivoituva funktio (eli funktio, jolla on jatkuvat 1. kertaluvun osittaisderivaatat). Jos \(x,y\) ovat muuttujan \(t\) jatkuvasti derivoituvia funktioita, niin \[ \frac{dz}{dt} = \frac{\partial z}{\partial x}\frac{dx}{dt} + \frac{\partial z}{\partial y}\frac{dy}{dt}. \] Jos \(x,y\) ovat kahden muuttujan \(s,t\) jatkuvasti derivoituvia funktioita, niin \begin{equation} \frac{\partial z}{\partial s} = \frac{\partial z}{\partial x}\frac{\partial x}{\partial s} + \frac{\partial z}{\partial y}\frac{\partial y}{\partial s} \end{equation} ja \begin{equation} \frac{\partial z}{\partial t} = \frac{\partial z}{\partial x}\frac{\partial x}{\partial t} + \frac{\partial z}{\partial y}\frac{\partial y}{\partial t}. \end{equation}

Keskeisiä kysymyksiä:
Mikä on yleinen idea näissä kaavoissa? Kuinka voidaan muodostaa yleisessä tapauksessa laskentakaava yhdistetyn funktion (osittais)derivaatoille?

Ajatellaanpa, että \(z = f(u,v,t)\), jossa \(u = u(x,y)\) ja \(v=v(y,t)\). Tarkastellaan graafina "infinitesimaalisen muutoksen etenemistä" muuttujasta \(t\) muuttujaan \(z\) kaikkien etenemisreittien kautta.

Kuinka tilanne muuttuu, jos lisäksi \(x = x(t)\) ja \(y= y(t),\) jolloin \(z = z(t)\) ja kysytään kaavaa derivaatalle \(\frac{d z}{d t}\)? Saadaan \[ \frac{\partial z}{\partial t} = \frac{\partial f}{\partial v} \frac{\partial v}{\partial t} + \frac{\partial f}{\partial t} \] ja \begin{align*} \frac{d z}{d t} & = \frac{\partial f}{\partial u} \left ( \frac{\partial u}{\partial x} \frac{d x}{d t} + \frac{\partial u}{\partial y} \frac{d y}{d t} \right ) \\ &\quad+ \frac{\partial f}{\partial v} \left ( \frac{\partial v }{\partial t} + \frac{\partial v}{\partial y} \frac{d y}{d t} \right ) + \frac{\partial f}{\partial t}, \end{align*} jossa on yhteensä viisi termiä.

Huomautus. Tässä on käytetty sekä notaatiota \(\frac{\partial z}{\partial t}\) että \(\frac{\partial f}{\partial t}\), jotka tarkoittavat eri asiaa!

Esimerkki

Olkoon \(f\colon \mathbb{R}^2\to\mathbb{R}\) jatkuvasti derivoituva. Etsitään \[ \frac{\partial}{\partial x} f(x^2y,x+2y)\text{ ja } \frac{\partial}{\partial y} f(x^2y,x+2y). \]

Saadaan \begin{align*} \frac{\partial}{\partial x} f(x^2y,x+2y) &= f_{x}(x^2y,x+2y)\frac{\partial}{\partial x} (x^2y) \\ &\quad +f_{y}(x^2y,x+2y)\frac{\partial}{\partial x}(x+2y) \\ &= 2xy f_{x}(x^2y,x+2y)+ f_{y}(x^2y,x+2y). \end{align*} Vastaavasti voidaan laskea \begin{align*} \frac{\partial}{\partial y} f(x^2y,x+2y) &= f_{x}(x^2y,x+2y)\frac{\partial}{\partial y} (x^2y) \\ & +f_{y}(x^2y,x+2y)\frac{\partial}{\partial y}(x+2y) \\ &= x^2 f_{x}(x^2y,x+2y)+ 2f_{y}(x^2y,x+2y). \end{align*}

Esimerkki
Lämpötila ilmakehässä \(({}^\circ\)C) riippuu paikasta \((x,y,z)\) sekä ajasta \(t\). Ajatellaan lämpötilaa näistä parametrista riippuvana funktiona \(T(x,y,z,t)\). Jos funktio \(T\) esittää sääpalloon liitetyn lämpömittarin mittaamaa lämpötilaa, määritetään \(T\):n muutos ajan suhteen.

Määritetään lämpötilan muutos hetkellä \(t=1\), kun \[ T(x,y,z,t)=\frac{xy}{1+z}(1+t), \] ja sääpallo etenee reittiä \(\mathbf{r}(t)=(t,2t,t-t^2)\). Koska lämpömittarin lukeman muutos riippuu kaikista neljästä parametrista, mitään niistä ei voida jättää huomiotta.

Lämpötilan muutoksen kaavaksi saadaan siten \[ \frac{dT}{dt} = \frac{\partial T}{\partial x}\frac{dx}{dt} +\frac{\partial T}{\partial y}\frac{dy}{dt} +\frac{\partial T}{\partial z}\frac{dz}{dt} +\frac{\partial T}{\partial t}. \] Koordinaattifunktioiden arvot hetkellä \(t=1\) ovat \[ x=1,\quad y=2\text{ ja } z=0. \] Koordinaattifunktioiden derivaattojen arvot hetkellä \(t=1\) ovat \[ \frac{dx}{dt}=1,\quad \frac{dy}{dt}=2\text{ ja } \frac{dz}{dt}=-1. \] Siten hetkellä \(t=1\) saadaan \begin{align*} \frac{\partial T}{\partial x} &= \frac{y}{1+z}(1+t)=4, &&\frac{\partial T}{\partial y} = \frac{x}{1+z}(1+t)=2, \\ \frac{\partial T}{\partial z} &= \frac{-xy}{(1+z)^2}(1+t)=-4, &&\frac{\partial T}{\partial t} = \frac{xy}{1+z}=2. \end{align*} Näin ollen, \[ \frac{dT}{dt}\bigg|_{t=1} = 4\cdot 1 + 2\cdot 2 + (-4) \cdot (-1) +2 = 14. \]

Approksimaatiot

Yksiulotteisessa tapauksessa muotoa \(y=f(x)\) olevan funktion kuvaajan tangenttisuora \(L(x)\) pisteessä \(a\) saadaan kaavasta \[ L(x) = f(a) + f'(a)(x-a). \] Tangenttisuoran lauseke antaa myös tavan approksimoida funktiota \(f\) pisteen \(a\) läheisyydessä: \(f(x)\approx L(x)\).

Miksi approksimaatiota tarvitaan, jos kerran tietokone voi laskea nopeasti ja tarkasti? Kun halutaan löytää "peukalosääntö" päässälaskun helpottamiseksi ja ymmärryksen lisäämiseksi. Kun funktio \(f\) on olemassa ainoastaan taulukoituna, esimerkiksi mittaustuloksista.

Lineaariset approksimaatiot usean muuttujan funktioille

Tapauksessa \(n=2\) saadaan funktiota \(f(x,y)\) approksimoiva tangenttitaso \(L(x,y)\), joka voidaan laskea osoittaisderivaattojen avulla kaavasta \[ f(x,y) \approx L(x,y) = f(a,b)+f_{x}(a,b)(x-a)+f_{y}(a,b)(y-b). \] Vieläkin useamman muuttujan tapauksessa saadaan ihan samannäköinen kaava, joskin enemmän osittaisderivaattatermejä.

Esimerkki

Etsitään lineaarinen approksimaatio funktiolle \[ f(x,y)=\sqrt{2x^2+e^{2y}} \] pisteessä \((2,0)\), ja arvioidaan funktion arvoa pisteessä \((2.2,-0.2)\).

Saadaan \(f(2,0)=3\). Funktion osittaisderivaatat ovat \[ f_{x}(x,y) = \frac{2x}{\sqrt{2x^2+e^{2y}}}, \quad f_{x}(2,0)=\frac{4}{3}. \] ja \[ f_{y}(x,y) = \frac{e^{2y}}{\sqrt{2x^2+e^{2y}}}, \quad f_{y}(2,0)=\frac{1}{3}. \] Siten \[ L(x,y)=3 +\frac{4}{3}(x-2)+\frac{1}{3}(y-0). \] Haluttu approksimaatio siis on \[ f(2.2,-0.2) \approx L(2.2,-0.2) = 3 +\frac{4}{3}(2.2-2)+\frac{1}{3}(-0.2-0)=3.2. \] Vertailun vuoksi funktion \(f(x,y)\) todellinen arvo pisteessä \((2.2,-0.2)\) on noin \(3.2172\).

Huomautuksia

Toisin kuin yksiulotteisessa tapauksessa pelkkä osittaisderivaattojen olemassaolo ei riitä takaamaan edes funktion \(f(x,y)\) jatkuvuutta. Esimerkiksi \[ f(x,y)=\left\{\begin{array}{rl} 0, & \text{kun }x=0\text{ tai }y=0,\\ 1, &\text{muuten}. \end{array}\right. \] ja \[ f(x,y)=\left\{\begin{array}{rl} \frac{2xy}{x^2 +y^2}, & \text{kun }x^2+y^2>0,\\ 0, &\text{kun } (x,y)=(0,0). \end{array}\right. \] Siksi tilannetta on tarpeen analysoida tarkemmin. Halutaan ehto, joka kertoo milloin tangenttitaso \(L(x,y)\) on mielekäs approksimaatio funktiolle \(f(x,y)\) lähellä pistettä \((a,b)\).

Differentioituvuus

Määritelmä. Funktiota \(f(x,y)\) sanotaan differentioituvaksi pisteessä \((a,b)\), jos \[ \lim_{(h,k)\to (0,0)} \frac{f(a+h,b+k)-f(a,b)-h\,f_{x}(a,b)-k\,f_{y}(a,b)}{\sqrt{h^2+k^2}}=0. \]

Saadaan seuraava tulos:

Lause. Jos \(f_{x},f_{y}\) ovat jatkuvia jossakin pisteen \((a,b)\) ympäristössä, niin \(f\) on differentioituva pisteessä \((a,b)\).

Esimerkki

Lasketaan virhetermi \(f(x+h,y+k)-f(x,y)-h\,f_{x}(x,y)-k\,f_{y}(x,y)\), kun \(f(x,y)=x^3+xy^2\).

Osittaisderivaatoiksi saadaan \(f_{x}(x,y)=3x^2+y^2\) ja \(f_{y}(x,y)=2xy\), joten \begin{align*} &f(x+h,y+k)-f(x,y)-h\,f_{x}(x,y)-k\,f_{y}(x,y) \\ &\quad =(x+h)^3+(x+h)(y+k)^2-x^3-xy^2-(3x^2+y^2)h -2xyk\\ &\quad=3xh^2+h^3+2yhk+hk^2+xk^2. \\ \end{align*} Lausekeen \(h\)- ja \(k\)-termit lähestyvät nollaa samalla nopeudella kuin \(h^2+k^2\), kun \((h,k)\to 0\), joten differentioituvuuden määritelmä selvästi toteutuu.

5. Gradientti ja suunnattu derivaatta

Määritelmä

Olkoon \(D\subset \mathbb{R}^n\) ja \(\mathbf{f} = (f_1,f_2,\ldots,f_m)\) vektori, missä jokainen funktion \(f\) komponentti on funktio \(f_j\colon D \to \mathbb{R}\) ja \(m,n\ge 2\). Tällainen vektori määrittelee vektoriarvoisen funktion \(\mathbf{f}\colon \mathbb{R}^n \to \mathbb{R}^m\), jota kutsutaan myös vektorikentäksi. Usein käytetään merkintää \(\mathbf{y} = \mathbf{f}(\mathbf{x})\).

Vektoriarvoisia funktiota esiintyy usein mm. fysiikassa sellaisten suureiden yhteydessä, joilla on voimakkuus ja suunta (esimerkiksi nopeus- ja voimakentät).

Huomautus. Yllä \(f_j\):t ovat tässä vektorin \(\mathbf{f}\) komponentteja (eivät siis osittaisderivaattoja).

Vektoriarvoisen funktion derivointi

Derivaatan luonnollinen vastine vektoriarvoisen funktion \(\mathbf{f} =(f_1,f_2,\ldots,f_m)\) tapauksessa on Jacobin matriisi \[ D\mathbf{f}(\mathbf{x}) = \begin{bmatrix} \frac{\partial f_1}{\partial x_1} & \frac{\partial f_1}{\partial x_2} & \cdots & \frac{\partial f_1}{\partial x_n}\\ \frac{\partial f_2}{\partial x_1} & \frac{\partial f_2}{\partial x_2} & \cdots & \frac{\partial f_2}{\partial x_n}\\ \vdots & \vdots & & \vdots \\ \frac{\partial f_m}{\partial x_1} & \frac{\partial f_m}{\partial x_2} & \cdots & \frac{\partial f_m}{\partial x_n}. \end{bmatrix} \] Jos \(m=n\), Jacobin matriisi on neliömatriisi ja sen determinattia sanotaan funktion \(\mathbf{f}\) Jacobin determinantiksi pisteessä \(\mathbf{x}\). Tätä determinanttia tarvitaan kurssin loppuosassa.

Jacobin matriiseilla ketjusääntö voidaan kirjoittaa yleisessä muodossa \[ D(\mathbf{f} \circ \mathbf{g})(\mathbf{x})= D\mathbf{f}\big(\mathbf{g}(\mathbf{x})\big)D\mathbf{g}(\mathbf{x}). \]

Sovellus: implisiittifunktiolause

Oletetaan, että skalaarifunktiot \(F_{(1)}, F_{(2)}, \ldots , F_{(n)}\) ovat derivoituvia. Tutkitaan yhtälöryhmää \[ \left\{\begin{array}{l} F_{(1)}(x_1,x_2,\ldots,x_m,y_1,y_2,\ldots,y_n)=0,\\ F_{(2)}(x_1,x_2,\ldots,x_m,y_1,y_2,\ldots,y_n)=0,\\ \vdots\\ F_{(n)}(x_1,x_2,\ldots,x_m,y_1,y_2,\ldots,y_n)=0,\\ \end{array}\right. \] pisteen \(P_0 = (a_1,a_2,\ldots,a_m,b_1,b_2,\ldots,b_n)\) lähellä. Muuttujat \(\mathbf{y}=(y_1,\ldots,y_n)\) voidaan esittää muuttujien \(\mathbf{x}=(x_1,\ldots,x_m)\) funktioina pisteen \(P_0\) lähellä, jos funktion \(\mathbf{f}(\mathbf{y}) = (F_{(1)},\ldots,F_{(n)})(\mathbf{y})\) Jacobin determinatti \[ \det D\mathbf{f}(\mathbf{y})\Big|_{P_0} \neq 0. \]

Esimerkki

Osoitetaan, että \((u,v)\) voidaan esittää muuttujien \((x,y,z)\) funktiona systeemistä \[ \left\{\begin{array}{l} F(x,y,z,u,v) = xy^2+xzu + yv^2-3 = 0,\\ G(x,y,z,u,v) = x^3yz+2xv -u^2v^2-2 = 0,\\ \end{array}\right. \] pisteen \(P_0=(1,1,1,1,1)\) lähellä.

Selvästi \(F(P_0) = G(P_0) = 0\). Muodostetaan Jacobin determinatti \[ \left|\begin{array}{cc} \frac{\partial F}{\partial u} & \frac{\partial F}{\partial v} \\ \frac{\partial G}{\partial u} & \frac{\partial G}{\partial v} \end{array}\right|\Big|_{P_0} = \left|\begin{array}{cc} xz & 2yv \\ -2uv^2 & 2x-2u^2v \end{array}\right|\Big|_{P_0} = \left|\begin{array}{cc} 1 & 2 \\ -2 & 0 \end{array}\right|=4. \] Koska determinantti ei ole nolla, voidaan kirjoittaa \[u = u(x,y,z)\quad \text{ ja }\quad v = v(x,y,z)\] kolmen muuttujan funktioina. Kaavoja näille funktioille ei kuitenkaan voida yleensä antaa.

Gradientti

Olkoon \(f\colon D\subset \mathbb{R}^n\to\mathbb{R}\), \(n\ge 2\), derivoituva pisteessä \(\mathbf{x}\in D\).

Määritelmä. Funktion \(f\) gradientti pisteessä \(\mathbf{x}\) on vektori \[ \nabla f = \mathrm{grad}\, f = \Big(\frac{\partial}{\partial x_1}f,\frac{\partial}{\partial x_2}f,\ldots,\frac{\partial}{\partial x_n}f\Big)\in\mathbb{R}^n. \]

Gradientti kertoo funktion \(f\) nopeimman kasvun suunnan. Se on vektoriarvoinen funktio \(\nabla f\colon D \to \mathbb{R}^n\). Tapauksessa \(n=3\) voidaan kirjoittaa \[ \nabla = \mathbf{i} \frac{\partial}{\partial x} + \mathbf{j}\frac{\partial}{\partial y} + \mathbf{k}\frac{\partial}{\partial z}. \] Tapauksessa \(n=2\) kolmas termi jää pois. Gradientti on (\(m\times n\) -) Jacobin matriisin erikoistapaus \(m=1\).

Esimerkki

Olkoon \(f(x,y)=x^2+y^2\). Tällöin saadaan \(\nabla f = 2x\mathbf{i} + 2y \mathbf{j}\). Erityisesti \(\nabla f (a,b)\) on kohtisuorassa origokeskisen (yksikkö)ympyrän mielivaltaiseen pisteeseen \((a,b\)) piirrettyä tangenttisuoraa vastaan. Tämä on erikoistapaus yleisemmästä tasa-arvokäyriä koskevasta totuudesta.

Huom. Derivaatan ketjusääntö voidaan kirjoittaa myös gradientin avulla: Jos \(\mathbf{r}=x(t)\,\mathbf{i}+y(t)\,\mathbf{j}\), niin \[\frac{d}{dt}f(\mathbf{r}(t)) = \frac{\partial f}{\partial x}\frac{dx}{dt}+\frac{\partial f}{\partial y}\frac{dy}{dt}= \nabla f(\mathbf{r}(t))\cdot \mathbf{r}'(t).\]

Tasa-arvokäyrät

Olkoon \(c\in\mathbb{R}\) vakio, \(D\subset\mathbb{R}^2\) ja \(f\colon D \to \mathbb{R}\) funktio. Tällöin joukko \[C= \{(x,y) : f(x,y)=c\}\] on usein tasokäyrä. Kyseinen pistejoukko voi olla myös tyhjä (jos \(f\) ei saa arvoa \(c\)) tai vaikkapa koko taso (jos \(f\) on vakio). Mikäli joukko \(C\) on tasokäyrä, sitä sanotaan funktion \(f\) arvoon \(c\) liittyväksi tasa-arvokäyräksi.

Esimerkiksi korkeuskäyrät kartalla ovat tasa-arvokäyriä funktiolle, joka liittää kartalla olevaan pisteeseen \((x,y)\) sen korkeuden meren pinnasta.

Gradientti

Lause. Olkoon \(D\subset \mathbb{R}^2\), \((a,b)\in D\) ja \(f\colon D\to \mathbb{R}\) derivoituva pisteessä \((a,b)\) ja \(\nabla f(a,b)\neq \mathbf{0}.\) Tällöin \(\nabla f(a,b)\) on kohtisuorassa pisteen \((a,b)\) kautta kulkevaa funktion \(f\) tasa-arvokäyrää (t.s., sen tangenttia) vasten.

Seuraus: Jos piste \(\mathbf{x}\in D\) on funktion \(f\) paikallinen ääriarvo (minimi tai maksimi), niin \(\nabla f(\mathbf{x})=\mathbf{0}\). Gradientin nollakohta ei kuitenkaan välttämättä ole funktion ääriarvo. Edes skalaarifunktion derivaatan nollakohta ei välttämättä ole minimi eikä maksimi, kuten nähdään jos \(f(x) = x^3\).

Todistus. Olkoon \(I = [-1,1]\) ja \(\mathbf{r}(t)\colon I \to \mathbb{R}^2\) tasa-arvokäyrän sellainen parametrisointi, että \(\mathbf{r}(0)=(a,b)\). Koska \(\mathbf{r}(t)=x(t)\mathbf{i} +y(t)\mathbf{j}\) on tasa-arvokäyrä, kaikilla \(t\in I\) pätee \(f(x(t),y(t))=f(a,b)\) eli vakio. Ketjusäännöstä saadaan (koska vakiofunktion derivaatta on nolla) \[ f_{x}\big(x(t),y(t)\big)x'(t) + f_{y}\big(x(t),y(t)\big)y'(t)=0. \] Erityisesti pisteessä \(t=0\) tämä tarkoittaa, että \[ \nabla f(a,b)\cdot \mathbf{r}'(0)=0, \] eli toisin sanoen vektori \(\nabla f\) ja tangentin suuntainen \(\mathbf{r}'(0)\) ovat kohtisuorassa.

Suunnattu derivaatta

Edellinen tulos voidaan tulkita niin, että tasa-arvokäyrän tangentti antaa suunnan, johon edettäessä funktio ei kasva eikä vähene. Niinpä funktio kasvaa jyrkimmin gradienttinsa suuntaan, joka on tasa-arvokäyrän normaalivektori. Muihin suuntiin liikuttessa kasvunopeuden antaa suunnattu derivaatta \[ D_{\mathbf{u}}f(a,b) = \frac{dg}{dt}(0), \text{ jossa } g(t) = f(a + t u_1, b + t u_2) \] ja \(\mathbf{u} = u_1 \mathbf{i} + u_2 \mathbf{j}\) on yksikkösuuntavektori.

Lause. Olkoon \(f\colon D\subset \mathbb{R}^2\to \mathbb{R}\) funktio, \((a,b)\in D\) ja \(\mathbf{u} = u_1 \mathbf{i} + u_2 \mathbf{j}\) sellainen vektori, että \(\|\mathbf{u}\|^2= u_1^2 + u_2^2 = 1\). Tällöin funktion \(f\) suunnattu derivaatta suuntaan \(\mathbf{u}\) saadaan kaavasta \[ D_{\mathbf{u}}f(a,b) = \mathbf{u} \cdot \nabla f(a,b). \]

Esimerkki

Olkoon \(f(x,y)=y^4+2xy^3+x^2y^2\). Etsitään \(D_{\mathbf{u}}f (0,1)\), kun \(\mathbf{u}\) on

a) \(\mathbf{i} +2\mathbf{j}~\) b) \(\mathbf{j} - 2\mathbf{i}~\) c) \(3\mathbf{i}~\) d) \(\mathbf{i}+\mathbf{j}\).

Lasketaan \[\nabla f(x,y) = (2y^3+2xy^2)\mathbf{i} + (4y^3+6xy^2+2x^2y)\mathbf{j},\] \[\nabla f(0,1) = 2\mathbf{i} + 4\mathbf{j}.\] a) \(\|\mathbf{i} +2\mathbf{j}\| = \sqrt{5}\) ja siten \(\mathbf{u} = (\mathbf{i} +2\mathbf{j})/\sqrt{5}\). Saadaan \[ D_{\mathbf{u}}f(0,1)=\frac{1}{\sqrt{5}}(\mathbf{i} +2\mathbf{j})\cdot (2\mathbf{i} + 4\mathbf{j}) = \frac{2+8}{\sqrt{5}}=2\sqrt{5}. \]

Huomaa, että tässä \(\mathbf{u}\) ja \(\nabla f(0,1)\) ovat yhdensuuntaiset.

b) \(\|\mathbf{j} -2\mathbf{i}\| = \sqrt{5}\) ja siten \(\mathbf{u} = (\mathbf{j} -2\mathbf{i})/\sqrt{5}\). Saadaan \[ D_{\mathbf{u}}f(0,1)=\frac{1}{\sqrt{5}}(\mathbf{j} -2\mathbf{i})\cdot (2\mathbf{i} + 4\mathbf{j}) = \frac{-4+4}{\sqrt{5}}=0. \] Vektorit \(\mathbf{u}\) ja \(\nabla f(0,1)\) ovat siis kohtisuorassa.

c) \(\|3\mathbf{i}\| = 3\) ja siten \(\mathbf{u} = \mathbf{i}\). Saadaan \[D_{\mathbf{u}}f(0,1)=\mathbf{i} \cdot (2\mathbf{i} + 4\mathbf{j}) = 2.\] Tämä on sama kuin \(f_1(0,1)\).

d) \(\|\mathbf{i} +\mathbf{j}\| = \sqrt{2}\) ja siten \(\mathbf{u} = (\mathbf{i} +\mathbf{j})/\sqrt{2}\). Saadaan \[ D_{\mathbf{u}}f(0,1)=\frac{1}{\sqrt{2}}(\mathbf{i} +\mathbf{j})\cdot (2\mathbf{i} + 4\mathbf{j}) = \frac{2+4}{\sqrt{2}}=3\sqrt{2}. \]

Huomaa, että \(3\sqrt{2}\approx 4.243 < 2\sqrt{5} \approx 4.472\).

5.1. Taylorin sarja

Taylorin kaava

Yhden muuttujan tapauksessa \(m+1\) kertaa jatkuvasti derivoituvaa funktiota \(f\colon I \to \mathbb{R}\) voidaan approksimoida kaavalla \[ f(x)\approx f(a)+f'(a)(x-a)+ \frac{f''(a)}{2!}(x-a)^2+ \ldots + \frac{f^{(m)}(a)}{m!}(x-a)^m. \] kun \(a,x\in I\).

Tämä idea yleistyy usean muuttujan tapaukseen: Jos \(\mathbf{a}, \mathbf{h} \in \mathbb{R}^n\), \(n\ge 2\) ja funktiolla \(f\colon D\subset \mathbb{R}^n\to\mathbb{R}\) on jatkuvat kertaluvun \((m+1)\) osittaisderivaatat pisteitä \(\mathbf{a},\mathbf{a}+\mathbf{h}\) yhdistävällä janalla, niin \[ f(\mathbf{a}+\mathbf{h}) \approx \sum_{j=0}^m\frac{(\mathbf{h} \cdot \nabla)^jf(\mathbf{a})}{j!}. \]

Perustelu. Yksinkertaisuuden vuoksi johdetaan tässä kaava tapauksessa \(n=2\) riittävän sileille funktioille. Olkoon \(D\subset\mathbb{R}^{2}\) avoin ja funktio \(f\colon D\to\mathbb{R}\) äärettömän monta kertaa jatkuvasti derivoituva. Lisäksi oletetaan, että \(\mathbf{a}+t\mathbf{h}\subset D\), kun \(0\le t\le 1\). Tällöin oleellisesti myös apufunktion \[F\colon\mathbb{R}\to\mathbb{R},F(t)=f(\mathbf{a}+t\mathbf{h})\] kaikki derivaatat ovat jatkuvia suljetulla välillä \(\left[0,1\right]\).

Ketjusäännön nojalla saadaan apufunktiota derivoimalla \[F'(t) = h_{1}f_{x}(\mathbf{a}+t\mathbf{h}) + h_{2}f_{y}(\mathbf{a}+t\mathbf{h}) = (\mathbf{h}\cdot\nabla)f(\mathbf{a}+t\mathbf{h})\] \[F''(t) = h_{1}h_{2}f_{xx}(\mathbf{a}+t\mathbf{h}) + h_{1}h_{2}f_{xy}(\mathbf{a}+t\mathbf{h}) + h_{2}h_{1}f_{xy}(\mathbf{a}+t\mathbf{h}) + h_{2}h_{2}f_{yy}(\mathbf{a}+t\mathbf{h}) = (\mathbf{h}\cdot\nabla)^{2}f(\mathbf{a}+t\mathbf{h})\] \[\vdots\] \[F^{(j)}(t) = (\mathbf{h}\cdot\nabla)^{j}f(\mathbf{a}+t\mathbf{h}).\] Tästä havaitaan, että \(F^{(j)}(0) = (\mathbf{h}\cdot\nabla)^{j}f(\mathbf{a})\) ja siten yhden muuttujan funktion \(F\) Taylorin sarjakehitelmä on muotoa \[F(t) = F(0) + F'(0)t + \frac{1}{2}F''(0)t^{2}+\dots = \sum_{j=0}^{\infty}\frac{F^{(j)}(0)}{j!}t^{j}.\] Asettamalla tässä \(t=1\) saadaan haluttu tulos, \[f(\mathbf{a}+t\mathbf{h}) = f(\mathbf{a})+\mathbf{h}\cdot\nabla f(\mathbf{a}) + \frac{1}{2}(\mathbf{h}\cdot\nabla)^{2}f(\mathbf{a})+\dots\] \[=\sum_{j=0}^{\infty}\frac{(\mathbf{h}\cdot\nabla)^{j}}{j!}f(\mathbf{a}).\]

Esimerkki

Olkoon \((a,b)\in \mathbb{R}^2\) ja \(f(x,y)\) neljä kertaa jatkuvasti derivoituva kiekossa \((a,b)\)-keskisessä \(r\)-säteisessä kiekossa. Etsitään 3. asteen approksimaatio. Jos \(\mathbf{h} =(h,k)\), niin \begin{align*} f(a+h,b+k)&\approx f(a,b) + (hD_1+kD_2)f(a,b) +\frac{1}{2!}(hD_1+kD_2)^2f(a,b) \\ &\quad +\frac{1}{3!}(hD_1+kD_2)^3f(a,b) \\ &= f(a,b) + hf_{x}(a,b)+kf_{y}(a,b) \\ &\quad+ \frac{1}{2!}\Big(h^2f_{xx}(a,b)+2hkf_{xy}(a,b)+k^2f_{yy}(a,b)\Big) \\ &\quad+\frac{1}{3!}\Big(h^3f_{xxx}(a,b)+ 3h^2kf_{xxy}(a,b)+3hk^2f_{xyy}(a,b)+k^3f_{yyy}(a,b)\Big). \end{align*}

Huom. 1. asteen Taylor-approksimaatio on sama kuin tangenttitaso.

Esimerkki

Etsitään 2. asteen Taylor-approksimaatio funktiolle \(f(x,y)=\sqrt{x^2+y^3}\) pisteen \((1,2)\) ympäristössä.

Lasketaan \(f(1,2)=3\), \[ f_{x}(x,y)=\frac{x}{\sqrt{x^2+y^3}},\quad f_{y}(x,y)=\frac{3y^2}{2\sqrt{x^2+y^3}}, \] eli \(f_{x}(1,2)=1/3\) ja \(f_{y}(1,2)=2\). Edelleen \[ f_{xx}(x,y)=\frac{y^3}{(x^2+y^3)^{3/2}} \quad\Rightarrow\quad f_{xx}(1,2)= \frac{8}{27}, \] \[ f_{xy}(x,y)=\frac{-3xy^2}{2(x^2+y^3)^{3/2}} \quad\Rightarrow\quad f_{xy}(1,2)= -\frac{2}{9}, \] \[ f_{yy}(x,y)=\frac{12x^2y+3y^4}{4(x^2+y^3)^{3/2}} \quad\Rightarrow\quad f_{yy}(1,2)= \frac{2}{3}. \] Siten \begin{align*} f(1+h,2+k) &\approx 3 + \frac{1}{3}h + 2k + \frac{1}{2!}\Big(\frac{8}{27}h^2+2\Big(-\frac{2}{9}\Big)hk+\frac{2}{3}k^2\Big) \\ &= \frac{4}{27}h^2-\frac{2}{9}hk+\frac{1}{3}k^2+\frac{1}{3}h + 2k + 3. \end{align*}

6. Ääriarvojen luokittelu

Kertausta: ääriarvot yhden muuttujan tapauksessa

Funktiolla \(f\colon I\subset \mathbb{R} \to \mathbb{R}\) on lokaali (paikallinen) maksimi pisteessä \(a\in I\), jos \(f(x)\le f(a)\) kaikilla \(x\):n arvoilla jossakin \(a\):n ympäristössä (eli riittävän lähellä pistettä \(a\)). Vastaavasti lokaali minimi tarkoittaa sitä, että \(f(x)\ge f(a)\) jossakin \(a\):n ympäristössä. Maksimi tai minimi on globaali, jos kyseinen epäyhtälö on voimassa kaikilla \(x\in I\).
Ääriarvoja voi esiintyä:
  1. Funktion \(f\) kriittisissä pisteissä, joissa \(f'(x)=0\),
  2. pisteissä joissa \(f\):n derivaatta ei ole määritelty, ja
  3. määrittelyjoukon \(I\) reunalla.

Seuraavaksi yleistetään vastaavat ehdot funktion \(f\colon D\subset \mathbb{R}^n\to\mathbb{R}\) tapaukseen.

Ääriarvot ja usean muuttujan funktiot

Funktiolla \(f\colon D\subset \mathbb{R}^n\to\mathbb{R}\) on pisteessä \(\mathbf{x}_0\in D\) lokaali maksimi, jos jossakin pisteen \(\mathbf{x}_0\) ympäristössä \(U\subset D\) pätee \(f(\mathbf{x})\le f(\mathbf{x}_0)\) kaikilla \(\mathbf{x}\in U\). Vastaavasti \(f\colon D\subset \mathbb{R}^n\to\mathbb{R}\) on pisteessä \(\mathbf{x}_0\in D\) lokaali minimi, jos löytyy sellainen pisteen \(\mathbf{x}_0\) ympäristö \(U\subset D\), että \(f(\mathbf{x})\ge f(\mathbf{x}_0)\) kaikilla \(\mathbf{x}\in U\). Ääriarvo on globaali eli absoluuttinen, jos kyseinen epäyhtälö on voimassa kaikilla \(\mathbf{x}\in D\).
Ääriarvoja voi esiintyä:
  1. Funktion \(f\) kriittissä pisteissä eli gradientin nollakohdissa \(\nabla f(\mathbf{x})=0\),
  2. pisteissä joissa \(\nabla f\) ei ole määritelty, sekä
  3. määrittelyjoukon \(D\) reunalla.
Joukon \(D\) kriittistä pistettä \(\mathbf{x}_0\), joka ei ole maksimi tai minimi, kutsutaan funktion \(f\colon D\to \mathbb{R}\) satulapisteeksi.
Esimerkki
funktion kuvaaja

Funktiolla \(f(x,y)= 1-x^2-y^2\) on globaali maksimi \(f(0,0)=1\) pisteessä \((0,0)\). Tämä piste on funktion \(f\) kriittinen piste, koska \[ \nabla f(0,0) = -2x\mathbf{i} -2y\mathbf{j} \Big|_{(0,0)}= \mathbf{0}. \]

Esimerkki
funktion kuvaaja
Funktiolla \(f(x,y)= y^2-x^2\) on satulapiste \((0,0)\). Tämä piste on funktion \(f\) kriittinen piste, koska \[ \nabla f(0,0) = -2x\mathbf{i}+2y\mathbf{j}\Big|_{(0,0)}= \mathbf{0}. \]
Esimerkki
funktion kuvaaja
Kaikki pisteet suoralla \(x=0\) ovat funktion \(f(x,y)= -x^3\) satulapisteitä. Huomaa, että \[ \nabla f(0,y) = -3x^2\mathbf{i} \Big|_{(0,y)}= \mathbf{0} \text{ kaikilla }y\in \mathbb{R}. \]
Esimerkki
funktion kuvaaja
Funktiolla \(f(x,y)= \sqrt{x^2+y^2}\) on lokaali minimi \(f(0,0)=0\) pisteessä \((0,0)\). Funktio \(f\) on jatkuva, mutta sen gradientti \(\nabla f\) ei ole määritelty tässä pisteessä.
Esimerkki
funktion kuvaaja
Funktiolla \(f(x,y)=1-x\) ei ole paikallisia ääriarvoja, jos sen määrittelyjoukko on koko taso \(D=\mathbb{R}^2\). Jos määrittelyjoukoksi kuitenkin ajatellaan esimerkiksi kiekko \(D=\{(x,y): x^2+y^2 \leq 1\}\), niin sen reunalla saadaan maksimi \(f(-1,0)=2\) ja minimi \(f(1,0)=0\).

Ääriarvojen luokittelu: johdanto

Ääriarvojen luokittelu perustuu suureen \(\Delta f= f(\mathbf{x} + \mathbf{h}) -f(\mathbf{x})\) tarkasteluun kriittisessä pisteessä \(\mathbf{x}\in D\). Jos \(\Delta f\) saa vain positiivisia arvoja (kun \(\|\mathbf{h}\|\) on pieni), on piste \(\mathbf{x}\) minimi ja negatiivisessa tapauksessa maksimi. Jos \(\Delta f\) vaihtaa merkkiä, niin piste \(\mathbf{x}\) ei ole minimi eikä maksimi. Tämä johtaa funktion \(f\) toisen derivaatan tarkasteluun kriittisessä pisteessä.
Yhden muuttujan tapauksessa:
  1. Jos \(f''(x)< 0\), niin funktiolla \(f\) lokaali maksimi pisteessä \(x\).
  2. Jos \(f''(x)>0\), niin funktiolla \(f\) lokaali minimi pisteessä \(x\).
  3. Jos \(f''(x)=0\), niin testi ei anna vastausta, ja kysymys täytyy ratkaista muulla tavoin.
Seuraavaksi yritetään yleistää tätä ajatusta monen muuttujan funktiolle.

Hessen matriisi

Olkoon \(f\colon D\subset \mathbb{R}^n \to \mathbb{R}\) funktio, jolla on jatkuvat toisen kertaluvun osittaisderivaatat. Funktion \(f\) luonnollinen derivaattakäsite on gradientti, joka itsessään on vektoriarvoinen funktio \(\nabla f\colon \mathbb{R}^n \to \mathbb{R}^n\). Siten funktion \(f\) toinen derivaatta on matriisi, jota nimitetään Hessen matriisiksi \[ H_f(\mathbf{x})= \begin{bmatrix} \frac{\partial^2}{\partial x_1^2} f(\mathbf{x}) & \frac{\partial^2}{\partial x_2\partial x_1} f(\mathbf{x}) & \cdots & \frac{\partial^2}{\partial x_n\partial x_1} f(\mathbf{x})\\ \frac{\partial^2}{\partial x_1\partial x_2} f(\mathbf{x}) & \frac{\partial^2}{\partial x_2^2} f(\mathbf{x}) & \cdots & \frac{\partial^2}{\partial x_n\partial x_2} f(\mathbf{x})\\ \vdots & \vdots & & \vdots \\ \frac{\partial^2}{\partial x_1\partial x_n} f(\mathbf{x}) & \frac{\partial^2}{\partial x_2\partial x_n} f(\mathbf{x}) & \cdots & \frac{\partial^2}{\partial x_n^2} f(\mathbf{x}) \\ \end{bmatrix}. \] Koska \(f\) on kaksi kertaa jatkuvasti derivoituva, derivoinnin järjestystä voidaan vaihtaa, ja kyseinen matriisi on symmetrinen.

Miksi Hessen matriisi kiinnostaa meitä? Kun gradientin avulla voidaan kirjoittaa lineaarinen (ensimmäisen asteen) approksimaatio funktiolle \(f\), niin Hessen matriisilla saadaan kvadraattinen tarkennus: \[ f(\mathbf{x} + \mathbf{h}) \approx f(\mathbf{x}) + \mathbf{h} \cdot \nabla f (\mathbf{x}) + \frac{1}{2} \mathbf{h} H_f(\mathbf{x}) \mathbf{h}^T, \] jossa (vaaka)vektori \(\mathbf{h} = (h_1, h_2, \ldots , h_n)\) on pieni.

Tämä kaava on itse asiassa ainoastaan uusi tapa kirjoittaa toisen kertaluvun Taylorin approksimaatio \(n\):n muuttujan funktiolle. Muotoa \(\mathbf{z} ^T A \mathbf{z}\) oleva lauseke on \(n\times n\)-neliömatriisille \(A\) niin kutsuttu neliömuoto, jossa \(\mathbf{z}\) on \(n\)-pystyvektori.

Kirjoita kaava auki tapauksessa \(n = 2\)!

Pisteessä, jossa \(\nabla f (\mathbf{x}) = 0\), on voimassa approksimaatio \[f(\mathbf{x} + \mathbf{h}) - f(\mathbf{x}) \approx \frac{1}{2} \mathbf{h} H_f(\mathbf{x}) \mathbf{h}^T.\] Tätä voidaan käyttää hyväksi mahdollisen ääriarvon luokittelussa pisteessä \(\mathbf{x}\) ajattelemalla, että \(\mathbf{h} \approx 0\).

Matriisin (ja neliömuodon) definiittisyys

Symmetristä \(n\times n\)-matriisia \(A\) sanotaan positiividefiniitiksi, jos sen kaikki ominaisarvot ovat positiivisia ja negatiividefiniitiksi, jos \(-A\) on positiividefiniitti. Matriisin sanotaan olevan indefiniitti, jos sen kaikki ominaisarvot ovat nollasta poikkeavia ja sillä on vähintään yksi positiivinen sekä yksi negatiivinen ominaisarvo. Positiivi/negatiividefiniiteillä matriiseilla on monia samoja ominaisuuksia kuin positiivisilla/negatiivisilla reaaliluvuilla.

Symmetrisen matriisin \(A\) definiittiys tai indefiniittiys periytyy sitä vastaavalle neliömuodolle.
\(A\) on positiividefiniitti \(\Leftrightarrow\) \(\mathbf{x}^T A \mathbf{x}>0\) kaikilla nollasta poikkeavilla pystyvektoreilla \(\mathbf{x}\in \mathbb{R}^n\).
\(A\) on negatiividefiniitti \(\Leftrightarrow\) \(\mathbf{x}^T A \mathbf{x}< 0\) kaikilla nollasta poikkeavilla pystyvektoreilla \(\mathbf{x}\in \mathbb{R}^n\).
\(A\) on indefiniitti \(\Leftrightarrow\) \(\mathbf{x}^T A \mathbf{x}\) saavuttaa sekä negatiivisia että positiivisia arvoja pystyvektorin \(\mathbf{x}\) vaihdellessa.

Väite nähdään todeksi ortogonaalidiagonalisoimalla symmetrinen matriisi \(A\) muotoon \(A = U^T \Lambda U\), jossa diagonaalimatriisi \(\Lambda\) sisältää \(A\):n ominaisarvot.

Toisen derivaatan testi monen muuttajan tapauksessa

Lause. Olkoon \(f\colon D\subset \mathbb{R}^n\to\mathbb{R}\) funktio, jolla on jatkuvat toisen kertaluvun osittaisderivaatat kriittisen pisteen \(\mathbf{x}\in D\) ympäristössä. Tällöin:
  1. Jos \(H_f(\mathbf{x})\) on positiividefiniitti, niin \(f\):llä on lokaali minimi pisteessä \(\mathbf{x}\).
  2. Jos \(H_f(\mathbf{x})\) on negatiividefiniitti, niin \(f\):llä on lokaali maksimi pisteessä \(\mathbf{x}\).
  3. Jos \(H_f(\mathbf{x})\) on indefiniitti, niin \(\mathbf{x}\) on funktion \(f\) satulapiste.
  4. Muussa tapauksessa testi ei anna tietoa funktiosta \(f\).

Lause seuraa approksimaatiosta \(f(\mathbf{x} + \mathbf{h}) - f(\mathbf{x}) \approx \frac{1}{2} \mathbf{h} H_f(\mathbf{x}) \mathbf{h}^T\) kun \(\mathbf{h} \approx 0\). Väite täytyy nimittäin ainoastaan tarkastaa Hessen matriisin määräämälle neliömuodolle.

Esimerkki

Etsitään ja luokitellaan funktion \[ f(x,y,z) = x^2y+y^2z+z^2-2x \] kriittiset pisteet.

Yhtälöt kriittisille pisteille ovat \begin{align*} 0 &= f_{x}(x,y,z)=2xy-2,\\ 0 &= f_{y}(x,y,z)=x^2+2yz,\\ 0 &= f_{z}(x,y,z)=y^2+2z.\\ \end{align*} Nämä yhtälöt ratkaisemalla nähdään, että funktion \(f\) ainoa kriittinen piste on \(P=(1,1,-1/2)\).

Lasketaan Hessen matriisi \[H_f(1,1,-1/2)=\left [ \begin{smallmatrix} 2 & 2 & 0 \\ 2 & -1 & 2 \\ 0 & 2 & 2 \end{smallmatrix} \right ]\] ja lasketaan matriisin ominaisarvot vaikkapa MATLABilla

   >> a = [2 2 0 ; 2 -1 2 ; 0 2 2]
   a =
       2     2     0
       2    -1     2
       0     2     2
   >> eig(a)
   ans =
      -2.7016
       2.0000
       3.7016

Niinpä funktiolla \(f\) on satulapiste pisteessä \(P=(1,1,-1/2)\).

6.1. Lagrangen kertoimet

Lagrangen kertoimet

Usein optimointitehtävissä halutaan asettaa rajoitusehtoja optimoitaville muuttujille. Tyypillinen esimerkki tällaisesta tehtävästä on peltipurkin muodon optimointi: Halutaan minimoida purkin pinta-ala (eli käytetty materiaali) \(A(h,r)=2\pi rh+2\pi r^2\) niin, että tilavuus \(V(r,h)=\pi r^2 h\) on vakio.

Duaalitehtävä: Halutaan maksimoida purkin tilavuus \(V(r,h)\) siten, että pinta-ala \(A(h,r)\) on vakio. Primaali- ja duaalitehtävillä on sama ratkaisu. Tämän sanoo maalaisjärkikin, mutta itse asiassa ratkaisuun johtavat yhtälötkin ovat (olennaisesti) samoja.

Havaitaan, että mikäli ongelmalla on ratkaisu, niin ratkaisupisteessä \((a,b)\) vektorien \(\nabla f\) ja \(\nabla g\) on oltava joko yhdensuuntaisia tai vastakkaissuuntaisia (mikäli \(\nabla g(a,b) \neq 0\)). Miksi? Koska muussa tapauksessa funktiolla \(f\) olisi nollasta poikkeva suunnattu derivaatta käyrän \(g(x,y)=0\) tangentin suuntaan pisteessä \((a,b)\), ja siis minimi ei voi olla pisteessä \((a,b)\).

Entä jos tehtävänä olisi maksimoida \(f(x,y)\) ehdolla \(g(x,y)=0\)? Entä jos tehtävänä olisi maksimoida \(g(x,y)\) ehdolla \(f(x,y)=c\)?

Mikäli optimipiste on olemassa, se on Lagrangen funktion \[ L(x,y,\lambda) = f(x,y) + \lambda g(x,y) \] kriittinen piste (eli gradientin nollakohta). Menetelmä yleistyy myös useammalle muuttujalle. Esimerkiksi kolmen muuttujan tapauksessa Lagrangen funktio on \[ L(x,y,z,\lambda,\mu) = f(x,y,z) + \lambda g(x,y,z) + \mu h(x,y,z), \] missä \(f\) on minimoitava funktio ja rajoite-ehdot ovat \(g(x,y,z)=0\) sekä \(h(x,y,z)=0\).

Esimerkki

Minimoidaan funktio \(f(x,y)=x^2+y^2\) ehdolla \(g(x,y)=x^2y-16=0\). Muodostetaan aluksi Lagrangen funktio \[ L(x,y,\lambda)=x^2+y^2+\lambda(x^2y-16). \] Yhtälöt kriittisille pisteille ovat \begin{align*} 0 &=\frac{\partial L}{\partial x} = 2x(1+\lambda y),\\ 0 &=\frac{\partial L}{\partial y} = 2y+\lambda x^2,\\ 0 &=\frac{\partial L}{\partial \lambda}= x^2y-16,\\ \end{align*} joista viimeinen on aina itse rajoitusehto.

Ensimmäisestä yhtälöstä saadaan \(x=0\) tai \(\lambda y=-1\), mutta \(x=0\) on ristiriidassa kolmannen yhtälön kanssa. Siten toisesta yhtälöstä \[ 0=2y^2+\lambda yx^2 = 2y^2-x^2. \] Tästä saadaan edelleen \(x=\pm \sqrt{2}y\), ja \(2y^3=16\) eli \(y=2\). Ääriarvoja (mahdollisia minimejä) on siis kaksi \((x,y) = (\pm 2\sqrt{2},2)\). Pitää selvittää muilla keinoin, ovatko nämä minimejä vai maksimeja.

Esimerkki

Yritetään etsiä Lagrangen kertoimien menetelmällä funktion \(f(x,y)=y\) minimi ehdolla \(g(x,y)=y^3-x^2=0\). Helposti havaitaan, että minimi \(f(x,y)=0\) saavutetaan pisteessä \((0,0)\).

Muodostetaan Lagrangen funktio \[ L(x,y,\lambda)=y+\lambda(y^3-x^2). \] Saadaan yhtälöt \[ -2\lambda x =0,\quad 1+3\lambda y^2=0,\text{ ja } y^3-x^2=0. \] Nämä yhtälöt ovat keskenään ristiriidassa, joten ratkaisua niille ei ole. Huomaa, että \(\nabla g(0,0) =\mathbf{0}\) minimipisteessä. Tästä nähdään, että Lagrangen kertoimet näkevät ääriarvoja vain pisteissä, joissa \(\nabla g(0,0) \neq \mathbf{0}\).

Esimerkki

Etsitään ääriarvot funktiolle \(f(x,y,z)=xy+2z\) ehdoilla \(x+y+z=0\) ja \(x^2+y^2+z^2=24\).

Koska \(f\) on jatkuva ja annettujen leikkausjoukkojen leikkaus on ympyräviiva (eli rajoitettu ja suljettu joukko), niin ääriarvot ovat olemassa. Muodostetaan Lagrangen funktio \[ L(x,y,z,\lambda,\mu)=xy+2z+\lambda(x+y+z)+\mu(x^2+y^2+z^2-24). \] Lagrangen funktion osittaisderivaatoista saadaan yhtälöt \begin{align*} & y+\lambda+2\mu x=0, \\ & x+\lambda+2\mu y=0, \\ & 2+\lambda+2\mu z=0, \\ & x+y+z = 0,\text{ ja } \\ & x^2+y^2+z^2-24=0. \end{align*} Kahden ensimmäisen yhtälön erotus johtaa yhtälöön \((x-y)(1-2\mu)=0\), joten joko \(\mu = 1/2\) tai \(x=y\). Tutkitaan molemmat tapaukset.

Tapaus I (\(\mu = 1/2\)): Toisen ja kolmannen yhtälön perusteella \[ x+\lambda +y =0\textrm{ ja } 2+\lambda +z =0,\text{ siis }x+y=2+z. \] Neljännestä yhtälöstä saadaan \(z=-1\) ja \(x+y=1\). Viimeisen yhtälön perusteella \(x^2+y^2=24-z^2=23\). Koska \(x^2+y^2+2xy=(x+y)^2 =1\), saadaan \(2xy=1-23=-22\) ja \(xy=-11\). Nyt \((x-y)^2 = x^2+y^2-2xy = 23+22=45\), joten \(x-y=\pm 3\sqrt{5}\). Yhdessä yhtälön \(x+y=1\) kanssa tästä saadaan kaksi kriittistä pistettä \[ P_1 = \big((1+3\sqrt{5})/2,(1-3\sqrt{5})/2,-1\big)\text{ ja } P_2 = \big((1-3\sqrt{5})/2,(1+3\sqrt{5})/2,-1\big). \] Kummassakin pisteessä \(f(x,y,z)=-11-2 = -13\).

Tapaus II (\(x=y\)): Neljännestä yhtälöstä nähdään, että \(z=-2x\), ja viimeisen yhtälön perusteella \(6x^2=24\) eli \(x=\pm 2\). Näin ollen, kriittiset pisteet ovat \[ P_3=(2,2,-4)\text{ ja } P_4=(-2,-2,4). \] Saadaan \[ f(2,2,-4)=4-8=-4\text{ ja } f(-2,-2,4)=4+8=12. \] Siten funktion \(f\) maksimi on \(12\) ja minimi \(-13\).

7. PNS-menetelmä

Regressio-ongelma

Regressioanalyysissa pyritään valitsemaan parametrin \(\mathbf{\beta}\) arvo siten, että käyrä \[ y=f(x;\beta) \] kulkisi mahdollisimman läheltä jokaista havaintopistettä \[ (x_j,y_j)\in \mathbb{R}^2,\, j=1,2,\ldots ,n. \] Tällaista optimaalisesti valittua käyrää kutsutaan regressiomalliksi \(y=f(x;\beta)\), jossa funktion \(f\) muoto on valittu tilanteen ja harkinnan mukaan. Kunhan \(f\) on valittu, niin eräs ratkaisu käyränsovitusongelmaan on pienimmän neliösumman menetelmä.

Pienimmän neliösumman menetelmä

Pienimmän neliösumman menetelmässä pyritään minimoimaan regressiomallin virhetermien \(\varepsilon_j\) \[ \varepsilon_j = y_j - f(x_j;\beta ) \, , \quad j=1,2,\ldots ,n \] neliösummaa eli funktiota \[ F(\beta)= \sum_{j=1}^n\varepsilon_j^2 =\sum_{j=1}^n\big(y_j-f(x_j;\beta)\big)^2. \] muuttamalla parametrivektorin \(\mathbf{\beta}=(\beta_0,\beta_1,\ldots,\beta_m)\) arvoa. Optimaalinen \(\mathbf{\beta}\):n arvo on parametrin \(\beta\) pienimmän neliösumman estimaatti eli PNS-estimaatti.

Kysymys: Miksi ei minimoitaisi lauseketta \(\sum_{j=1}^n|y_j-f(x_j;\beta)|\) neliösumman sijasta?

PNS-sovitus


Kuvassa vihreällä parametreista \(\mathbf{\beta} = (\beta_1, \beta_2, \ldots , \beta_m)\) riippuva sovitettava funktio \(f(x;\mathbf{\beta})\) eräällä kiinteällä parametrin arvolla. Datapisteet \((x_j,y_j)\) ja vastaavat virhetermit \(\varepsilon_j\), kun \(j = 1, \ldots , n\).

Lineaarinen regressio

Lineaarisessa regressiossa \(f(x;\beta) = \beta_0-\beta_1 x\) jossa \(\beta = (\beta_0, \beta_1)\) ja neliösumma on \[ F(\beta_0,\beta_1)=\sum_i (y_i -\beta_0-\beta_1 x_i)^2. \] Etsitään piste \((\beta_0,\beta_1)\) siten, että \(\nabla F(\beta_0,\beta_1)=0\).

Lasketaan osittaisderivaatta \[ \frac{\partial}{\partial \beta_0}F(\beta_0,\beta_1) = 2\big(\beta_1\sum_i x_i+n\beta_0-\sum_i y_i\big). \] Ratkaistaan nollakohta \[ \beta_0=\frac{1}{n}\sum_i y_i-\frac{\beta_1}{n} \sum_i x_i =\overline{\mathbf{y}} -\beta_1 \overline{\mathbf{x}} \] missä \(\overline{\mathbf{x}}\) on datavektorin \(\mathbf{x} = (x_1, x_2, \ldots , x_n)\) komponenttien aritmeettinen keskiarvo.

Lasketaan seuraavaksi osittaisderivaatta \[ \frac{\partial}{\partial \beta_1}F(\beta_0,\beta_1) = 2\big(\beta_0\underbrace{\sum_i x_i}_{=n\overline{x}}+\beta_1\sum_i x_i^2-\sum_i x_iy_i\big). \] Sijoittamalla \(\beta_0\):n lauseke, saadaan \[ n\overline{\mathbf{x}} \overline{\mathbf{y}} - n \beta_1 \overline{\mathbf{x}} ^2+\beta_1 \sum_i x_i^2-\sum_i x_i y_i=0. \] Ratkaistaan nollakohta: \[ \beta_1=\frac{n\overline{\mathbf{x}} \overline{\mathbf{y}} -\sum_i x_iy_i}{n\overline{\mathbf{x}} ^2-\sum_i x_i^2} = \frac{\sum_i(x_i-\overline{\mathbf{x}})(y_i-\overline{\mathbf{y}})}{\sum_i(x_i-\overline{\mathbf{x}})^2}. \] Tarkista jälkimmäinen yhtälö!

Esimerkki

Sovita PNS-suora dataan

\(x_i\)0.01.02.03.04.0
\(y_i\) 2.10 1.92 1.84 1.71 1.64

ja estimoi (ekstrapoloi) \(y\) kun \(x=5\).

Saadaan \(\overline{\mathbf{x}}=2.0\), \(\overline{\mathbf{y}}= 1.842\), ja \[ \beta_1 = \frac{-1.13}{10.0} = -0.113. \] Siten \(\beta_0=1.842 +0.113\cdot 2.0= 2.068\). Näin ollen \(y=-0.113x + 2.068\), ja kysytty estimaatti pisteessä \(x=5\) on \(y=-0.113\cdot 5 + 2.068=1.503\).

Esimerkki: Toisen asteen sovitus

Tutkitaan lisäaineen määrän \(x\) vaikutusta kuivumisaikaan \(y\). Eri lisäaineen määrillä \(x_i\) (grammaa) saatiin kuivumisajat \(y_i\) (tuntia), \(i=1,\ldots,9\):

\(x_i\)0.01.02.03.04.05.06.07.08.0
\(y_i\) 11.0 9.4 9.1 7.0 6.2 7.1 6.6 7.5 8.2

Huomataan, että kuivumisajan riippuvuus lisäaineen määrästä on epälineaarista.

Minimikohdan estimoimiseksi sovitetaan havaintoihin paraabeli \[y=\beta_0+\beta_1x+\beta_2x^2.\]

Pienimmän neliösumman yhtälöryhmä mallille on \[ \frac{\partial}{\partial \beta_k} \sum(y_i-\beta_0-\beta_1x_i-\beta_2x_i^2)^2 = 0, \qquad k=0,1,2. \] Näistä saadaan yhtälöryhmä \[ \left\{ \begin{array}{rcl} n\beta_0 + \beta_1\sum x_i +\beta_2 \sum x_i^2 &=& \sum y_i,\\ \beta_0\sum x_i+\beta_1 \sum x_i^2+\beta_2 \sum x_i^3 &=& \sum x_iy_i\\ \beta_0\sum x_i^2+\beta_1 \sum x_i^3+\beta_2 \sum x_i^4 &=& \sum x_i^2y_i. \end{array}\right. \] Laskemalla yhtälöryhmän kertoimet havainnoista saadaan \[ \left\{ \begin{array}{rcl} 9\beta_0 + 36\beta_1 + 204\beta_2 &=& 72.1\\ 36\beta_0 +204\beta_1 + 1296 \beta_2 &=& 266.6 \\ 204 \beta_0 +1296\beta_1 + 8772\beta_2 &=& 1515.4 \end{array}\right. \]

Ratkaisuna ovat \( \beta_0=11.15\), \(\beta_1=-1.806\) ja \( \beta_2=0.1803\). Pienimmän neliösumman mielessä parhaiten havaintoihin liittyvä paraabeli on siten \[ y=11.15 - 1.806x + 0.1803 x^2. \]

8. Newtonin iteraatio

Newtonin menetelmä

Newtonin menetelmällä voidaan löytää (vähintäänkin derivoituvan) funktion \(f\colon \mathbb{R} \to \mathbb{R}\) nollakohta eli yhtälön \(f(x)=0\) ratkaisu. Silloin kun menetelmä toimii, se suppenee hyvin nopeasti. Silloin kun ei, niin...

Lähdetään liikkeelle jostakin pisteestä \(x_0\), joka on alkuarvaus yhtälön ratkaisulle. Arvioidaan funktiota \(f\) sen tangenttisuoralla pisteessä, eli funktiolla \(l(x)=f(x_0)+f'(x_0)(x-x_0)\). Ratkaistaan yhtälö \(l(x_1)=0\). Toistetaan edellinen käyttäen alkuarvauksena lukua \(x_1\) luvun \(x_0\) sijasta jne. Tämä menettely johtaa algoritmiin, jossa iteraatioaskeleet saadaan kaavasta \[ x_{n+1}= x_n-\frac{f(x_n)}{f'(x_n)}\,\qquad n=0,1,2,\ldots. \] Suppeneminen ja löytyvä nollakohta riippuvat alkuarvauksesta \(x_0\).

Esimerkki

Etsitään likiarvo luvulle \(\sqrt{5}\).
Koska \(2=\sqrt{4}<\sqrt{5}<\sqrt{9}=3\), niin valitaan \(x_0=2\) läheltä ratkaisua. Tässä \(f(x)=x^2-5\), joten \(f'(x)=2x\). Saadaan \[ x_1 = x_0 - \frac{f(2)}{f'(2)} = 2- \frac{4-5}{2\cdot 2}= \frac{9}{4}. \] \[ x_2 = x_1 - \frac{f(9/4)}{f'(9/4)} = \frac{9}{4} - \frac{27/16-5}{2\cdot 9/4} = \frac{161}{72} \approx 2.2361. \]

Huomaa, että \(\sqrt{5}\approx 2.236068\), eli jo kahdella iteraatiolla saatiin varsin hyvä likiarvo.

Esimerkki

Etsitään funktion \(f(x)=x^3-x+1\) nollakohdat.

Piirtämällä kuvaaja nähdään, että funktiolla on vain yksi nollakohta jossain pisteiden \(-2\) ja \(-1\) välissä. Asetetaan \(x_0=-1\).

Koska \(f'(x)=3x^2-1\) iteratioksi saadaan \[ x_{n+1} = x_n - \frac{x_n^3-x_n+1}{3x_n^2-1}. \] Saadaan \[ x_0=-1,\quad x_1= -1.5, \quad x_2 = -1.347826, \quad x_3=-1.325200. \] \[ x_4= -1.324718, \quad x_5=-1.324717, \quad \ldots \]

Newtonin menetelmä monen muuttujan tapauksessa

Newtonin menetelmä toimii myös funktion \(\mathbf{f} \colon \mathbb{R}^n\to\mathbb{R}^n\) tapauksessa. Tällöin iteraatiokaavassa oleva derivaatta pitää korvata Jacobin matriisilla \[ D\mathbf{f}(\mathbf{x}) = \begin{bmatrix} \frac{\partial f_1}{\partial x_1} & \frac{\partial f_1}{\partial x_2} & \cdots & \frac{\partial f_1}{\partial x_n}\\ \frac{\partial f_2}{\partial x_1} & \frac{\partial f_2}{\partial x_2} & \cdots & \frac{\partial f_2}{\partial x_n}\\ \vdots & \vdots & & \vdots \\ \frac{\partial f_m}{\partial x_1} & \frac{\partial f_m}{\partial x_2} & \cdots & \frac{\partial f_m}{\partial x_n} \end{bmatrix}. \] Iteraatioaskeleeksi saadaan \[ \mathbf{x}_{n+1} = \mathbf{x}_n- D\mathbf{f} (\mathbf{x}_n)^{-1}\mathbf{f}(\mathbf{x}_n), \quad n=0,1,2,\ldots, \] missä \(D\mathbf{f} (\mathbf{x}_n)^{-1}\) on \(D\mathbf{f} (\mathbf{x}_n)\):n käänteismatriisi.

Esimerkki

Etsitään \(\mathbf{f}(\mathbf{x})=\mathbf{0}\), kun \(\mathbf{x}_0=(1,0,1)\) ja \[ \mathbf{f}(x,y,z)=(x^2+y^2+z^2-3)\mathbf{i} + (x^2+y^2-z-1)\mathbf{j} +(x+y+z-3)\mathbf{k}. \]
Saadaan \[ D \mathbf{f} (x,y,z)=\begin{bmatrix}2x &2y & 2z\\ 2x&2y&-1\\ 1&1&1\end{bmatrix} \] ja voidaan laskea \[ \mathbf{x}_1 = (3/2,1/2,1),\quad \mathbf{x}_2 = (5/4,3/4,1)\quad \text{ ja }\quad \mathbf{x}_2 = (9/8,7/8,1), \] mikä on terveellisintä tehdä tietokoneella.

Nähdään, että iteraatiot konvergoivat kohti pistettä \((1,1,1)\), joka on tehtävän tarkka (ja kaikesta päätellen ainoa) ratkaisu.

9. Taso- ja avaruusintegraalit

Tasointegraali

Olkoon \(D\subset \mathbb{R}^2\) joukko tasossa ja \(f\colon D\to \mathbb{R}\) skalaarikenttä. Halutaan määritellä tasointegraali \[ \iint_D f(x,y)\,dA. \] Integraalin arvo on pinnan \(z=f(x,y)\) ja \(xy\)-tason väliin jäävän alueen tilavuus.

Tutkitaan aluksi erikoistapausta \(D=[a,b]\times [c,d]\).

Yhden muuttujan tapaus

Yhden muuttujan tapauksessa integraali saadaan Riemannin summien raja-arvona.

Riemannin summa

Formaalisti \[ \int_a^b f(x)\,dx = \lim_{n\to\infty} \sum_{i=1}^n f(x_i)\Delta x, \] missä \(a=x_0 < x_1 < \ldots < x_n=b\) on välin \([a,b]\) tasavälinen jako ja \(\Delta x\) on jakovälin pituus.

Usean muuttujan tapaus (tasointegraali, \(\mathbb{R}^2\))

Jaetaan tason osajoukko \(D=[a,b]\times [c,d]\) tasavälisesti ruudukoksi niin, että kummallakin akselilla on \(n\) jakopistettä.

taso-joukon jako

Nyt voidaan määritellä \[ \iint_D f(x,y)\,dA = \lim_{n\to\infty} \sum_{i=1}^n\sum_{j=1}^n f(x_i,y_j)\,\Delta x\Delta y, \] missä \[x_{i} = a + i\frac{b-a}{n},\qquad y_{j} = c + j\frac{d-c}{n}\] ja \(\Delta x\) sekä \(\Delta y\) vastaavat jakovälien pituutta \(x\) ja \(y\)-suunnassa: \[ \Delta x= \frac{b-a}{n},\quad \Delta y = \frac{d-c}{n}. \]

Usean muuttujan tapaus (avaruusintegraali, \(\mathbb{R}^3\))

Tason tapauksessa edellä määriteltyä integraalia kutsutaan tasointegraaliksi. Samaan tapaan voidaan määritellä avaruusintegraali: \[ \iiint_D f(x,y,y)\,dV = \lim_{n\to\infty} \sum_{i=1}^n\sum_{j=1}^n\sum_{k=1}^n f(x_i,y_j,z_k)\,\Delta x\Delta y\Delta z, \] kun \(D=[a_1,b_1]\times [a_2,b_2]\times[a_3,b_3] \subset \mathbb{R}^2\) ja \(f\colon D\to \mathbb{R}\). Tässä \[ \Delta x = \frac{b_1-a_1}{n},\quad \Delta y = \frac{b_2-a_2}{n}\text{ ja } \Delta z = \frac{b_3-a_3}{n}. \] Vieläkin useamman muuttujan funktioita \(f\colon D\subset \mathbb{R}^n\to\mathbb{R}\), missä \(n\ge 2\), voi integroida samaan tapaan.

Huomautuksia

Yhden muuttujan tapauksessa integraaleille pätee Analyysin (ensimmäinen) peruslause: \[ f(x)=\frac{d}{dx}\int_c^x f(t)\,dt,\textrm{ kun }c,x\in[a,b] \] ja \(f\colon [a,b]\to\mathbb{R}\) on jatkuva funktio.

Analyysin peruslauseesta seuraa, että integrointi ja derivointi ovat toistensa vastaoperaatiota, mikä johtaa moniin integroinnissa hyödyllisiin kaavoihin. Analyysin peruslauseella ei kuitenkaan ole aivan samanlaista vastinetta usean muuttujan tapauksessa; Greenin, Gaussin ja Stokesin lauseet ovat kuitenkin sille sukua.

Moninkertainen integraali

Monen muuttujan integraaleja voidaan usein kuitenkin laskea moninkertaisina integraaleina. Kaksiulotteinen tapaus (integrointialue suorakulmio) \[ \iint_D f(x,y)\,dA = \int_c^d \int_a^b f(x,y)\,dx\,dy,\text{ kun } D=[a,b]\times [c,d]. \] Kolmiulotteinen tapaus (integrointialue suorakulmainen särmiö) \[ \iiint_D f(x,y,z)\,dV = \int_{a_3}^{b_3}\int_{a_2}^{b_2}\int_{a_1}^{b_1} f(x,y,z)\,dx\,dy\,dz, \] kun \(D=[a_1,b_1]\times [a_2,b_2]\times [a_3,b_3]\).

Mikäli funktio \(f\colon \mathbb{R}^n \to \mathbb{R}\) (\(n=2,3,\ldots\)) on jatkuva, niin integroimisjärjestyksellä ei ole väliä integraalin arvon kannalta. Laskujen helppouden kannalta väliä kuitenkin on.

Esimerkki

Olkoon \(f(x,y)=xy^2\). Lasketaan \[ \iint_D f(x,y)\,dA,\text{ kun } D=\{(x,y)\in \mathbb{R}^2: 0\le x\le1, \,0\le y\le 1\}. \]
Aluksi kirjoitetaan tasointegraali kaksinkertaisena integraalina, ja lasketaan \begin{align*} \iint_D xy^2\,dA &= \int_0^1\int_0^1 xy^2\,dx\,dy = \int_0^1\bigg[\frac{x^2y^2}{2}\bigg]_{x=0}^{1}\,dy \\ &= \int_0^1 \frac{y^2}{2}\,dy \bigg[\frac{y^3}{6}\bigg]_{y=0}^1 = \frac{1}{6}. \end{align*}

Esimerkki
Olkoon \(f(x,y,z)=xye^z\). Lasketaan \[ \iiint_D f(x,y,z)\,dV,\text{ missä } D=[0,2]\times [0,1] \times [-1,1]. \]
Kirjoitetaan avaruusintegraali kolminkertaisena integraalina. Lasketaan \begin{align*} &\iiint_D xye^z\,dV = \int_{-1}^1\int_0^1\int_0^2 xye^z\,dx\,dy\,dz \\ &\quad = \int_{-1}^1\int_0^1 \frac{x^2ye^z}{2}\bigg|_{x=0}^2\,dy\,dz = \int_{-1}^1\int_0^1 2ye^z\,dy\,dz \\ &\quad = \int_{-1}^1 y^2e^z\bigg|_{y=0}^1\,dz = \int_{-1}^1 e^z\,dz = e^z\Big|_{z=-1}^1 = e -e^{-1}. \end{align*}

Integrointi yleisemmissä alueissa

Tutkitaan funktiota \(f\colon D\to \mathbb{R}\), joka on määritelty tason (tai avaruuden) osajoukossa \(D\). Tähän asti on oletettu, että \(D\) on suorakaide (vast. suorakulmainen särmiö). Yleisemmässä tapauksessa voidaan tarkastella suorakulmiota \(\hat D\), jolle \(D\subset \hat D\). Jotta integraali olisi määritelty, täytyy joukon \(D\) olla ''siisti'' (riittää esimerkiksi, että reuna on paloittain sileä).

yleinen alue D

Määritellään funktio \(\hat f\colon \hat D \to \mathbb{R}\) seuraavasti: \[ \hat f(x,y) = \left\{ \begin{array}{rcl} f(x,y), &\text{kun} &(x,y) \in D,\\ 0, & \text{kun} & (x,y) \in \hat D \setminus D. \end{array}\right. \] Nyt voidaan määritellä \[ \iint_D f(x,y)\,dA := \iint_{\hat D} \hat f(x,y)\,dA. \] Samaan tapaan voidaan määritellä myös avaruusintegraali ei-suorakulmaisen integroimisalueen tapauksessa: \[ \iiint_D f(x,y,z)\,dV := \iiint_{\hat D} \hat f(x,y,z)\,dV, \] kun \(\hat D\) on suorakulmainen särmiö ja \(D \subset \hat D\).

Esimerkki

Olkoon \( D=\{(x,y)\in \mathbb{R}^2 : 0 < x < 1,\, 0 < y < x\} \). Lasketaan funktion \(f(x,y)=xy\) integraali yli alueen \(D\).

\begin{align*} &\iint_D xy\,dA = \int_0^1\bigg(\int_0^x xy\,dy\bigg)dx \\ &\quad \int_0^1\frac{xy^2}{2}\bigg|_{y=0}^x\,dx = \int_0^1\frac{x^3}{2}\,dx = \frac{x^4}{8}\bigg|_{x=0}^1 =\frac{1}{8}. \end{align*} Integrointi on mahdollista suorittaa myös toisessa järjestyksessä: \begin{align*} &\iint_D xy\,dA = \int_0^1\bigg(\int_y^1 xy\,dx\bigg)dy \\ &\quad = \int_0^1\frac{x^2y}{2}\bigg|_{x=y}^1\,dy = \int_0^1\frac{y}{2}-\frac{y^3}{2}\,dy \\ &\quad = \bigg[\frac{y^2}{4}-\frac{y^4}{8}\bigg]_{y=0}^1 = \frac{1}{4}-\frac{1}{8} = \frac{1}{8}. \\ \end{align*}

Esimerkki

Lasketaan funktion \(f(x,y)=e^{x^2}\) integraali edellisen esimerkin alueessa.

\[ \iint_D e^{x^2}\,dA = \int_0^1\bigg(\int_0^x e^{x^2}\,dy\bigg)dx =\int_0^1 xe^{x^2}\,dx \] Sijoituksella \(t=x^2\), \(dt=2x\,dx\) saadaan \[ \frac{1}{2}\int_0^1e^t\,dt = \frac{1}{2}e^t\bigg|_{t=0}^1 = \frac{e}{2}-\frac{1}{2}. \]

Huomautus. Integroimisjärjestyksellä on väliä. Integraali \[ \int_0^1\bigg(\int_y^1e^{x^2}\,dx\bigg)dy \] on "hyvin vaikea" laskea.

9.1. Epäoleelliset integraalit. Muuttujanvaihto taso- ja avaruusintegraaleissa

Epäoleelliset integraalit

Tähän asti integrointi on tapahtunut rajoitetussa alueessa rajoitetulle funktiolle (integrandille). Joskus voidaan kuitenkin integroida rajoittamattomia funktioita ja/tai rajoittamattomassa alueessa.

Tarkastellaan ainoastaan tapausta, jossa funktio \(f\) on ei-negatiivinen eli \(f(\mathbf{u}) \ge 0\) kaikilla \(\mathbf{u}\in D\). Lasketaan funktion \(f(x,y) = e^{-x^2}\) integraali alueessa suorien \(y=\pm x\) rajoittamassa rajoittamattomassa alueessa \(D\), jossa \(x>0\). Mikäli integraali on suppenee, sen arvo saadaan laskemalla \[ \iint_D e^{-x^2}\,dA = \int_0^\infty \int_{-x}^{x} e^{-x^2}\,dy\,dx = \int_0^\infty 2xe^{-x^2}\,dx \] \[ = \lim_{R\to \infty} \int_0^R 2xe^{-x^2}\,dx. \] Integraalin laskemiseksi huomataan, että \(\frac{d}{dx} e^{-x^2} = -2xe^{-x^2}\). Siten \[ \lim_{R\to \infty} \int_0^R 2xe^{-x^2}\,dx = \lim_{R\to\infty} -e^{-x^2}\Big|_{x=0}^R = \lim_{R\to\infty}1-e^{-R^2}=1. \]

Esimerkki

Olkoon \[D_1=\lbrace (x,)\in \mathbb{R}^2 : 0 < x < 1, \, |y| \leq x^2 \rbrace\] ja rajoittamaton funktio \(f(x,y)=1/x^2\).

(i) Lasketaan integraali \[ \iint_{D_1}\frac{1}{x^2}\,dA =\int_0^1\int_{-x^2}^{x^2}\frac{1}{x^2}\,dy\,dx \] \[ =\int_0^1 2\,dx =2. \]

Alue D_1
Alue \(D_1\)

(ii) Lasketaan saman funktion integraali alueessa \[D_2=\lbrace (x,y)\in\mathbb{R}^2 : 0 < x < 1,\, |y|\leq \sqrt{x}\rbrace.\] \[ \iint_{D_2}\frac{1}{x^2}\,dA =\int_0^1\int_{-\sqrt{x}}^{\sqrt{x}}\frac{1}{x^2}\,dy\,dx \] \[ =\int_0^1 2\sqrt{x}\frac{1}{x^2}\,dx =\int_0^1 2x^{-3/2}\,dx =\lim_{\epsilon\to 0+} \frac{2x^{-1/2}}{-1/2}\bigg|_{x=\epsilon}^1 = \infty. \] Suppeneminen riippuu integroitavan funktion lisäksi myös alueesta!

Alue D_2
Alue \(D_2\)

Muuttujanvaihto taso- ja avaruusintegraaleissa

Tutkitaan funktiota \(\mathbf{F}\colon G \to D\), missä \(D\) ja \(G\) ovat \(\mathbb{R}^2\):n osajoukkoja. Oletetaan, että funktion \(\mathbf{F}\) kaikki osittaisderivaatat ovat olemassa ja jatkuvia. Lisäksi oletetaan, että \(\mathbf{F}\) on bijektio: Jokaista pistettä \((x,y) \in D\) vastaa yksikäsitteinen piste \((u,v)\in G\), jolle \(\mathbf{F}(u,v)= (x,y)\). Tällöin erityisesti \(D=\mathbf{F}(G)\).

muuttujanvaihto 
\(\big(x(u,v),y(u,v)\big)=\mathbf{F}(u,v)\)

Tutkitaan aluksi muuttujanvaihtoa tasointegraalin tapauksessa: \[ \iint_D f(x,y)\,dx\,dy = \iint_{G} ??? \,du\,dv. \] Tarvitaan tieto siitä, miten pinta-ala skaalautuu funktiossa \((x,y) = \mathbf{F}(u,v)\).

muuttujanvaihto
Kuvassa \(\mathbf{a}\) (vast. \(\mathbf{b}\)) sijaitsee käyrällä, jolla \(v\) (vast. \(u\)) on vakio. Koska funktiolla \(\mathbf{F}\) on jatkuvat osittaisderivaatat, käyrät ovat sileitä.

Ketjusäännöllä \[ dx = \frac{\partial x}{\partial u}du + \frac{\partial x}{\partial v}dv\text{ ja } dy = \frac{\partial y}{\partial u}du + \frac{\partial y}{\partial v}dv. \] Edettäessä vektorin \(\mathbf{a}\) suuntaan \((x,y)\)-koordinaateissa, koordinaatti \(v\) on vakio ja siten \(dv=0\). Saadaan \[ \mathbf{a} \approx \frac{\partial x}{\partial u}du\,\mathbf{i} + \frac{\partial y}{\partial u}du\,\mathbf{j}. \] Samaan tapaan voidaan päätellä, että \[ \mathbf{b} \approx \frac{\partial x}{\partial v}dv\,\mathbf{i} + \frac{\partial y}{\partial v}dv\,\mathbf{j}. \] Tässä \(\mathbf{i}\) ja \(\mathbf{j}\) ovat koordinaattiakseleiden suuntaiset yksikkövektorit.

Approksimaatiokaava pinta-alaelementin \(dA\) muutokselle siis on \[ dA = dx \, dy \approx |\mathbf{a} \times \mathbf{b}| = \left\|\begin{array}{ccc} \mathbf{i} & \mathbf{j} & \mathbf{k} \\ \frac{\partial x}{\partial u}du & \frac{\partial y}{\partial u}du & 0 \\ \frac{\partial x}{\partial v}dv & \frac{\partial y}{\partial v}dv & 0 \end{array}\right\| \] Käytetään merkintää (huom. neliömatriiseille \(\det A=\det A^T\)) \[ \left\|\begin{array}{cc} \frac{\partial x}{\partial u} & \frac{\partial x}{\partial v} \\ \frac{\partial y}{\partial u} & \frac{\partial y}{\partial v} \end{array}\right\|\,du\,dv := \big|\det D \mathbf{F}(u,v)\big|\,du\,dv. \] Determinantti \(\det D \mathbf{F}(u,v)\) on funktion \(\mathbf{F}\colon \mathbb{R}^2\to \mathbb{R}^2\) Jacobin determinantti. Sille käytetään myös merkintää \[ \det D \mathbf{F}(u,v)=\frac{\partial(x,y)}{\partial(u,v)} \text{ kun } (x,y) = \mathbf{F}(u,v). \]

Jacobin determinantin itseisarvo \(|\det D \mathbf{F}(u,v)|\) kertoo paikallisen pinta-alan muutoksen kuvattaessa \((u,v)\)-koordinaattien infinitesimaalinen pinta-ala \(du\,dv\) vastaavalle \((x,y)\)-koordinaateissa lausutulle pinta-alalle \(dx\,dy\) funktion \((x,y) = \mathbf{F}(u,v)\) välityksellä.

Tasointegraalin muuttujanvaihtokaavaksi siis saadaan \[ \iint_D f(x,y) \,dx\,dy = \iint_{G} g(u,v) \big | \det D\mathbf{F} (u,v)\big| \,du\,dv \] missä \(g(u,v)=f(x(u,v),y(u,v))\) ja \(D=\mathbf{F}(G)\). Tässä \(\mathbf{F}\) on integroimisalueiden \(D\) ja \(G\) välinen bijektio. Jacobin determinantin etumerkki kertoo, onko \(\mathbf{F}\) suunnan säilyttävä vai kääntävä. Itseisarvo tarvitaan, jotta positiivisen funktion integraali ei muuttuisi negatiiviseksi eräillä \(\mathbf{F}\).

Esimerkki

Lasketaan neljän paraabelin \(y=x^2\), \(y=2x^2\), \(x=y^2\) ja \(x=3y^2\) rajoittamaan alueen \(D\) pinta-ala.

Huomataan, että integroimisalue kuvautuu suorakulmioksi \(G = [1/2 , 1] \times [1/3 , 1]\) muunnoksella \[ \mathbf{G}(x,y) = u\mathbf{i} + v\mathbf{j}, \quad u(x,y)=\frac{x^2}{y},\,\,v(x,y)=\frac{y^2}{x}. \]

muuttujanvaihto
Integrointi suorakulmion yli on paljon helpompaa.

Halutaan kuitenkin käänteiskuvaus \(\mathbf{F} = \mathbf{G}^{-1}\colon G\to D\), joka vie koordinaatit \((u,v)\) käyräviivaisille \((x,y)\)-koordinaateille. Lineaarialgebran perusteella \[ \det D {{\mathbf{F}}}(u,v)=\frac{1}{\det D \mathbf{G}(x,y)}. \] Lasketaan \[ \frac{\partial u}{\partial x} = \frac{2x}{y}, \quad \frac{\partial u}{\partial y} = -\frac{x^2}{y^2}. \] Saadaan myös \[ \frac{\partial v}{\partial x} = -\frac{y^2}{x^2}, \quad \frac{\partial v}{\partial y} = \frac{2y}{x}. \]

Lasketaan edelleen \[ \det D \mathbf{G}(x,y) = \left|\begin{array}{cc} \frac{\partial u}{\partial x} & \frac{\partial u}{\partial y} \\ \frac{\partial v}{\partial x} & \frac{\partial v}{\partial y} \end{array}\right| = \left|\begin{array}{cc} \frac{2x}{y} & -\frac{x^2}{y^2} \\ -\frac{y^2}{x^2} & \frac{2y}{x} \end{array}\right| \] \[ = 4-1 = 3,\text{ eli } \big|\det D {\mathbf{F}} (u,v)\big|=\frac{1}{3}. \] Tulokseksi siis saadaan \[ \iint_D 1\,dx\,dy = \iint_G \frac{1}{3}\,du\,dv = \frac{1}{3}\cdot \frac{2}{3}\cdot \frac{1}{2} = \frac{1}{9}. \] Yleensä ei käy niin onnellisesti, että sama koordinaatistomuunnos vie integroitavan alueen suorakulmiolle samalla kun integroitava funktio menee vakioksi.

9.2. Napa-, sylinteri- ja pallokoordinaatistot. Pintaintegraali

Napakoordinaatit

Piste \((x,y)\in \mathbb{R}^2\) voidaan kirjoittaa muodossa \((r,\theta)\), missä \(r\geq0\) ja \(0\le \theta < 2\pi\). Napakulma \(\theta\) on yksikäsitteinen jos \(r > 0\).

napakoordinaatisto

Alkeisgeometriasta saadaan kaavat \[ \left\{ \begin{array}{l} x=r\cos \theta\\ y=r\sin \theta \end{array}\right. \Leftrightarrow \left\{ \begin{array}{l} r^2=x^2+y^2 \\ \tan{\theta} = y/x. \end{array}\right. \] Vrt. kompleksiluvun polaarimuoto \(x + i y = r e^{i \theta}\).

Koordinaatistomuunnoksen \((r, \theta) \mapsto (x,y)\) Jacobin determinantille saadaan kaava \[ \frac{\partial(x,y)}{\partial (r,\theta)} = \left|\begin{array}{cc} \frac{\partial x}{\partial r} & \frac{\partial x}{\partial \theta}\\ \frac{\partial y}{\partial r} & \frac{\partial y}{\partial \theta} \end{array}\right| = \left|\begin{array}{cc} \cos \theta & -r\sin \theta\\ \sin \theta & r\cos\theta \end{array}\right| = r. \] Siten muuttujanvaihtokaavaa varten saadaan pinta-alan venytys \[ dx\,dy = \bigg|\frac{\partial(x,y)}{\partial (r,\theta)}\bigg| \,dr\,d\theta = r\,dr\,d\theta. \] Tasointegraali napakoordinaateissa \[ \iint_D f(x,y)\,dx\,dy = \iint_G g(r,\theta)r\,dr\,d\theta, \] missä \(g(r,\theta) = f(r\cos\theta,r\sin\theta)\).

Esimerkki

(i) Olkoon \(D=\lbrace (x,y)\in \mathbb{R}^2 : 1 < x^2 + y^2 < 4\rbrace\). Lasketaan napakoordinaateissa integraali \[ I=\iint_D \frac{1}{x^2+y^2}\,dx\,dy. \] Saadaan \[ I=\int_0^{2\pi}\int_1^2\frac{1}{r^2}r\,dr\,d\theta = \int_0^{2\pi} d\theta \cdot \int_1^2\frac{dr}{r} =2\pi\ln r\Big|_{r=1}^2 = 2\pi \ln 2. \]

(ii) Integraali \[ \int_{-\infty}^\infty e^{-x^2}\,dx \] on erittäin tärkeä mm. todennäköisyyslaskennassa ja tilastotieteessä. Tämä integraali on vaikea, koska integraalifunktiota ei ole mahdollista kirjoittaa alkeisfunktioiden avulla.

Integraali on kuitenkin mahdollista laskea seuraavan tempun avulla: Huomataan aluksi, että \[ I = \int_{-\infty}^\infty \int_{-\infty}^\infty e^{-x^2-y^2}\,dx\,dy = \bigg(\int_{-\infty}^\infty e^{-x^2}\,dx\bigg)^2. \] Laskemalla epäoleellinen tasointegraali napakoordinaateissa \[ I = \int_0^{2\pi}\int_0^\infty e^{-r^2}r\,dr\,d\theta = \int_0^{2\pi}d\theta \cdot \int_0^\infty r e^{-r^2}\,dr \] \[ = 2\pi \int_0^\infty{r e^{-r^2}\,dr} = -\pi \lim_{R \to \infty}{\int_0^R (-2r) e^{-r^2}\,dr}. \]

Nyt \(\frac{d}{dr} e^{-r^2} = -2r e^{-r^2}\), joten integraaliksi saadaan: \[ \int_0^R (-2r) e^{-r^2}\,dr = e^{-R^2} - 1 \] Viemällä \(R \to \infty\) tulee \(I = \pi\) ja siitä alkuperäisen integraalin arvo \[ \int_{-\infty}^\infty e^{-x^2}\,dx = \sqrt{I} = \sqrt{\pi}. \] Miksi temppu toimi?

Muuttujanvaihto avaruusintegraalissa

Muunnoskaavat \((u,v,w) \mapsto (x,y,z)\) ovat \[ \left\{ \begin{array}{l} x=x(u,v,w),\\ y=y(u,v,w),\\ z=z(u,v,w). \end{array}\right. \] Tällöin \[ dx\,dy\,dz = \bigg|\frac{\partial(x,y,z)}{\partial (u,v,w)}\bigg|\,du\,dv\,dw, \] missä \[ \frac{\partial(x,y,z)}{\partial (u,v,w)} = \left|\begin{array}{ccc} \frac{\partial x}{\partial u} & \frac{\partial x}{\partial v} & \frac{\partial x}{\partial w} \\ \frac{\partial y}{\partial u} & \frac{\partial y}{\partial v} & \frac{\partial y}{\partial w}\\ \frac{\partial z}{\partial u} & \frac{\partial z}{\partial v} & \frac{\partial z}{\partial w} \end{array}\right|. \] Jos siis \(g(u,v,w) = f(x(u,v,w),y(u,v,w),z(u,v,w))\), niin \[ \iiint_D f(x,y,z)\,dx\,dy\,dz = \iiint_G g(u,v,w)\, \bigg|\frac{\partial(x,y,z)}{\partial (u,v,w)}\bigg|\,du\,dv\,dw. \]

Sylinterikoordinaatit

Koordinaatit \((r,\theta,z)\), missä \(r \geq 0\), \(0\le \theta<2\pi\), \(z\in\mathbb{R}\). Suoralla \(r = 0\) (eli \(z\)-akselilla) napakulma \(\theta\) ei ole yksikäsitteinen.
sylinterikoordinaatisto

Tällöin muunnoskaavat \((r,\theta,z) \mapsto (x,y,z)\) ovat \begin{align*} \begin{cases} x &= r\cos\theta, \\ y &= r\sin\theta, \\ z &= z. \end{cases} \end{align*} Ja muunnoksen Jacobin determinantiksi saadaan \[ dx\,dy\,dz = \bigg|\frac{\partial(x,y,z)}{\partial (r,\theta,z)}\bigg|\,dr\,d\theta\,dz = r\,dr\,d\theta\,dz. \]

Sylinterikoordinaateissa on helppo esittää pyörähdyskappaleita \(z\)-akselin ympäri muodossa \[ r = f(z), \quad \text{jossa} \quad z \in [a,b] \text{ ja } \theta \in [0, 2 \pi), \] missä \(f\) on ei-negatiivinen funktio. Sylinterisymmetriset tehtävät!

Esimerkki

Lasketaan funktion \(f\) määräämän pyörähdyskappaleen \(\Omega\) tilavuus \[ \iiint_{\Omega} dx\, dy\, dz = \int_a^b\int_0^{2\pi}\int_0^{f(z)} r\,dr\,d\theta\,dz \] \[ = \int_a^b \left (2\pi \cdot \frac{1}{2}f(z)^2 \right ) \, dz = \pi \int_a^b f(z)^2 \, dz, \] mikä lienee tuttu kaava.

Pallokoordinaatit

Koordinaatit \((r,\theta,\phi)\), missä \(r \geq 0\), \(0\le \theta<2\pi\), \(0\le \phi \leq \pi\).

palookoordinaatisto

Korotus- eli napakulmaa \(\pi/2 - \phi\) käytetään usein \(\phi\):n sijasta. Atsimuuttikulma \(\theta\) ja korotuskulma ovat yksikäsitteisiä, jos pisteen etäisyys \(z\)-akselista \( > 0\). Muunnoskaavat ovat \begin{align*} \begin{cases} x&=r\sin\phi \cos\theta,\\ y&=r\sin\phi \sin\theta,\\ z&=r\cos\phi, \end{cases} \end{align*} ja muunnoksen Jacobin determinantiksi saadaan \[ dx\,dy\,dz = \bigg|\frac{\partial(x,y,z)}{\partial (r,\theta,\phi)}\bigg|\,dr\,d\theta\,d\phi = r^2\sin\phi \,dr\,d\theta\,d\phi. \]

Esimerkki

Lasketaan \(R\)-säteisen pallon \(\mathbb{B}^3(R)\) tilavuus: \[ V(\mathbb{B}^3) = \iiint_{\mathbb{B}^3(R)} 1\,dx\,dy\,dz = \int_0^R\int_0^{2\pi}\int_0^\pi r^2\sin\phi\,d\phi\,d\theta\,dr \] \[ = \int_0^R\int_0^{2\pi} -r^2\cos\phi\bigg|_{\phi=0}^\pi\,d\theta\,dr = \int_0^R\int_0^{2\pi} 2r^2\,d\theta\,dr \] \[ =\int_0^R 4\pi r^2\,dr = \frac{4\pi r^3}{3}\bigg|_{r=0}^R = \frac{4\pi R^3}{3}. \]

Kaksiulotteinen pinta-ala avaruudessa

Tutkitaan kaksiulotteista kaareutuvaa pintaa \(S\), joka on (piirtämisen helpottamiseksi) \(xy\)-tason yläpuolella avaruudessa \(\mathbb{R}^3\).

Tarkastellaan aluksi \(xy\)-tason neliön yläpuolelle jäävän osan pinta-alaa. Se on ilmeisesti suurempi tai yhtäsuuri kuin vastaavan neliön pinta-ala.

Tästä johtuen pinta-aladifferentiaali \(dS\) on suurempi tai yhtäsuuri kuin kuin \(dx\,dy\). Itseasiassa \(dx\,dy\) saadaan, jos \(dS\) projisoidaan \(xy\)-tasoon. Projektio voidaan kirjoittaa kaavana \[ dx\,dy = \cos \gamma\,dS, \] missä \(\gamma\) on pinnan \(S\) normaalivektorin \(\mathbf{N}\) ja \(z\)-akselin suuntaisen yksikkövektorin \(\mathbf{k}\) välinen kulma. Toisaalta pistetulon määritelmästä saadaan \[ \mathbf{N} \cdot \mathbf{k} = \|\mathbf{N}\| \|\mathbf{k}\| \cos \gamma, \] ja siis \[ dS = \frac{1}{\cos \gamma}\,dx\,dy = \frac{\|\mathbf{N}\| \|\mathbf{k}\|}{\mathbf{N} \cdot \mathbf{k}}\,dx\,dy. \]

Aikaisemmin on johdettu pinnan (ylöspäin suunnatulle) normaalivektorille esitys \[ \mathbf{N} = -\frac{\partial z}{\partial x}\mathbf{i} - \frac{\partial z}{\partial y}\mathbf{j} + \mathbf{k}. \] Saadaan \[ \|\mathbf{N}\| = \sqrt{1+ \Big(\frac{\partial z}{\partial x}\Big)^2 + \Big(\frac{\partial z}{\partial y}\Big)^2} \] Lisäksi \(\|\mathbf{k} \| =1\) ja \(\mathbf{N}\cdot \mathbf{k} = 1\), joten \[ dS = \sqrt{1+ \Big(\frac{\partial z}{\partial x}\Big)^2 + \Big(\frac{\partial z}{\partial y}\Big)^2}\,dx\,dy. \] Kaltevuuden huomioiva korjaustekijä yleistää tasointegraalin pintaintegraaliksi.

Esimerkki

Tarkastellaan sylinterin \(x^2+y^2=a^2\), \(a>0\) leikkaamaa palasta hyperbolisesta paraboloidista \(z=x^2-y^2\). Mikä on palasen pinta-ala?

Lasketaan \[ \frac{\partial}{\partial x} z = 2x,\qquad \frac{\partial}{\partial y} z = -2y. \] Siten pinta-aladifferentiaaliksi saadaan \[ dS = \sqrt{1+ \Big(\frac{\partial z}{\partial x}\Big)^2 + \Big(\frac{\partial z}{\partial y}\Big)^2}\,dx\,dy \] \[ = \sqrt{ 1 + 4(x^2+y^2)} \,dx\,dy \] \[ =\sqrt{1+ 4r^2}\, r\,dr\,d\theta, \] napakoordinaateissa ilmaistuna.

Lasketaan nyt integraali napakoordinaateissa: \[ \textrm{Ala}(S)= \int_0^{2\pi} \int_0^a r\sqrt{1+4r^2}\,dr\,d\theta \] \[ = \frac{\pi}{4} \int_0^a 8r\sqrt{1+4r^2}\,dr \] \[ = \frac{\pi}{4} \bigg|_{r=0}^a\frac{2}{3}(1+4r^2)^{3/2} =\frac{\pi}{6} \big[(1+4a^2)^{3/2} -1\big]. \]

9.3. Taso- ja avaruusintegraalien sovellutuksia

Moninkertaisten integraalien sovelluksia

Tähän mennessä moninkertaisten integraalien sovelluksina on esiintynyt:

  • Alueen \(D \subset \mathbb{R}^2\) pinta-ala \[ \textrm{A}(D) = \iint_D 1\,dA \]

  • Kappaleen \(D \subset \mathbb{R}^3\) tilavuus \[ \textrm{V}(D) = \iiint_D 1\,dV \]

Mekaniikassa tulevat lisäksi vastaan nämä:

  • Kappaleen massa \[ m(D) = \iiint_D \rho(x,y,z)\,dV \] ja hitausmomentti kappaleen pyöriessä \(z\)-akselin ympäri: \[ I_z(D) = \iiint_D\rho(x,y,z)(x^2+y^2)\,dV. \] Tässä \(\rho(x,y,z)\) on materiaalin tiheys pisteessä \((x,y,z)\).

  • Kaksiulotteisen tasolevyn keskiön (painopiste) \((\bar x,\bar y)\) laskeminen \[ \bar x = \frac{1}{A(D)} \iint_D x\,dA, \qquad \bar y = \frac{1}{A(D)} \iint_D y\,dA, \] jossa pinta-ala \(A(D)\) on laskettu tasointegraalilla jo aiemmin.

    Jos levyn massa ei ole tasaisesti jakautunut, integraalia korjataan paikasta riippuvalla tiheydellä \(\rho(x,y)\) \[ \bar x = \frac{1}{m(D)} \iint_D x \rho(x,y) \,dA, \qquad \bar y = \frac{1}{m(D)} \iint_D y \rho(x,y) \,dA. \] jossa massa \(m(D) = \iint_D \rho(x,y) \,dA \) lasketaan tasointegraalilla.

Massakeskipiste

Kolmiulotteisen kappaleen \(D\) massakeskipiste \((\bar x,\bar y, \bar z)\) \[ \bar x = \frac{1}{m(D)} \iiint_D x \rho(x,y,z)\,dV, \] \[ \bar y = \frac{1}{m(D)} \iiint_D y \rho(x,y,z)\,dV, \] \[ \bar z = \frac{1}{m(D)} \iiint_D z \rho(x,y,z)\,dV, \] missä \(\rho = \rho(x,y,z)\) on kappaleen tiheys pisteessä \((x,y,z)\) ja \(m(D)\) on kappaleen massa (tilavuusintegraalilla). Kaava voidaan kirjoittaa myös vektorimuodossa \[ \bar x\mathbf{i} + \bar y \mathbf{j} + \bar z\mathbf{k} = \frac{\iiint_D \mathbf{r} \rho\, dV}{\iiint_D\rho \,dV}, \] missä \(\mathbf{r} = x\mathbf{i} + y\mathbf{j} + z\mathbf{k}\).

Esimerkki

Lasketaan epäyhtälöiden \(0\le x\le 1\), \(0\le y\le 1\) ja \(0\le z\le 1\) määräämän yksikkökuution \(D\) massakeskipiste, kun tiheys \(\rho(x,y,z)= z\).

Huomautus. Yksikkökuutio \(D\) voidaan myös määritellä käyttäen niin kutsuttua karteesista tuloa: \[ D = [0,1] \times [0,1] \times [0,1] = [0,1]^3. \] Tämä merkintätapa tarkoittaa samaa kuin ylläoleva määritelmä epäyhtälöiden avulla.

Lasketaan ensin massa \[ \iiint_D \rho \,dV = \int_0^1 \int_0^1 \int_0^1 z \,dx\,dy\,dz \] \[ = \int_0^1 z\,dz = \bigg|_{z=0}^1\frac{1}{2}z^2 = \frac{1}{2}. \] Saadaan \[ \bar x = \frac{\int_0^1 \int_0^1 \int_0^1 xz \,dx\,dy\,dz}{1/2} = \frac{\Big(\Big|_{x=0}^1 \frac{1}{2}x^2\Big)\Big(\Big|_{z=0}^1 \frac{1}{2}z^2\Big)}{1/2} \] \[ = \frac{(1/2)^2}{1/2} = \frac{1}{2}. \]

Vastaavasti \[ \bar y = \frac{\int_0^1 \int_0^1 \int_0^1 yz \,dx\,dy\,dz}{1/2} = \frac{(1/2)^2}{1/2} = \frac{1}{2}. \] Edelleen voidaan laskea \[ \bar z = \frac{\int_0^1 \int_0^1 \int_0^1 z^2 \,dx\,dy\,dz}{1/2} = \frac{\Big|_{z=0}^1 \frac{1}{3}z^3}{1/2} \] \[ = \frac{(1/3)}{(1/2)} = \frac{2}{3}. \] Massakeskipisteeksi saadaan \[ (\bar x, \bar y,\bar z) = (1/2,1/2,2/3). \]

Hitausmomentti

Tarkastellaan tilannetta, jossa pistemäiset kappaleet kiertävät origoa \(xy\)-tasossa ympyrän muotoista rataa pitkin samalla kulmanopeudella.

Kappaleiden yhteenlaskettu liike-energia saadaan laskemalla summa \[ E= \sum_{i=1}^N \frac{1}{2} m_iv_i^2= \frac{1}{2} \Big[\sum_{i=1}^N m_i r_i^2\Big]\omega^2= \frac{1}{2}\Big[\sum_{i=1}^N m_i(x_i^2+y_i^2)\Big]\omega^2, \] missä \(\omega\) on kulmanopeus ja \(m_i\), \(x_i\) sekä \(y_i\) ovat \(i\):nnen kappaleen massa ja paikka. Summaa \[ \sum_{i=1}^N m_i(x_i^2+y_i^2) = \sum_{i=1}^N m_i r_i^2 \] kutsutaan hitausmomentiksi. Ajattelemalla \(z\)-akselin ympäri pyörivä kappale joukoksi "infinitesimaalisen pieniä" pisteitä, voidaan edelläolevasta summasta päätellä kappaleen liike-energia: \[ E=\frac{1}{2} \bigg[ \iiint_D (x^2+y^2)\rho(x,y,z)\,dV\bigg]\omega^2 =\frac{1}{2} I_z\omega^2, \] missä \[ I_z = \iiint_D(x^2+y^2)\rho(x,y,z)\,dV = \iiint_D r_z^2 dm \] on kappaleen hitausmomentti \(z\)-akselin suhteen (\(r_z^2 = x^2 + y^2\) ja massa-alkio \(dm = \rho(x,y,z)\,dV\)).

Esimerkki

Lasketaan sylinterin \[ D= \{(x,y,z): x^2+y^2\le a^2\textrm{ ja }0\le z\le 1\},\qquad a>0 \] hitausmomentti \(z\)-akselin suhteen, kun tiheys on vakio \(\rho=\rho_0\).

Lasketaan \[ I_z = \iiint_D (x^2+y^2)\rho_0\,dV \] \[ = \rho_0 \int_0^1 \int_0^{2\pi}\int_0^a r^2r \,dr\,d\theta\,dz \] \[ = 2\pi\rho_0\int_0^ar^3\,dr = \frac{1}{2}\pi\rho_0a^4. \] Toisaalta sylinterin massa on \[ m=\iiint_D \rho_0\,dV = \rho_0\textrm{V}(D)=\rho_0\pi a^2. \] Siten hitausmomentti voidaan kirjoittaa \[ I_z = \frac{1}{2}(\pi \rho_0a^2)a^2 = \frac{1}{2}ma^2. \]