Differentiaali- ja integraalilaskenta 2
Site: | Aalto OpenLearning |
Course: | Differentiaali- ja integraalilaskenta 2, kevät 2022 (Aalto MOOC) |
Book: | Differentiaali- ja integraalilaskenta 2 |
Printed by: | Guest user |
Date: | Thursday, 21 November 2024, 4:11 PM |
1. Käyrän parametrisointi
Parametrisointi
Muodollisesti käyrällä tarkoitetaan parametrisoitua joukkoa \(C\subset \mathbb{R}^n, n \geq 2\), joka voidaan esittää muodossa \[C=\lbrace \mathbf{r}(t) : t\in I\rbrace = \mathbf{r}(I) = \mathbf{r}\text{:n arvojoukko},\] missä \(I\subset\mathbb{R}\) on väli ja funktio \(\mathbf{r}\colon I\rightarrow\mathbb{R}^n\) on jatkuva. Vektoriarvoisen funktion \(\mathbf{r}\) jatkuvuus tarkoittaa, että sen kaikki koordinaattifunktiot ovat jatkuvia missä tahansa kantaesityksessä.
Funktio \(\mathbf{r}=\mathbf{r}(t)\) on eräs käyrän \(C\) parametrisointi ja \(I\) on tätä parametrisointia vastaava parametriväli. Väli \(I\) voi olla avoin \((a,b)\), suljettu \([a,b]\) tai puoliavoin \((a,b],\,[a,b)\).
Avaruuskäyrän (\(n=3\)) parametrisointi voidaan antaa muodossa \[\mathbf{r}(t)=(x(t),y(t),z(t)) \in \mathbb{R}^3, \text{ kun } t\in I.\] Vaihtoehtoisesti voidaan myös käyttää koordinaattimuotoa \[\mathbf{r}(t)=\begin{cases}x=x(t),\\y=y(t),\qquad t\in I\\z=z(t),\end{cases}\] tai vektorimuotoa \[\mathbf{r}(t) =x(t)\mathbf{i}+y(t)\mathbf{j}+z(t)\mathbf{k},\] jossa \(\mathbf{i}=(1,0,0), \mathbf{j} = (0,1,0),\) ja \(\mathbf{k}=(0,0,1)\) ovat \(\mathbb{R}^3\):n luonnolliset kantavektorit.
Edellä funktion \(\mathbf{r}\) jatkuvuus tarkoittaa siis koordinaattifunktioiden \(x,y,z\) jatkuvuutta parametrivälillä \(I\).
Huomautus. Samalla käyrällä on useita eri parametrisointeja. Miksi? Kuinka pääset yhdestä parametrisoinnista toiseen?
Esimerkki, suora tasossa
Kahden \(xy\)-tason pisteen \(P_0=(x_0,y_0)\) ja \(P_1=(x_1,y_1)\) kautta kulkeva suora voidaan parametrsioida \[\mathbf{r}(t) = \begin{cases} x(t)=(1-t)x_0+tx_1 \\ y(t)=(1-t)y_0+ty_1, \end{cases} \text{ kun } t\in I=(-\infty,\infty).\] Havaitaan, että \[\mathbf{r}(t=0)=(x_0,y_0)\quad \text{ ja }\quad \mathbf{r}(t=1)=(x_1,y_1),\] joten valitsemalla parametriväliksi \(I=[0,1]\) saadaan pisteitä \(P_0\) ja \(P_1\) yhdistävä jana.
Esimerkki, reaalifunktion kuvaaja
Jatkuvan funktion \(f\colon[a,b]\rightarrow\mathbb{R}\) kuvaaja \(y=f(x)\) voidaan ajatella \(xy\)-tason käyränä. Tämä käyrä voidaan parametrisoida \[\mathbf{r}(t) =\begin{cases} x(t)=t \\ y(t)=f(t), \end{cases}\] missä \(t\in[a,b]\). Tai vastaavasti vektorimuodossa \[\mathbf{r}(t) =x(t)\mathbf{i}+y(t)\mathbf{j}= t\mathbf{i}+f(t)\mathbf{j}.\]
Esimerkki, Helix-käyrä eli kierrejousi
Helix-käyrä eli kierrejousi voidaan parametrisoida \[\mathbf{r}(t)=\begin{cases} x(t)=a\cos t, \\ y(t)=a\sin t, \qquad t\in I \\ z(t)=bt, \end{cases}\] missä \(a,b > 0\) ovat parametreja. Parametri \(a\) on jousen säde ja parametria \(b\) voidaan ajatella jousen venymänä.
Vaihtoehtoisesti voidaan tietysti tässäkin käyttää myös vektorimuotoa \[\mathbf{r}(t)=x(t)\mathbf{i}+y(t)\mathbf{j}+z(t)\mathbf{k} =a\cos t\mathbf{i}+a\sin t\mathbf{j}+bt\mathbf{k}.\]
Suunnistus
Usein parametriväli on suljettu väli \(I=[a,b]\). On lisäksi mahdollista, että \(a < b\) tai \( b < a\).
Parametrisointi määrää käyrälle positiivisen suunnan, jolloin \(\mathbf{r}(a)\) on käyrän alkupiste ja \(\mathbf{r}(b)\) sen päätepiste. Käyrää, jonka alku- ja päätepiste ovat samoja kutsutaan suljetuksi.
Voidaan muodostaa myös vastakkainen parametrisointi, jossa käyrä pysyy samana, mutta sen kulkusuunta vaihtuu. Tällöin myös parametrisointiin liittyvät alku- ja päätepiste vaihtuvat toisikseen.
Esimerkiksi tapauksessa \(\mathbf{r}\colon[0,1]\rightarrow C\) vastakkainen parametrisointi \(\mathbf{r}_{-}\) saadaan helposti kaavalla \[\mathbf{r}_{-}(t)=\mathbf{r}(1-t), \quad t\in [0,1].\]
Esimerkki, ympyrän kehä tasossa
Olkoon \(P_0=(x_0,y_0)\) ja \(r_0>0\). \(P_0\)-keskisen ja \(r_0\)-säteisen ympyrän kehän parametrisoinniksi saadaan \[\mathbf{r}(t) =\begin{cases}x(t)=x_0+r_0\cos t,\\ y(t) = y_0+r_0\sin t.\end{cases}\] Jos halutaan parametrisoida koko kehä, voidaan parametrisointiväliksi valita esimerkiksi \([0,2\pi]\) tai \([-\pi,\pi]\). Lisäksi havaitaan, että \[\mathbf{r}(0)=\mathbf{r}(2\pi)=(x_0+r_0,0)\] ja \[\mathbf{r}(-\pi)=\mathbf{r}(\pi)=(x_0-r_0,0),\] joten käyrä on suljettu.
Suunnistus voidaan vaihtaa päinvastaiseksi korvaamalla \(t\mapsto -t\) parametrisoinnissa. Tällöin \(\cos(-t)=\cos t\), \(\sin(-t)=-\sin t\) ja \[\mathbf{r}_{-}(t)=\begin{cases}x(t)=x_0+r_0\cos t,\\ y(t)=y_0-r_0\sin t.\end{cases}\]
Implisiittinen muoto
Tasokäyrän yhtälö voidaan usein ilmaista myös implisiittisessä muodossa \(F(x,y)=0\), missä \(F\) on jokin kahden muuttujan lauseke. Konkreettisia esimerkkejä ovat funktion kuvaaja \(y=f(x)\), joka voidaan määritellä muodossa \(F(x,y)=y-f(x)=0\), ja \(R\)-säteinen ympyrä \(F(x,y)=x^2+y^2-R^2=0\).
Huomautus. Yhtälön \(F(x,y)=0\) määräämä tasojoukko ei ole läheskään aina tasokäyrä. Esimerkiksi, jos \(A\subset\mathbb{R}^2\) on mikä tahansa suljettu tasojoukko (reunapisteet kuuluvat joukkoon), niin funktio \[F(x,y)=\text{ pisteen } (x,y) \text{ pienin etäisyys joukosta } A\] \[=\min\big\{\sqrt{(x-x_0)^{2}+(y-y_{0})^2} : (x_{0},y_{0})\in A\big\}\] on jatkuva, mutta yhtälö \(F(x,y)=0\) esittää koko alkuperäistä joukkoa \(A\).
Käyrän tangentti
Tarkastellaan 3-ulotteista parametrisointia \(\mathbf{r}\), joka on jatkuvasti derivoituva. Tämä tarkoittaa, että vektorin \(\mathbf{r}\) jokaisen koordinaattifunktion täytyy olla derivoituva ja derivaatan lisäksi jatkuva.
Parametriväliä \([t,t+\Delta t]\) vastaava käyrän sekantti on vektori \[\Delta\mathbf{r}=\mathbf{r}(t+\Delta t) - \mathbf{r}(t).\] Kun \(\Delta t \rightarrow 0\), niin \(\Delta\mathbf{r}\) kääntyy yhä enemmän käyrän tangentin suuntaiseksi, mutta samalla sen pituus kutistuu kohti nollaa. Skaalamalla kertoimella \(\Delta t\) saadaan kuitenkin erotusosamäärää vastaava lauseke, josta nähdään, että raja-arvo \[\mathbf{r}'(t) = \lim_{\Delta t\rightarrow 0} \frac{\Delta \mathbf{r}}{\Delta t}\] on olemassa ja se voidaan käytännössä laskea kaavalla \[\mathbf{r}'(t) = x'(t)\mathbf{i}+y'(t)\mathbf{j}+z'(t)\mathbf{k}.\] Vektorin \(\Delta\mathbf{r}/\Delta t\) ensimmäinen koordinaatti on nimittäin \[\frac{x(t+\Delta t)-x(t)}{\Delta t} \longrightarrow x'(t), \text{ kun }\Delta t \rightarrow 0,\] ja samoin käy myös muissa koordinaateissa. Tästä seuraa määritelmä.
Määritelmä. Jos käyrällä \(C\subset\mathbb{R}^3\) on jatkuvasti derivoituva parametrisointi \(\mathbf{r}\), niin pisteessä \(\mathbf{r}(t)\), \[ \mathbf{r}'(t)=x'(t)\mathbf{i}+y'(t)\mathbf{j}+z'(t)\mathbf{k} \] on käyrän tangenttivektori ja funktiot \(x,y,z\) ovat parametrisoinnin koordinaattifunktiot. Tason tapauksessa \(z\)-koordinaatti jää pois. Voidaan ajatella, että \(\mathbf{v}(t)=\mathbf{r}'(t)\) on käyrää \(C\) pitkin liikkuvan kappaleen nopeus ja \(\|\mathbf{v}(t)\|\) kappaleen vauhti hetkellä \(t\).
Huomautus. Tangenttivektorin määritelmästä saadaan lisäksi hyödyllinen approksimaatio: \[\mathbf{r}'(t)\approx \Delta\mathbf{r}/\Delta t \Leftrightarrow \Delta\mathbf{r}\approx \mathbf{r}'(t)\Delta t, \text{ kun } \Delta t\approx 0.\]
Esimerkki
Sykloidi voidaan parametrisoida kulman \(t\) avulla muodossa \[ \mathbf{r}(t)=\begin{cases}x(t)=a(t-\sin t)\\ y(t)=a(1-\cos t).\end{cases} \] Tangenttivektoriksi saadaan tällöin \[ \mathbf{r}'(t) = a(1-\cos t)\mathbf{i}+a\sin t\mathbf{j}, \] ja edelleen voidaan ratkaista kiihtyvyys \[ \mathbf{a}(t)=\mathbf{r}''(t)=a\sin t\mathbf{i} + a\cos t\mathbf{j}. \] Tästä seuraa \(\|\mathbf{a}(t)\| = \lvert a\rvert =\) tasaisen pyörimisliikkeen kiihtyvyys.
Huomautus. \(\mathbf{r}'(2\pi n)=\overline{0}\), eli hetkellinen nopeus on nolla. Tällöin käyrän suunta voi muuttua jyrkästi, vaikka sen parametrisointi onkin jatkuvasti derivoituva.
Kaarenpituus
Olkoon \(\mathbf{r}\colon[a,b]\rightarrow\mathbb{R}^n\) käyrän \(C\) jatkuvasti derivoituva parametrisointi. Jos käyrää approksimoidaan sekanteista muodostetulla murtoviivalla ja annetaan approksimaation tihentyä, voidaan havaita murtoviivan pituuden suppenevan kohti kaaren pituutta \(\ell(C)\).
Kaarenpituus voidaankin määrittää integraalina \[\ell(C)=\int_a^b \|\mathbf{r}'(t)\|\,dt,\] missä merkintä \(\|\cdot\|\) tarkoittaa vektorin (euklidista) normia, eli vektorin pituutta, avaruudessa \(\mathbb{R}^n\).
Perustelu. Olkoot \(a= t_{0} < t_{1} < \dotsc < t_{n}=b \) välin \([a,b]\) ositus. Tällöin vektorien \(\mathbf{r}(t_{k-1})\) ja \(\mathbf{r}(t_{k})\) välisen sekanttivektorin lauseke on \[\Delta \mathbf{r}_{k} = \mathbf{r}(t_{k}) - \mathbf{r}(t_{k-1})\] (vrt. aiempaan määritelmään, kun \(\Delta t = t_{k}-t_{k-1}\)).
Toisaalta sekanttivektorien pituudelle pätee approksimaatio \[\|\Delta\mathbf{r}_{k}\| \approx \|\mathbf{r}'(t_{k-1})\|(t_{k}-t_{k-1}),\] joten kaarenpituuden approksimaatioksi \(n\) kappaleella sekanttivektoreita saadaan \[\ell(C) \approx \sum_{k=1}^{n}\|\Delta\mathbf{r}_{k}\| \approx \sum_{k=1}^{n}\|\mathbf{r}'(t_{k-1})\|(t_{k}-t_{k-1}).\] Vaaditaan lisäksi, että jokaisen jakovälin pituus \(t_{k}-t_{k-1}\) suppenee kohti nollaa, kun \(n\to\infty\), jolloin edellinen lauseke on funktion \(\|\mathbf{r}'(t)\|\) Riemannin summa. Toisaalta, kun jakovälejä tihennetään, lähestyy approksimaatio kaaren todellista pituutta. Näin ollen integraalin määritelmästä seuraa \[\ell(C) = \lim_{n\to\infty}\sum_{k=1}^{n}\|\mathbf{r}'(t_{k-1})\|(t_{k}-t_{k-1}) = \int_{a}^{b}\|\mathbf{r}'(t)\|\,dt.\]
Jos käyrän parametrisointi on ainoastaan paloittain jatkuvasti derivoituva, saadaan koko käyrän kaarenpituus laskemalla osien kaarenpituudet yhteen.
Vaikka käyrällä onkin aina äärettömän monta eri parametrisointia, voidaan osoittaa, ettei kaarenpituus riipu parametrisoinnin valinnasta eikä suunnasta.
Esimerkki
Määritetään Helix-käyrän \(\mathbf{r}(t)=(\cos t,\sin t,t)\) kaarenpituus parametrivälillä \(t\in[0,2\pi]\). Tangenttivektoriksi saadaan
\[\mathbf{r}'(t)= \mathbf{i}(-\sin t) + \mathbf{j}\cos t + \mathbf{k},\] joten \[\|\mathbf{r}'(t)\| = \sqrt{((-\sin t)^2+\cos^2t+1)}=\sqrt{2}.\] Ja siten kaarenpituus on \[\ell = \int_0^{2\pi} \|\mathbf{r}'(t)\|dt = 2\sqrt{2}\pi.\]Esimerkki
Johdetaan kaava funktion kuvaajan \( y=f(x) \) kaarenpituudelle välillä \([a,b]\). Asetetaan \(\mathbf{r}(t)=(t, f(t))\), kun \(t\in[a,b]\). Tällöin \[\mathbf{r}'(t)=(1,f'(t))\quad\text{ ja }\quad \|\mathbf{r}'(t)\| = \sqrt{1+f'(t)^2},\] joten kaarenpituudeksi saadaan \[\ell = \int_a^b \sqrt{1+f'(t)^2}\,dt.\]
Huomautus. Kaarenpituutta voidaan tutkia myös sellaisille käyrille, joiden parametrisointi on muodostettu rajoittamattomalla välillä tai käyrä on "rajoittamaton" tai "itsensä päälle laskostuva" avoimen parametrivälinsä päätepisteen läheisyydessä. Kaarenpituusintegraalista tulee tällöin epäoleellinen. Jos tämä integraali on suppeneva, niin käyrää kutsutaan suoristuvaksi.
Esimerkki
Olkoot käyrällä parametrisointi \(\mathbf{r}(t)=(e^{-t},e^{-t})\), kun \(t\in[0,\infty[\). Lasketaan tälle kaarenpituus.
Tangenttivektorin \(\mathbf{r}'(t)=(-e^{-t},-e^{-t})\) pituus on \(\|\mathbf{r}'(t)\|=e^{-t}\sqrt{2}\), joten kaarenpituudeksi saadaan nyt
\[\ell = \int_{0}^{\infty}\|\mathbf{r}(t)\|\,dt = \int_{0}^{\infty}e^{-t}\sqrt{2}\,dt = \sqrt{2}.\]
2. Usean muuttujan funktiot
Usean muuttujan funktiot
Usean muuttujan reaaliarvoisella funktiolla tarkoitetaan funktiota \(f:D\rightarrow\mathbb{R}\), missä \(D\subset\mathbb{R}^n\), \(n\geq2\) on funktion määrittelyjoukko. Tällainen funktio siis liittää reaalisiin parametreihin \(x_1,\ldots,x_n\) reaaliluvun \(y=f(x_1,\ldots,x_n)\). Joskus (erityisesti fysiikassa) tällaista funktiota sanotaan skalaarikentäksi.
Esimerkiksi kaava \(f(r,h)=\pi r^2h\) määrittelee kahden muuttujan \(r,h\) funktion. Tämän funktion arvo on sylinterin tilavuus, kun \(r\) on sen säde ja \(h\) korkeus. Tähän sovellukseen liittyvä funktion määrittelyjoukko on tason ensimmäinen neljännes, \[ D=\{(r,h)\in \mathbb{R}^2 : r\ge0,\,h\ge 0\}, \] mutta funktion määräävä matemaattinen kaava on kuitenkin määritelty ja mielekäs kaikilla \((r,h)\in \mathbb{R}^2\), siis myös negatiivisilla luvuilla.
3. Osittaisderivaatta
Osittaisderivaatta
Olkoon \(D\subset \mathbb{R}^n\), \(n \geq 2\) ja \(f\colon D\to \mathbb{R}\) funktio. Tällöin kaikille \(j=1,\ldots,n\) funktion \(f\) osittaisderivaatta muuttujan \(x_j\) suhteen on \[ \frac{\partial}{\partial x_{j}}f(\mathbf{x}) = \lim_{h\to0}\frac{f(\mathbf{x} + h\mathbf{e}_j) -f(\mathbf{x})}{h}, \] jos kyseinen raja-arvo on määritelty. Tässä \(\mathbf{e}_j\) on \(j\):s yksikkökantavektori.Käytännössä osittaisderivointi jonkin muuttujan suhteen tapahtuu samaan tapaan kuin yhden muuttujan tapauksessa, muistetaan vain pitää muita muuttujia ikään kuin ne olisivat vakioita.
Esimerkki
Olkoon funktio \(f\colon \mathbb{R}^2\to \mathbb{R}, f(x_{1},x_{2})=x_{1}x_{2}\). Tällöin \[\frac{\partial}{\partial x_{2}}f(x_{1},x_{2}) = \lim_{h\to0}\frac{f(x_{1},x_{2}+h)-f(x_{1},x_{2})}{h} = \lim_{h\to0}\frac{x_{1}(x_{2}+h)-x_{1}x_{2}}{h} = x_{1}.\]
Huom. Erityisesti, kun \(\mathbf{x}\in\mathbb{R}^{n}\) ja \(n=2\) tai \(n=3\), käytetään osittaisderivaatoille yleensä indeksimerkintöjä \[\frac{\partial}{\partial x_{1}}f(\mathbf{x}) = f_{x}(\mathbf{x}),\quad\frac{\partial}{\partial x_{2}}f(\mathbf{x}) = f_{y}(\mathbf{x}) \quad\text{ja}\quad \frac{\partial}{\partial x_{3}}f(\mathbf{x}) = f_{z}(\mathbf{x})\]
Esimerkki
Olkoon funktio \(f\colon \mathbb{R}^2\to \mathbb{R}\), \(f(x,y)=x^2\sin y.\) Sen osittaisderivaatat ovat \[ f_{x}(x,y) = 2x\sin y \quad \text{ ja }\quad f_{y}(x,y) = x^2 \cos y. \]
Merkintätavat osittaisderivaatoille
Funktion \(f\colon D\subset\mathbb{R}^n\to \mathbb{R}\) osittaisderivaattaa muuttujan \(x_j\) suhteen merkitään mm. seuraavilla tavoilla \[ \frac{\partial}{\partial x_j} f(x_1,\ldots,x_n) = \frac{\partial f}{\partial x_j} = D_jf(x_1,\ldots,x_n) = \partial_{j}f(x_{1},\ldots,x_{n}).\]
Tapauksessa \(n=2\) usein kirjoitetaan \(z=f(x,y)\), jolloin voidaan myös käyttää merkintöjä \[ f_{x}(x,y)=\frac{\partial z}{\partial x} \quad \text{ ja }\quad f_{y}(x,y)=\frac{\partial z}{\partial y}. \]
Osittaisderivaatalle käytetään erillistä symbolia \(\partial\) ("doh"), jotta se ei sekoittuisi tavalliseen (kokonais)derivaattaan. Palataan tähän vähän myöhemmin ketjusäännön yhteydessä.
Osittaisderivaatan arvo
Funktion \(f\colon D\subset\mathbb{R}^n\to \mathbb{R}\) osittaisderivaatan \(f_j\) arvoa pisteessä \(\mathbf{x}_0\in D\) merkitään \[ \bigg(\frac{\partial f}{\partial x_j}\bigg)\bigg|_{\mathbf{x}_0} = \frac{\partial z}{\partial x_j}\bigg|_{\mathbf{x}_0} = D_jf(\mathbf{x}_{0}) = \partial_{j}f(\mathbf{x}_{0}), \] jossa muuttuja \(z\) määritellään \(z = f(x_1, x_2, \ldots , x_n)\).
Esimerkiksi, jos \(f(u,v)=u^2v\) ja \(\mathbf{w} = x^2\mathbf{i} + xy\mathbf{j}\), niin \begin{align} f_{u}(\mathbf{w})&=f_{u}(x^2,xy) =\left.\bigg(\frac{\partial}{\partial u}f(u,v)\bigg)\right|_{(x^2,xy)} \\ &=2uv\Big|_{u=x^2,\,v=xy}= 2(x^2)(xy)=2x^3y. \end{align}
Esimerkki
Lasketaan \[ \frac{\partial z}{\partial x}\quad \text{ ja }\quad \frac{\partial z}{\partial y}, \] kun \(z=x^3y^2+x^4y + y^4\). Tällöin saadaan \[ \frac{\partial z}{\partial x} = 3x^2y^2+4x^3y \quad \text{ ja }\quad \frac{\partial z}{\partial y} = 2x^3y+x^4+4y^3. \]
Esimerkki
Etsitään \(f_{x}(0,\pi)\), kun \(f(x,y)=e^{xy}\cos(x+y)\). Tästä saadaan \[ f_{x}(x,y)=ye^{xy}\cos(x+y)-e^{xy}\sin(x+y). \] Siten \[ f_{x}(0,\pi) = \pi e^0\cos(\pi)-e^0\sin(\pi) = -\pi. \]
Ketjusäännön soveltaminen
Tavallisiin derivaattoihin liittyvä ketjusääntö \[ (f\circ g)'(x)= f'\big(g(x)\big)g'(x) \] on voimassa myös osittaisderivaattojen tapauksessa. Jos esimerkiksi \( f\colon \mathbb{R}\to\mathbb{R}\) ja \(g\colon \mathbb{R}^2\to\mathbb{R},\) niin \[ \frac{\partial }{\partial x}f\big(g(x,y)\big) = f'\big(g(x,y)\big)g_{x}(x,y) \] ja \[ \frac{\partial }{\partial y}f\big(g(x,y)\big) = f'\big(g(x,y)\big)g_{y}(x,y). \] Myöhemmin esitetään myös ketjusääntö monen muuttujan funktioille.
Esimerkki
Osoitetaan, että derivoituva funktio \(f\colon \mathbb{R}\to\mathbb{R}\) toteuttaa seuraavan osittaisdifferentiaaliyhtälön, kun \(z=f(x/y)\): \[ x\frac{\partial z}{\partial x} + y\frac{\partial z}{\partial y}=0 \] Ketjusäännön perusteella \[ \frac{\partial z}{\partial x} =f'\bigg(\frac{x}{y}\bigg)\bigg(\frac{1}{y}\bigg) \text{ ja } \frac{\partial z}{\partial y} =f'\bigg(\frac{x}{y}\bigg)\bigg(\frac{-x}{y^2}\bigg). \] Siten \[ x\frac{\partial z}{\partial x} + y\frac{\partial z}{\partial y} = f'\bigg(\frac{x}{y}\bigg)\bigg(x\cdot \frac{1}{y}+y\cdot\frac{-x}{y^2}\bigg)=0. \]
Korkeammat osittaisderivaatat
Funktiolle \(f\colon \mathbb{R}^n\to\mathbb{R}\) voidaan määritellä myös korkeampia osittaisderivaattoja. Jos \(z=f(x,y)\), niin saadaan esimerkiksi \[ \frac{\partial^2 z}{\partial x^2} = \frac{\partial }{\partial x} \frac{\partial z}{\partial x} =f_{xx}(x,y) \] ja \[ \frac{\partial^2 z}{\partial x\partial y} = \frac{\partial }{\partial x} \frac{\partial z}{\partial y} =f_{yx}(x,y). \] Vastaavasti, jos \(w=f(x,y,z)\), saadaan vaikkapa \[ \frac{\partial^5 w}{\partial y\partial x\partial y^2\partial z} = \frac{\partial }{\partial y}\frac{\partial }{\partial x}\frac{\partial }{\partial y} \frac{\partial }{\partial y}\frac{\partial w}{\partial z} = f_{zyyxy}(x,y,z). \]
Esimerkki
Etsitään funktion \(f(x,y)=x^3y^4\) toiset osittaisderivaatat. Saadaan aluksi \[ f_{x}(x,y)=3x^2y^4\quad\text{ ja }\quad f_{y}(x,y)=4x^3y^3. \] Siten \begin{align*} f_{xx}(x,y)&=\frac{\partial }{\partial x}3x^2y^4=6xy^4, \\ f_{yx}(x,y)&=\frac{\partial}{\partial x}4x^3y^3=12x^2y^3, \\ f_{xy}(x,y)&=\frac{\partial}{\partial y}3x^2y^4=12x^2y^3, \\ f_{yy}(x,y)&=\frac{\partial }{\partial y}4x^3y^3=12x^3y^2. \end{align*}
Huom. Edellisestä voidaan havaita, että \(f_{xy}(x,y)=f_{yx}(x,y)\). Tämä ei ole sattumaa!
Jos funktio \(f\) sekä sen osittaisderivaatat \(f_{x},f_{y},f_{xy}\) ja \(f_{yx}\) ovat kaikki jatkuvia, niin \[\frac{\partial^{2}f}{\partial x\partial y} = \frac{\partial^{2}f}{\partial y\partial x}.\] Toisin sanoen derivoimisjärjestyksellä ei ole tällöin väliä. Vastaava tulos pätee myös yleisesti kaikilla \(n\ge2\).
3.1. Tangenttitaso ja normaalisuora
Pinnan tangentti ja normaali
Yhden muuttujan tapauksessa derivaatan avulla voidaan löytää lauseke derivoituvan funktion tangentille annetussa pisteessä. Normaali on kohtisuorassa tangenttia vastaan. Pinnalle \(z=f(x,y)\) saadaan puolestaan kaksi tangenttivektoria pisteessä \((a,b)\) käyrien \(t\mapsto(t,b,f(t,b))\) ja \(t\mapsto(a,t,f(a,t))\) tangentteina: \[ \mathbf{T}_1 = \mathbf{i} + f_{x}(a,b)\mathbf{k} \quad\text{ ja }\quad \mathbf{T}_2 = \mathbf{j} + f_{y}(a,b)\mathbf{k}. \]
Pinnan (ylä)normaalivektori \(\mathbf{N} = \mathbf{N}(a,b)\) on kohtisuorassa näitä molempia tangenttivektoreita vastaan. Siksi se saadaan ristitulona \begin{align*} \mathbf{N} &= \mathbf{T}_1\times \mathbf{T}_2 = \begin{vmatrix} \mathbf{i} & \mathbf{j} & \mathbf{k} \\ 1 & 0 & f_{x}(a,b) \\ 0 & 1 & f_{y}(a,b) \end{vmatrix} =-f_{x}(a,b)\mathbf{i} - f_{y}(a,b)\mathbf{j} + \mathbf{k}. \end{align*} Mikä on yksikkönormaali \(\mathbf{n}\)?
Tangenttitaso
Olkoon \(D\subset \mathbb{R}^2\), \(f\colon D\to \mathbb{R}\) ja \((a,b)\in D\). Pinnan \(z=f(x,y)\) tangenttitaso pisteessä \((a,b)\) on aina kohtisuorassa normaalia \(\mathbf{N} = \mathbf{N}(a,b)\) vastaan ja se kulkee pisteen \(P=(a,b,f(a,b))\) kautta. Merkitään pisteen \(P\) paikkavektoria \(\mathbf{r}_{0}\). Tällaisen tason vektorit \(\mathbf{r} = (x,y,z) \in \mathbb{R}^3\) toteuttavat yhtälön \[(\mathbf{r} - \mathbf{r}_{0}) \cdot \mathbf{N} = 0. \] Tangenttitasolle saadaan siis yhtälö \[ z=f(a,b) + f_{x}(a,b)(x-a) + f_{y}(a,b)(y-b). \]
Normaalisuoran yhtälöt
Normaalisuora pinnalle \(z=f(x,y)\) pisteessä \(P = (a,b,f(a,b))\) on normaalivektorin \(\mathbf{N}(a,b) = -f_{x}(a,b)\mathbf{i} - f_{y}(a,b)\mathbf{j} + \mathbf{k}\) suuntainen.
Merkitään taas pisteen \(P\) paikkavektoria \(\mathbf{r}_{0}\). Tällöin normaalisuoran pisteet ovat pistejoukko \[ \{ \mathbf{r}_{0} + t \mathbf{N}(a,b) \, : \, t \in \mathbb{R} \}. \] Jos sekä \(f_{x}(a,b) \neq 0\) ja \(f_{y}(a,b) \neq 0\), niin voidaan eliminoida parametri \(t\) ja saadaan yhtälöt \[ \frac{x-a}{f_{x}(a,b)} = \frac{y-b}{f_{y}(a,b)} = \frac{z-f(a,b)}{-1}. \]
Esimerkki
Etsitään tangentti ja normaali pinnalle \(z=\sin(xy)\), kun \(x=\pi/3\) ja \(y=-1\). Tangentti ja normaali kulkevat pisteen \((\pi/3,-1,-\sqrt{3}/2)\) kautta.
Lasketaan osittaisderivaatat: \[\frac{\partial z}{\partial x} = y\cos(xy)\text{ ja } \frac{\partial z}{\partial y} = x\cos(xy).\] Pisteessä \((\pi/3,-1)\) saadaan \[\frac{\partial z}{\partial x} = -\frac{1}{2} \text{ ja } \frac{\partial z}{\partial y} = \frac{\pi}{6}.\] Siten kyseisellä pinnalla on normaalivektori \[ \mathbf{N} = \frac{1}{2}\mathbf{i} - \frac{\pi}{6}\mathbf{j} + \mathbf{k}. \] Tangenttitaso on \[ z= \frac{-\sqrt{3}}{2} - \frac{1}{2}\Big(x-\frac{\pi}{3}\Big) + \frac{\pi}{6}(y+1). \] Ja normaalisuoran yhtälöiksi saadaan \[ \frac{6x-2\pi}{-3} = \frac{6y+6}{\pi} = \frac{6z+3\sqrt{3}}{-6}. \]
4. Ketjusäännöt ja lineaarinen approksimointi
Motivaatio
Yleistetään derivoinnin ketjusääntö \[ \frac{d}{dx}f\big(g(x)\big) = f'\big(g(x)\big)g'(x) \] usean muuttujan funktioille \(f\).
Ketjusääntö liittyy suoraan myös moniin käytännön sovelluksiin. Voidaan ajatella fysikaalista suuretta kuten lämpötilaa, mekaanisen systeemin kokonaisenergiaa, jotka riippuvat useista eri toissijaisista muuttujista (kuten ajasta, paikasta, tai nopeudesta). Nämä muuttujat voivat riippua edelleen kolmansista muuttujista (paikka ja nopeus esimerkiksi ajasta). Halutaan tarkastella kiinnostavan fysikaalisen suureen muutosnopeutta mainittujen kolmansien muuttujien suhteen.
Esimerkki
Retkeilijä liikkuu karttaa käyttäen mäkisessä maastossa. Olkoon \((x,y)\) retkeilijän paikka kartalla, \(z=f(x,y)\) kulloinenkin korkeus meren pinnasta ja \[ \mathbf{r}(t)=\left(u(t),v(t)\right) \] retkeilijän paikka kartalla hetkellä \(t\). Retkeilijän paikan korkeus eli etäisuus meren pinnan tasosta hetkellä \(t\) on siis yhdistetty funktio \[ z=f\left(u(t),v(t)\right) = g(t). \] Kuinka nopeasti retkelijän paikan korkeus muuttuu ajan kuluessa?
Ilmeisestikin vastaus kysymykseen on funktion \(g(t)\) derivaatta. Lasketaan: \begin{align*} \lim_{h\to 0}\frac{g(t+h)-g(t)}{h} &= \lim_{h\to 0}\frac{f(u(t+h),v(t+h))-f(u(t),v(t))}{h} \\ &= \lim_{h\to 0}\frac{f(u(t+h),v(t+h))-f(u(t),v(t+h))}{h}\\ &\quad + \lim_{h\to 0}\frac{f(u(t),v(t+h))-f(u(t),v(t))}{h} \end{align*} Yhden muuttujan ketjusäännön perusteella \[ g'(t)=f_{x}\big(u(t),v(t)\big)u'(t)+f_{y}\big(u(t),v(t)\big)v'(t). \]
Ketjusäännöt
Olkoon \(z\) muuttujien \(x,y\) jatkuvasti derivoituva funktio (eli funktio, jolla on jatkuvat 1. kertaluvun osittaisderivaatat). Jos \(x,y\) ovat muuttujan \(t\) jatkuvasti derivoituvia funktioita, niin \[ \frac{dz}{dt} = \frac{\partial z}{\partial x}\frac{dx}{dt} + \frac{\partial z}{\partial y}\frac{dy}{dt}. \] Jos \(x,y\) ovat kahden muuttujan \(s,t\) jatkuvasti derivoituvia funktioita, niin \begin{equation} \frac{\partial z}{\partial s} = \frac{\partial z}{\partial x}\frac{\partial x}{\partial s} + \frac{\partial z}{\partial y}\frac{\partial y}{\partial s} \end{equation} ja \begin{equation} \frac{\partial z}{\partial t} = \frac{\partial z}{\partial x}\frac{\partial x}{\partial t} + \frac{\partial z}{\partial y}\frac{\partial y}{\partial t}. \end{equation}
Keskeisiä kysymyksiä:
Mikä on yleinen idea näissä kaavoissa?
Kuinka voidaan muodostaa yleisessä tapauksessa laskentakaava yhdistetyn funktion (osittais)derivaatoille?
Ajatellaanpa, että \(z = f(u,v,t)\), jossa \(u = u(x,y)\) ja \(v=v(y,t)\). Tarkastellaan graafina "infinitesimaalisen muutoksen etenemistä" muuttujasta \(t\) muuttujaan \(z\) kaikkien etenemisreittien kautta.
Kuinka tilanne muuttuu, jos lisäksi \(x = x(t)\) ja \(y= y(t),\) jolloin \(z = z(t)\) ja kysytään kaavaa derivaatalle \(\frac{d z}{d t}\)? Saadaan \[ \frac{\partial z}{\partial t} = \frac{\partial f}{\partial v} \frac{\partial v}{\partial t} + \frac{\partial f}{\partial t} \] ja \begin{align*} \frac{d z}{d t} & = \frac{\partial f}{\partial u} \left ( \frac{\partial u}{\partial x} \frac{d x}{d t} + \frac{\partial u}{\partial y} \frac{d y}{d t} \right ) \\ &\quad+ \frac{\partial f}{\partial v} \left ( \frac{\partial v }{\partial t} + \frac{\partial v}{\partial y} \frac{d y}{d t} \right ) + \frac{\partial f}{\partial t}, \end{align*} jossa on yhteensä viisi termiä.
Esimerkki
Olkoon \(f\colon \mathbb{R}^2\to\mathbb{R}\) jatkuvasti derivoituva. Etsitään \[ \frac{\partial}{\partial x} f(x^2y,x+2y)\text{ ja } \frac{\partial}{\partial y} f(x^2y,x+2y). \]
Saadaan \begin{align*} \frac{\partial}{\partial x} f(x^2y,x+2y) &= f_{x}(x^2y,x+2y)\frac{\partial}{\partial x} (x^2y) \\ &\quad +f_{y}(x^2y,x+2y)\frac{\partial}{\partial x}(x+2y) \\ &= 2xy f_{x}(x^2y,x+2y)+ f_{y}(x^2y,x+2y). \end{align*} Vastaavasti voidaan laskea \begin{align*} \frac{\partial}{\partial y} f(x^2y,x+2y) &= f_{x}(x^2y,x+2y)\frac{\partial}{\partial y} (x^2y) \\ & +f_{y}(x^2y,x+2y)\frac{\partial}{\partial y}(x+2y) \\ &= x^2 f_{x}(x^2y,x+2y)+ 2f_{y}(x^2y,x+2y). \end{align*}
Esimerkki
Lämpötila ilmakehässä \(({}^\circ\)C) riippuu paikasta \((x,y,z)\) sekä ajasta \(t\). Ajatellaan lämpötilaa näistä parametrista riippuvana funktiona \(T(x,y,z,t)\). Jos funktio \(T\) esittää sääpalloon liitetyn lämpömittarin mittaamaa lämpötilaa, määritetään \(T\):n muutos ajan suhteen.Määritetään lämpötilan muutos hetkellä \(t=1\), kun \[ T(x,y,z,t)=\frac{xy}{1+z}(1+t), \] ja sääpallo etenee reittiä \(\mathbf{r}(t)=(t,2t,t-t^2)\). Koska lämpömittarin lukeman muutos riippuu kaikista neljästä parametrista, mitään niistä ei voida jättää huomiotta.
Lämpötilan muutoksen kaavaksi saadaan siten \[ \frac{dT}{dt} = \frac{\partial T}{\partial x}\frac{dx}{dt} +\frac{\partial T}{\partial y}\frac{dy}{dt} +\frac{\partial T}{\partial z}\frac{dz}{dt} +\frac{\partial T}{\partial t}. \] Koordinaattifunktioiden arvot hetkellä \(t=1\) ovat \[ x=1,\quad y=2\text{ ja } z=0. \] Koordinaattifunktioiden derivaattojen arvot hetkellä \(t=1\) ovat \[ \frac{dx}{dt}=1,\quad \frac{dy}{dt}=2\text{ ja } \frac{dz}{dt}=-1. \] Siten hetkellä \(t=1\) saadaan \begin{align*} \frac{\partial T}{\partial x} &= \frac{y}{1+z}(1+t)=4, &&\frac{\partial T}{\partial y} = \frac{x}{1+z}(1+t)=2, \\ \frac{\partial T}{\partial z} &= \frac{-xy}{(1+z)^2}(1+t)=-4, &&\frac{\partial T}{\partial t} = \frac{xy}{1+z}=2. \end{align*} Näin ollen, \[ \frac{dT}{dt}\bigg|_{t=1} = 4\cdot 1 + 2\cdot 2 + (-4) \cdot (-1) +2 = 14. \]
Approksimaatiot
Yksiulotteisessa tapauksessa muotoa \(y=f(x)\) olevan funktion kuvaajan tangenttisuora \(L(x)\) pisteessä \(a\) saadaan kaavasta \[ L(x) = f(a) + f'(a)(x-a). \] Tangenttisuoran lauseke antaa myös tavan approksimoida funktiota \(f\) pisteen \(a\) läheisyydessä: \(f(x)\approx L(x)\).
Miksi approksimaatiota tarvitaan, jos kerran tietokone voi laskea nopeasti ja tarkasti? Kun halutaan löytää "peukalosääntö" päässälaskun helpottamiseksi ja ymmärryksen lisäämiseksi. Kun funktio \(f\) on olemassa ainoastaan taulukoituna, esimerkiksi mittaustuloksista.
Lineaariset approksimaatiot usean muuttujan funktioille
Tapauksessa \(n=2\) saadaan funktiota \(f(x,y)\) approksimoiva tangenttitaso \(L(x,y)\), joka voidaan laskea osoittaisderivaattojen avulla kaavasta \[ f(x,y) \approx L(x,y) = f(a,b)+f_{x}(a,b)(x-a)+f_{y}(a,b)(y-b). \] Vieläkin useamman muuttujan tapauksessa saadaan ihan samannäköinen kaava, joskin enemmän osittaisderivaattatermejä.
Esimerkki
Etsitään lineaarinen approksimaatio funktiolle \[ f(x,y)=\sqrt{2x^2+e^{2y}} \] pisteessä \((2,0)\), ja arvioidaan funktion arvoa pisteessä \((2.2,-0.2)\).
Saadaan \(f(2,0)=3\). Funktion osittaisderivaatat ovat \[ f_{x}(x,y) = \frac{2x}{\sqrt{2x^2+e^{2y}}}, \quad f_{x}(2,0)=\frac{4}{3}. \] ja \[ f_{y}(x,y) = \frac{e^{2y}}{\sqrt{2x^2+e^{2y}}}, \quad f_{y}(2,0)=\frac{1}{3}. \] Siten \[ L(x,y)=3 +\frac{4}{3}(x-2)+\frac{1}{3}(y-0). \] Haluttu approksimaatio siis on \[ f(2.2,-0.2) \approx L(2.2,-0.2) = 3 +\frac{4}{3}(2.2-2)+\frac{1}{3}(-0.2-0)=3.2. \] Vertailun vuoksi funktion \(f(x,y)\) todellinen arvo pisteessä \((2.2,-0.2)\) on noin \(3.2172\).
Huomautuksia
Toisin kuin yksiulotteisessa tapauksessa pelkkä osittaisderivaattojen olemassaolo ei riitä takaamaan edes funktion \(f(x,y)\) jatkuvuutta. Esimerkiksi \[ f(x,y)=\left\{\begin{array}{rl} 0, & \text{kun }x=0\text{ tai }y=0,\\ 1, &\text{muuten}. \end{array}\right. \] ja \[ f(x,y)=\left\{\begin{array}{rl} \frac{2xy}{x^2 +y^2}, & \text{kun }x^2+y^2>0,\\ 0, &\text{kun } (x,y)=(0,0). \end{array}\right. \] Siksi tilannetta on tarpeen analysoida tarkemmin. Halutaan ehto, joka kertoo milloin tangenttitaso \(L(x,y)\) on mielekäs approksimaatio funktiolle \(f(x,y)\) lähellä pistettä \((a,b)\).
Differentioituvuus
Määritelmä. Funktiota \(f(x,y)\) sanotaan differentioituvaksi pisteessä \((a,b)\), jos \[ \lim_{(h,k)\to (0,0)} \frac{f(a+h,b+k)-f(a,b)-h\,f_{x}(a,b)-k\,f_{y}(a,b)}{\sqrt{h^2+k^2}}=0. \]
Saadaan seuraava tulos:
Lause. Jos \(f_{x},f_{y}\) ovat jatkuvia jossakin pisteen \((a,b)\) ympäristössä, niin \(f\) on differentioituva pisteessä \((a,b)\).
Esimerkki
Lasketaan virhetermi \(f(x+h,y+k)-f(x,y)-h\,f_{x}(x,y)-k\,f_{y}(x,y)\), kun \(f(x,y)=x^3+xy^2\).
Osittaisderivaatoiksi saadaan \(f_{x}(x,y)=3x^2+y^2\) ja \(f_{y}(x,y)=2xy\), joten \begin{align*} &f(x+h,y+k)-f(x,y)-h\,f_{x}(x,y)-k\,f_{y}(x,y) \\ &\quad =(x+h)^3+(x+h)(y+k)^2-x^3-xy^2-(3x^2+y^2)h -2xyk\\ &\quad=3xh^2+h^3+2yhk+hk^2+xk^2. \\ \end{align*} Lausekeen \(h\)- ja \(k\)-termit lähestyvät nollaa samalla nopeudella kuin \(h^2+k^2\), kun \((h,k)\to 0\), joten differentioituvuuden määritelmä selvästi toteutuu.
5. Gradientti ja suunnattu derivaatta
Määritelmä
Olkoon \(D\subset \mathbb{R}^n\) ja \(\mathbf{f} = (f_1,f_2,\ldots,f_m)\) vektori, missä jokainen funktion \(f\) komponentti on funktio \(f_j\colon D \to \mathbb{R}\) ja \(m,n\ge 2\). Tällainen vektori määrittelee vektoriarvoisen funktion \(\mathbf{f}\colon \mathbb{R}^n \to \mathbb{R}^m\), jota kutsutaan myös vektorikentäksi. Usein käytetään merkintää \(\mathbf{y} = \mathbf{f}(\mathbf{x})\).
Vektoriarvoisia funktiota esiintyy usein mm. fysiikassa sellaisten suureiden yhteydessä, joilla on voimakkuus ja suunta (esimerkiksi nopeus- ja voimakentät).
Huomautus. Yllä \(f_j\):t ovat tässä vektorin \(\mathbf{f}\) komponentteja (eivät siis osittaisderivaattoja).
Vektoriarvoisen funktion derivointi
Derivaatan luonnollinen vastine vektoriarvoisen funktion \(\mathbf{f} =(f_1,f_2,\ldots,f_m)\) tapauksessa on Jacobin matriisi \[ D\mathbf{f}(\mathbf{x}) = \begin{bmatrix} \frac{\partial f_1}{\partial x_1} & \frac{\partial f_1}{\partial x_2} & \cdots & \frac{\partial f_1}{\partial x_n}\\ \frac{\partial f_2}{\partial x_1} & \frac{\partial f_2}{\partial x_2} & \cdots & \frac{\partial f_2}{\partial x_n}\\ \vdots & \vdots & & \vdots \\ \frac{\partial f_m}{\partial x_1} & \frac{\partial f_m}{\partial x_2} & \cdots & \frac{\partial f_m}{\partial x_n}. \end{bmatrix} \] Jos \(m=n\), Jacobin matriisi on neliömatriisi ja sen determinattia sanotaan funktion \(\mathbf{f}\) Jacobin determinantiksi pisteessä \(\mathbf{x}\). Tätä determinanttia tarvitaan kurssin loppuosassa.
Jacobin matriiseilla ketjusääntö voidaan kirjoittaa yleisessä muodossa \[ D(\mathbf{f} \circ \mathbf{g})(\mathbf{x})= D\mathbf{f}\big(\mathbf{g}(\mathbf{x})\big)D\mathbf{g}(\mathbf{x}). \]
Sovellus: implisiittifunktiolause
Oletetaan, että skalaarifunktiot \(F_{(1)}, F_{(2)}, \ldots , F_{(n)}\) ovat derivoituvia. Tutkitaan yhtälöryhmää \[ \left\{\begin{array}{l} F_{(1)}(x_1,x_2,\ldots,x_m,y_1,y_2,\ldots,y_n)=0,\\ F_{(2)}(x_1,x_2,\ldots,x_m,y_1,y_2,\ldots,y_n)=0,\\ \vdots\\ F_{(n)}(x_1,x_2,\ldots,x_m,y_1,y_2,\ldots,y_n)=0,\\ \end{array}\right. \] pisteen \(P_0 = (a_1,a_2,\ldots,a_m,b_1,b_2,\ldots,b_n)\) lähellä. Muuttujat \(\mathbf{y}=(y_1,\ldots,y_n)\) voidaan esittää muuttujien \(\mathbf{x}=(x_1,\ldots,x_m)\) funktioina pisteen \(P_0\) lähellä, jos funktion \(\mathbf{f}(\mathbf{y}) = (F_{(1)},\ldots,F_{(n)})(\mathbf{y})\) Jacobin determinatti \[ \det D\mathbf{f}(\mathbf{y})\Big|_{P_0} \neq 0. \]
Esimerkki
Osoitetaan, että \((u,v)\) voidaan esittää muuttujien \((x,y,z)\) funktiona systeemistä \[ \left\{\begin{array}{l} F(x,y,z,u,v) = xy^2+xzu + yv^2-3 = 0,\\ G(x,y,z,u,v) = x^3yz+2xv -u^2v^2-2 = 0,\\ \end{array}\right. \] pisteen \(P_0=(1,1,1,1,1)\) lähellä.
Selvästi \(F(P_0) = G(P_0) = 0\). Muodostetaan Jacobin determinatti \[ \left|\begin{array}{cc} \frac{\partial F}{\partial u} & \frac{\partial F}{\partial v} \\ \frac{\partial G}{\partial u} & \frac{\partial G}{\partial v} \end{array}\right|\Big|_{P_0} = \left|\begin{array}{cc} xz & 2yv \\ -2uv^2 & 2x-2u^2v \end{array}\right|\Big|_{P_0} = \left|\begin{array}{cc} 1 & 2 \\ -2 & 0 \end{array}\right|=4. \] Koska determinantti ei ole nolla, voidaan kirjoittaa \[u = u(x,y,z)\quad \text{ ja }\quad v = v(x,y,z)\] kolmen muuttujan funktioina. Kaavoja näille funktioille ei kuitenkaan voida yleensä antaa.
Gradientti
Olkoon \(f\colon D\subset \mathbb{R}^n\to\mathbb{R}\), \(n\ge 2\), derivoituva pisteessä \(\mathbf{x}\in D\).
Määritelmä. Funktion \(f\) gradientti pisteessä \(\mathbf{x}\) on vektori \[ \nabla f = \mathrm{grad}\, f = \Big(\frac{\partial}{\partial x_1}f,\frac{\partial}{\partial x_2}f,\ldots,\frac{\partial}{\partial x_n}f\Big)\in\mathbb{R}^n. \]
Gradientti kertoo funktion \(f\) nopeimman kasvun suunnan. Se on vektoriarvoinen funktio \(\nabla f\colon D \to \mathbb{R}^n\). Tapauksessa \(n=3\) voidaan kirjoittaa \[ \nabla = \mathbf{i} \frac{\partial}{\partial x} + \mathbf{j}\frac{\partial}{\partial y} + \mathbf{k}\frac{\partial}{\partial z}. \] Tapauksessa \(n=2\) kolmas termi jää pois. Gradientti on (\(m\times n\) -) Jacobin matriisin erikoistapaus \(m=1\).
Esimerkki
Olkoon \(f(x,y)=x^2+y^2\). Tällöin saadaan \(\nabla f = 2x\mathbf{i} + 2y \mathbf{j}\). Erityisesti \(\nabla f (a,b)\) on kohtisuorassa origokeskisen (yksikkö)ympyrän mielivaltaiseen pisteeseen \((a,b\)) piirrettyä tangenttisuoraa vastaan. Tämä on erikoistapaus yleisemmästä tasa-arvokäyriä koskevasta totuudesta.
Huom. Derivaatan ketjusääntö voidaan kirjoittaa myös gradientin avulla: Jos \(\mathbf{r}=x(t)\,\mathbf{i}+y(t)\,\mathbf{j}\), niin \[\frac{d}{dt}f(\mathbf{r}(t)) = \frac{\partial f}{\partial x}\frac{dx}{dt}+\frac{\partial f}{\partial y}\frac{dy}{dt}= \nabla f(\mathbf{r}(t))\cdot \mathbf{r}'(t).\]
Tasa-arvokäyrät
Olkoon \(c\in\mathbb{R}\) vakio, \(D\subset\mathbb{R}^2\) ja \(f\colon D \to \mathbb{R}\) funktio. Tällöin joukko \[C= \{(x,y) : f(x,y)=c\}\] on usein tasokäyrä. Kyseinen pistejoukko voi olla myös tyhjä (jos \(f\) ei saa arvoa \(c\)) tai vaikkapa koko taso (jos \(f\) on vakio). Mikäli joukko \(C\) on tasokäyrä, sitä sanotaan funktion \(f\) arvoon \(c\) liittyväksi tasa-arvokäyräksi.
Esimerkiksi korkeuskäyrät kartalla ovat tasa-arvokäyriä funktiolle, joka liittää kartalla olevaan pisteeseen \((x,y)\) sen korkeuden meren pinnasta.
Gradientti
Lause. Olkoon \(D\subset \mathbb{R}^2\), \((a,b)\in D\) ja \(f\colon D\to \mathbb{R}\) derivoituva pisteessä \((a,b)\) ja \(\nabla f(a,b)\neq \mathbf{0}.\) Tällöin \(\nabla f(a,b)\) on kohtisuorassa pisteen \((a,b)\) kautta kulkevaa funktion \(f\) tasa-arvokäyrää (t.s., sen tangenttia) vasten.
Seuraus: Jos piste \(\mathbf{x}\in D\) on funktion \(f\) paikallinen ääriarvo (minimi tai maksimi), niin \(\nabla f(\mathbf{x})=\mathbf{0}\). Gradientin nollakohta ei kuitenkaan välttämättä ole funktion ääriarvo. Edes skalaarifunktion derivaatan nollakohta ei välttämättä ole minimi eikä maksimi, kuten nähdään jos \(f(x) = x^3\).
Todistus. Olkoon \(I = [-1,1]\) ja \(\mathbf{r}(t)\colon I \to \mathbb{R}^2\) tasa-arvokäyrän sellainen parametrisointi, että \(\mathbf{r}(0)=(a,b)\). Koska \(\mathbf{r}(t)=x(t)\mathbf{i} +y(t)\mathbf{j}\) on tasa-arvokäyrä, kaikilla \(t\in I\) pätee \(f(x(t),y(t))=f(a,b)\) eli vakio. Ketjusäännöstä saadaan (koska vakiofunktion derivaatta on nolla) \[ f_{x}\big(x(t),y(t)\big)x'(t) + f_{y}\big(x(t),y(t)\big)y'(t)=0. \] Erityisesti pisteessä \(t=0\) tämä tarkoittaa, että \[ \nabla f(a,b)\cdot \mathbf{r}'(0)=0, \] eli toisin sanoen vektori \(\nabla f\) ja tangentin suuntainen \(\mathbf{r}'(0)\) ovat kohtisuorassa.
Suunnattu derivaatta
Edellinen tulos voidaan tulkita niin, että tasa-arvokäyrän tangentti antaa suunnan, johon edettäessä funktio ei kasva eikä vähene. Niinpä funktio kasvaa jyrkimmin gradienttinsa suuntaan, joka on tasa-arvokäyrän normaalivektori. Muihin suuntiin liikuttessa kasvunopeuden antaa suunnattu derivaatta \[ D_{\mathbf{u}}f(a,b) = \frac{dg}{dt}(0), \text{ jossa } g(t) = f(a + t u_1, b + t u_2) \] ja \(\mathbf{u} = u_1 \mathbf{i} + u_2 \mathbf{j}\) on yksikkösuuntavektori.
Lause. Olkoon \(f\colon D\subset \mathbb{R}^2\to \mathbb{R}\) funktio, \((a,b)\in D\) ja \(\mathbf{u} = u_1 \mathbf{i} + u_2 \mathbf{j}\) sellainen vektori, että \(\|\mathbf{u}\|^2= u_1^2 + u_2^2 = 1\). Tällöin funktion \(f\) suunnattu derivaatta suuntaan \(\mathbf{u}\) saadaan kaavasta \[ D_{\mathbf{u}}f(a,b) = \mathbf{u} \cdot \nabla f(a,b). \]
Esimerkki
Olkoon \(f(x,y)=y^4+2xy^3+x^2y^2\). Etsitään \(D_{\mathbf{u}}f (0,1)\), kun \(\mathbf{u}\) on
Lasketaan \[\nabla f(x,y) = (2y^3+2xy^2)\mathbf{i} + (4y^3+6xy^2+2x^2y)\mathbf{j},\] \[\nabla f(0,1) = 2\mathbf{i} + 4\mathbf{j}.\] a) \(\|\mathbf{i} +2\mathbf{j}\| = \sqrt{5}\) ja siten \(\mathbf{u} = (\mathbf{i} +2\mathbf{j})/\sqrt{5}\). Saadaan \[ D_{\mathbf{u}}f(0,1)=\frac{1}{\sqrt{5}}(\mathbf{i} +2\mathbf{j})\cdot (2\mathbf{i} + 4\mathbf{j}) = \frac{2+8}{\sqrt{5}}=2\sqrt{5}. \]
Huomaa, että tässä \(\mathbf{u}\) ja \(\nabla f(0,1)\) ovat yhdensuuntaiset.
b) \(\|\mathbf{j} -2\mathbf{i}\| = \sqrt{5}\) ja siten \(\mathbf{u} = (\mathbf{j} -2\mathbf{i})/\sqrt{5}\). Saadaan \[ D_{\mathbf{u}}f(0,1)=\frac{1}{\sqrt{5}}(\mathbf{j} -2\mathbf{i})\cdot (2\mathbf{i} + 4\mathbf{j}) = \frac{-4+4}{\sqrt{5}}=0. \] Vektorit \(\mathbf{u}\) ja \(\nabla f(0,1)\) ovat siis kohtisuorassa.
c) \(\|3\mathbf{i}\| = 3\) ja siten \(\mathbf{u} = \mathbf{i}\). Saadaan \[D_{\mathbf{u}}f(0,1)=\mathbf{i} \cdot (2\mathbf{i} + 4\mathbf{j}) = 2.\] Tämä on sama kuin \(f_1(0,1)\).
d) \(\|\mathbf{i} +\mathbf{j}\| = \sqrt{2}\) ja siten \(\mathbf{u} = (\mathbf{i} +\mathbf{j})/\sqrt{2}\). Saadaan \[ D_{\mathbf{u}}f(0,1)=\frac{1}{\sqrt{2}}(\mathbf{i} +\mathbf{j})\cdot (2\mathbf{i} + 4\mathbf{j}) = \frac{2+4}{\sqrt{2}}=3\sqrt{2}. \]
Huomaa, että \(3\sqrt{2}\approx 4.243 < 2\sqrt{5} \approx 4.472\).
5.1. Taylorin sarja
Taylorin kaava
Yhden muuttujan tapauksessa \(m+1\) kertaa jatkuvasti derivoituvaa funktiota \(f\colon I \to \mathbb{R}\) voidaan approksimoida kaavalla \[ f(x)\approx f(a)+f'(a)(x-a)+ \frac{f''(a)}{2!}(x-a)^2+ \ldots + \frac{f^{(m)}(a)}{m!}(x-a)^m. \] kun \(a,x\in I\).
Tämä idea yleistyy usean muuttujan tapaukseen: Jos \(\mathbf{a}, \mathbf{h} \in \mathbb{R}^n\), \(n\ge 2\) ja funktiolla \(f\colon D\subset \mathbb{R}^n\to\mathbb{R}\) on jatkuvat kertaluvun \((m+1)\) osittaisderivaatat pisteitä \(\mathbf{a},\mathbf{a}+\mathbf{h}\) yhdistävällä janalla, niin \[ f(\mathbf{a}+\mathbf{h}) \approx \sum_{j=0}^m\frac{(\mathbf{h} \cdot \nabla)^jf(\mathbf{a})}{j!}. \]
Perustelu. Yksinkertaisuuden vuoksi johdetaan tässä kaava tapauksessa \(n=2\) riittävän sileille funktioille. Olkoon \(D\subset\mathbb{R}^{2}\) avoin ja funktio \(f\colon D\to\mathbb{R}\) äärettömän monta kertaa jatkuvasti derivoituva. Lisäksi oletetaan, että \(\mathbf{a}+t\mathbf{h}\subset D\), kun \(0\le t\le 1\). Tällöin oleellisesti myös apufunktion \[F\colon\mathbb{R}\to\mathbb{R},F(t)=f(\mathbf{a}+t\mathbf{h})\] kaikki derivaatat ovat jatkuvia suljetulla välillä \(\left[0,1\right]\).
Ketjusäännön nojalla saadaan apufunktiota derivoimalla \[F'(t) = h_{1}f_{x}(\mathbf{a}+t\mathbf{h}) + h_{2}f_{y}(\mathbf{a}+t\mathbf{h}) = (\mathbf{h}\cdot\nabla)f(\mathbf{a}+t\mathbf{h})\] \[F''(t) = h_{1}h_{2}f_{xx}(\mathbf{a}+t\mathbf{h}) + h_{1}h_{2}f_{xy}(\mathbf{a}+t\mathbf{h}) + h_{2}h_{1}f_{xy}(\mathbf{a}+t\mathbf{h}) + h_{2}h_{2}f_{yy}(\mathbf{a}+t\mathbf{h}) = (\mathbf{h}\cdot\nabla)^{2}f(\mathbf{a}+t\mathbf{h})\] \[\vdots\] \[F^{(j)}(t) = (\mathbf{h}\cdot\nabla)^{j}f(\mathbf{a}+t\mathbf{h}).\] Tästä havaitaan, että \(F^{(j)}(0) = (\mathbf{h}\cdot\nabla)^{j}f(\mathbf{a})\) ja siten yhden muuttujan funktion \(F\) Taylorin sarjakehitelmä on muotoa \[F(t) = F(0) + F'(0)t + \frac{1}{2}F''(0)t^{2}+\dots = \sum_{j=0}^{\infty}\frac{F^{(j)}(0)}{j!}t^{j}.\] Asettamalla tässä \(t=1\) saadaan haluttu tulos, \[f(\mathbf{a}+t\mathbf{h}) = f(\mathbf{a})+\mathbf{h}\cdot\nabla f(\mathbf{a}) + \frac{1}{2}(\mathbf{h}\cdot\nabla)^{2}f(\mathbf{a})+\dots\] \[=\sum_{j=0}^{\infty}\frac{(\mathbf{h}\cdot\nabla)^{j}}{j!}f(\mathbf{a}).\]
Esimerkki
Olkoon \((a,b)\in \mathbb{R}^2\) ja \(f(x,y)\) neljä kertaa jatkuvasti derivoituva kiekossa \((a,b)\)-keskisessä \(r\)-säteisessä kiekossa. Etsitään 3. asteen approksimaatio. Jos \(\mathbf{h} =(h,k)\), niin \begin{align*} f(a+h,b+k)&\approx f(a,b) + (hD_1+kD_2)f(a,b) +\frac{1}{2!}(hD_1+kD_2)^2f(a,b) \\ &\quad +\frac{1}{3!}(hD_1+kD_2)^3f(a,b) \\ &= f(a,b) + hf_{x}(a,b)+kf_{y}(a,b) \\ &\quad+ \frac{1}{2!}\Big(h^2f_{xx}(a,b)+2hkf_{xy}(a,b)+k^2f_{yy}(a,b)\Big) \\ &\quad+\frac{1}{3!}\Big(h^3f_{xxx}(a,b)+ 3h^2kf_{xxy}(a,b)+3hk^2f_{xyy}(a,b)+k^3f_{yyy}(a,b)\Big). \end{align*}
Huom. 1. asteen Taylor-approksimaatio on sama kuin tangenttitaso.
Esimerkki
Etsitään 2. asteen Taylor-approksimaatio funktiolle \(f(x,y)=\sqrt{x^2+y^3}\) pisteen \((1,2)\) ympäristössä.
Lasketaan \(f(1,2)=3\), \[ f_{x}(x,y)=\frac{x}{\sqrt{x^2+y^3}},\quad f_{y}(x,y)=\frac{3y^2}{2\sqrt{x^2+y^3}}, \] eli \(f_{x}(1,2)=1/3\) ja \(f_{y}(1,2)=2\). Edelleen \[ f_{xx}(x,y)=\frac{y^3}{(x^2+y^3)^{3/2}} \quad\Rightarrow\quad f_{xx}(1,2)= \frac{8}{27}, \] \[ f_{xy}(x,y)=\frac{-3xy^2}{2(x^2+y^3)^{3/2}} \quad\Rightarrow\quad f_{xy}(1,2)= -\frac{2}{9}, \] \[ f_{yy}(x,y)=\frac{12x^2y+3y^4}{4(x^2+y^3)^{3/2}} \quad\Rightarrow\quad f_{yy}(1,2)= \frac{2}{3}. \] Siten \begin{align*} f(1+h,2+k) &\approx 3 + \frac{1}{3}h + 2k + \frac{1}{2!}\Big(\frac{8}{27}h^2+2\Big(-\frac{2}{9}\Big)hk+\frac{2}{3}k^2\Big) \\ &= \frac{4}{27}h^2-\frac{2}{9}hk+\frac{1}{3}k^2+\frac{1}{3}h + 2k + 3. \end{align*}
6. Ääriarvojen luokittelu
Kertausta: ääriarvot yhden muuttujan tapauksessa
Funktiolla \(f\colon I\subset \mathbb{R} \to \mathbb{R}\) on lokaali (paikallinen) maksimi pisteessä \(a\in I\), jos \(f(x)\le f(a)\) kaikilla \(x\):n arvoilla jossakin \(a\):n ympäristössä (eli riittävän lähellä pistettä \(a\)). Vastaavasti lokaali minimi tarkoittaa sitä, että \(f(x)\ge f(a)\) jossakin \(a\):n ympäristössä. Maksimi tai minimi on globaali, jos kyseinen epäyhtälö on voimassa kaikilla \(x\in I\).Ääriarvoja voi esiintyä:
- Funktion \(f\) kriittisissä pisteissä, joissa \(f'(x)=0\),
- pisteissä joissa \(f\):n derivaatta ei ole määritelty, ja
- määrittelyjoukon \(I\) reunalla.
Seuraavaksi yleistetään vastaavat ehdot funktion \(f\colon D\subset \mathbb{R}^n\to\mathbb{R}\) tapaukseen.
Ääriarvot ja usean muuttujan funktiot
Funktiolla \(f\colon D\subset \mathbb{R}^n\to\mathbb{R}\) on pisteessä \(\mathbf{x}_0\in D\) lokaali maksimi, jos jossakin pisteen \(\mathbf{x}_0\) ympäristössä \(U\subset D\) pätee \(f(\mathbf{x})\le f(\mathbf{x}_0)\) kaikilla \(\mathbf{x}\in U\). Vastaavasti \(f\colon D\subset \mathbb{R}^n\to\mathbb{R}\) on pisteessä \(\mathbf{x}_0\in D\) lokaali minimi, jos löytyy sellainen pisteen \(\mathbf{x}_0\) ympäristö \(U\subset D\), että \(f(\mathbf{x})\ge f(\mathbf{x}_0)\) kaikilla \(\mathbf{x}\in U\). Ääriarvo on globaali eli absoluuttinen, jos kyseinen epäyhtälö on voimassa kaikilla \(\mathbf{x}\in D\).Ääriarvoja voi esiintyä:
- Funktion \(f\) kriittissä pisteissä eli gradientin nollakohdissa \(\nabla f(\mathbf{x})=0\),
- pisteissä joissa \(\nabla f\) ei ole määritelty, sekä
- määrittelyjoukon \(D\) reunalla.
Esimerkki
Funktiolla \(f(x,y)= 1-x^2-y^2\) on globaali maksimi \(f(0,0)=1\) pisteessä \((0,0)\). Tämä piste on funktion \(f\) kriittinen piste, koska \[ \nabla f(0,0) = -2x\mathbf{i} -2y\mathbf{j} \Big|_{(0,0)}= \mathbf{0}. \]
Esimerkki
Esimerkki
Esimerkki
Esimerkki
Ääriarvojen luokittelu: johdanto
Ääriarvojen luokittelu perustuu suureen \(\Delta f= f(\mathbf{x} + \mathbf{h}) -f(\mathbf{x})\) tarkasteluun kriittisessä pisteessä \(\mathbf{x}\in D\). Jos \(\Delta f\) saa vain positiivisia arvoja (kun \(\|\mathbf{h}\|\) on pieni), on piste \(\mathbf{x}\) minimi ja negatiivisessa tapauksessa maksimi. Jos \(\Delta f\) vaihtaa merkkiä, niin piste \(\mathbf{x}\) ei ole minimi eikä maksimi. Tämä johtaa funktion \(f\) toisen derivaatan tarkasteluun kriittisessä pisteessä.Yhden muuttujan tapauksessa:
- Jos \(f''(x)< 0\), niin funktiolla \(f\) lokaali maksimi pisteessä \(x\).
- Jos \(f''(x)>0\), niin funktiolla \(f\) lokaali minimi pisteessä \(x\).
- Jos \(f''(x)=0\), niin testi ei anna vastausta, ja kysymys täytyy ratkaista muulla tavoin.
Hessen matriisi
Olkoon \(f\colon D\subset \mathbb{R}^n \to \mathbb{R}\) funktio, jolla on jatkuvat toisen kertaluvun osittaisderivaatat. Funktion \(f\) luonnollinen derivaattakäsite on gradientti, joka itsessään on vektoriarvoinen funktio \(\nabla f\colon \mathbb{R}^n \to \mathbb{R}^n\). Siten funktion \(f\) toinen derivaatta on matriisi, jota nimitetään Hessen matriisiksi \[ H_f(\mathbf{x})= \begin{bmatrix} \frac{\partial^2}{\partial x_1^2} f(\mathbf{x}) & \frac{\partial^2}{\partial x_2\partial x_1} f(\mathbf{x}) & \cdots & \frac{\partial^2}{\partial x_n\partial x_1} f(\mathbf{x})\\ \frac{\partial^2}{\partial x_1\partial x_2} f(\mathbf{x}) & \frac{\partial^2}{\partial x_2^2} f(\mathbf{x}) & \cdots & \frac{\partial^2}{\partial x_n\partial x_2} f(\mathbf{x})\\ \vdots & \vdots & & \vdots \\ \frac{\partial^2}{\partial x_1\partial x_n} f(\mathbf{x}) & \frac{\partial^2}{\partial x_2\partial x_n} f(\mathbf{x}) & \cdots & \frac{\partial^2}{\partial x_n^2} f(\mathbf{x}) \\ \end{bmatrix}. \] Koska \(f\) on kaksi kertaa jatkuvasti derivoituva, derivoinnin järjestystä voidaan vaihtaa, ja kyseinen matriisi on symmetrinen.Miksi Hessen matriisi kiinnostaa meitä? Kun gradientin avulla voidaan kirjoittaa lineaarinen (ensimmäisen asteen) approksimaatio funktiolle \(f\), niin Hessen matriisilla saadaan kvadraattinen tarkennus: \[ f(\mathbf{x} + \mathbf{h}) \approx f(\mathbf{x}) + \mathbf{h} \cdot \nabla f (\mathbf{x}) + \frac{1}{2} \mathbf{h} H_f(\mathbf{x}) \mathbf{h}^T, \] jossa (vaaka)vektori \(\mathbf{h} = (h_1, h_2, \ldots , h_n)\) on pieni.
Tämä kaava on itse asiassa ainoastaan uusi tapa kirjoittaa toisen kertaluvun Taylorin approksimaatio \(n\):n muuttujan funktiolle. Muotoa \(\mathbf{z} ^T A \mathbf{z}\) oleva lauseke on \(n\times n\)-neliömatriisille \(A\) niin kutsuttu neliömuoto, jossa \(\mathbf{z}\) on \(n\)-pystyvektori.
Kirjoita kaava auki tapauksessa \(n = 2\)!
Pisteessä, jossa \(\nabla f (\mathbf{x}) = 0\), on voimassa approksimaatio \[f(\mathbf{x} + \mathbf{h}) - f(\mathbf{x}) \approx \frac{1}{2} \mathbf{h} H_f(\mathbf{x}) \mathbf{h}^T.\] Tätä voidaan käyttää hyväksi mahdollisen ääriarvon luokittelussa pisteessä \(\mathbf{x}\) ajattelemalla, että \(\mathbf{h} \approx 0\).
Matriisin (ja neliömuodon) definiittisyys
Symmetristä \(n\times n\)-matriisia \(A\) sanotaan positiividefiniitiksi, jos sen kaikki ominaisarvot ovat positiivisia ja negatiividefiniitiksi, jos \(-A\) on positiividefiniitti. Matriisin sanotaan olevan indefiniitti, jos sen kaikki ominaisarvot ovat nollasta poikkeavia ja sillä on vähintään yksi positiivinen sekä yksi negatiivinen ominaisarvo. Positiivi/negatiividefiniiteillä matriiseilla on monia samoja ominaisuuksia kuin positiivisilla/negatiivisilla reaaliluvuilla.
Symmetrisen matriisin \(A\) definiittiys tai indefiniittiys periytyy sitä vastaavalle neliömuodolle.
\(A\) on positiividefiniitti \(\Leftrightarrow\) \(\mathbf{x}^T A \mathbf{x}>0\) kaikilla nollasta poikkeavilla pystyvektoreilla \(\mathbf{x}\in \mathbb{R}^n\).
\(A\) on negatiividefiniitti \(\Leftrightarrow\) \(\mathbf{x}^T A \mathbf{x}< 0\) kaikilla nollasta poikkeavilla pystyvektoreilla \(\mathbf{x}\in \mathbb{R}^n\).
\(A\) on indefiniitti \(\Leftrightarrow\) \(\mathbf{x}^T A \mathbf{x}\) saavuttaa sekä negatiivisia että positiivisia arvoja pystyvektorin \(\mathbf{x}\) vaihdellessa.
Toisen derivaatan testi monen muuttajan tapauksessa
Lause. Olkoon \(f\colon D\subset \mathbb{R}^n\to\mathbb{R}\) funktio, jolla on jatkuvat toisen kertaluvun osittaisderivaatat kriittisen pisteen \(\mathbf{x}\in D\) ympäristössä. Tällöin:- Jos \(H_f(\mathbf{x})\) on positiividefiniitti, niin \(f\):llä on lokaali minimi pisteessä \(\mathbf{x}\).
- Jos \(H_f(\mathbf{x})\) on negatiividefiniitti, niin \(f\):llä on lokaali maksimi pisteessä \(\mathbf{x}\).
- Jos \(H_f(\mathbf{x})\) on indefiniitti, niin \(\mathbf{x}\) on funktion \(f\) satulapiste.
- Muussa tapauksessa testi ei anna tietoa funktiosta \(f\).
Lause seuraa approksimaatiosta \(f(\mathbf{x} + \mathbf{h}) - f(\mathbf{x}) \approx \frac{1}{2} \mathbf{h} H_f(\mathbf{x}) \mathbf{h}^T\) kun \(\mathbf{h} \approx 0\). Väite täytyy nimittäin ainoastaan tarkastaa Hessen matriisin määräämälle neliömuodolle.
Esimerkki
Etsitään ja luokitellaan funktion \[ f(x,y,z) = x^2y+y^2z+z^2-2x \] kriittiset pisteet.
Yhtälöt kriittisille pisteille ovat \begin{align*} 0 &= f_{x}(x,y,z)=2xy-2,\\ 0 &= f_{y}(x,y,z)=x^2+2yz,\\ 0 &= f_{z}(x,y,z)=y^2+2z.\\ \end{align*} Nämä yhtälöt ratkaisemalla nähdään, että funktion \(f\) ainoa kriittinen piste on \(P=(1,1,-1/2)\).
Lasketaan Hessen matriisi \[H_f(1,1,-1/2)=\left [ \begin{smallmatrix} 2 & 2 & 0 \\ 2 & -1 & 2 \\ 0 & 2 & 2 \end{smallmatrix} \right ]\] ja lasketaan matriisin ominaisarvot vaikkapa MATLABilla
>> a = [2 2 0 ; 2 -1 2 ; 0 2 2] a = 2 2 0 2 -1 2 0 2 2 >> eig(a) ans = -2.7016 2.0000 3.7016
Niinpä funktiolla \(f\) on satulapiste pisteessä \(P=(1,1,-1/2)\).
6.1. Lagrangen kertoimet
Lagrangen kertoimet
Usein optimointitehtävissä halutaan asettaa rajoitusehtoja optimoitaville muuttujille. Tyypillinen esimerkki tällaisesta tehtävästä on peltipurkin muodon optimointi: Halutaan minimoida purkin pinta-ala (eli käytetty materiaali) \(A(h,r)=2\pi rh+2\pi r^2\) niin, että tilavuus \(V(r,h)=\pi r^2 h\) on vakio.
Duaalitehtävä: Halutaan maksimoida purkin tilavuus \(V(r,h)\) siten, että pinta-ala \(A(h,r)\) on vakio. Primaali- ja duaalitehtävillä on sama ratkaisu. Tämän sanoo maalaisjärkikin, mutta itse asiassa ratkaisuun johtavat yhtälötkin ovat (olennaisesti) samoja.
Havaitaan, että mikäli ongelmalla on ratkaisu, niin ratkaisupisteessä \((a,b)\) vektorien \(\nabla f\) ja \(\nabla g\) on oltava joko yhdensuuntaisia tai vastakkaissuuntaisia (mikäli \(\nabla g(a,b) \neq 0\)). Miksi? Koska muussa tapauksessa funktiolla \(f\) olisi nollasta poikkeva suunnattu derivaatta käyrän \(g(x,y)=0\) tangentin suuntaan pisteessä \((a,b)\), ja siis minimi ei voi olla pisteessä \((a,b)\).
Entä jos tehtävänä olisi maksimoida \(f(x,y)\) ehdolla \(g(x,y)=0\)? Entä jos tehtävänä olisi maksimoida \(g(x,y)\) ehdolla \(f(x,y)=c\)?
Mikäli optimipiste on olemassa, se on Lagrangen funktion \[ L(x,y,\lambda) = f(x,y) + \lambda g(x,y) \] kriittinen piste (eli gradientin nollakohta). Menetelmä yleistyy myös useammalle muuttujalle. Esimerkiksi kolmen muuttujan tapauksessa Lagrangen funktio on \[ L(x,y,z,\lambda,\mu) = f(x,y,z) + \lambda g(x,y,z) + \mu h(x,y,z), \] missä \(f\) on minimoitava funktio ja rajoite-ehdot ovat \(g(x,y,z)=0\) sekä \(h(x,y,z)=0\).
Esimerkki
Minimoidaan funktio \(f(x,y)=x^2+y^2\) ehdolla \(g(x,y)=x^2y-16=0\). Muodostetaan aluksi Lagrangen funktio \[ L(x,y,\lambda)=x^2+y^2+\lambda(x^2y-16). \] Yhtälöt kriittisille pisteille ovat \begin{align*} 0 &=\frac{\partial L}{\partial x} = 2x(1+\lambda y),\\ 0 &=\frac{\partial L}{\partial y} = 2y+\lambda x^2,\\ 0 &=\frac{\partial L}{\partial \lambda}= x^2y-16,\\ \end{align*} joista viimeinen on aina itse rajoitusehto.
Ensimmäisestä yhtälöstä saadaan \(x=0\) tai \(\lambda y=-1\), mutta \(x=0\) on ristiriidassa kolmannen yhtälön kanssa. Siten toisesta yhtälöstä \[ 0=2y^2+\lambda yx^2 = 2y^2-x^2. \] Tästä saadaan edelleen \(x=\pm \sqrt{2}y\), ja \(2y^3=16\) eli \(y=2\). Ääriarvoja (mahdollisia minimejä) on siis kaksi \((x,y) = (\pm 2\sqrt{2},2)\). Pitää selvittää muilla keinoin, ovatko nämä minimejä vai maksimeja.
Esimerkki
Yritetään etsiä Lagrangen kertoimien menetelmällä funktion \(f(x,y)=y\) minimi ehdolla \(g(x,y)=y^3-x^2=0\). Helposti havaitaan, että minimi \(f(x,y)=0\) saavutetaan pisteessä \((0,0)\).
Muodostetaan Lagrangen funktio \[ L(x,y,\lambda)=y+\lambda(y^3-x^2). \] Saadaan yhtälöt \[ -2\lambda x =0,\quad 1+3\lambda y^2=0,\text{ ja } y^3-x^2=0. \] Nämä yhtälöt ovat keskenään ristiriidassa, joten ratkaisua niille ei ole. Huomaa, että \(\nabla g(0,0) =\mathbf{0}\) minimipisteessä. Tästä nähdään, että Lagrangen kertoimet näkevät ääriarvoja vain pisteissä, joissa \(\nabla g(0,0) \neq \mathbf{0}\).
Esimerkki
Etsitään ääriarvot funktiolle \(f(x,y,z)=xy+2z\) ehdoilla \(x+y+z=0\) ja \(x^2+y^2+z^2=24\).
Koska \(f\) on jatkuva ja annettujen leikkausjoukkojen leikkaus on ympyräviiva (eli rajoitettu ja suljettu joukko), niin ääriarvot ovat olemassa. Muodostetaan Lagrangen funktio \[ L(x,y,z,\lambda,\mu)=xy+2z+\lambda(x+y+z)+\mu(x^2+y^2+z^2-24). \] Lagrangen funktion osittaisderivaatoista saadaan yhtälöt \begin{align*} & y+\lambda+2\mu x=0, \\ & x+\lambda+2\mu y=0, \\ & 2+\lambda+2\mu z=0, \\ & x+y+z = 0,\text{ ja } \\ & x^2+y^2+z^2-24=0. \end{align*} Kahden ensimmäisen yhtälön erotus johtaa yhtälöön \((x-y)(1-2\mu)=0\), joten joko \(\mu = 1/2\) tai \(x=y\). Tutkitaan molemmat tapaukset.
Tapaus I (\(\mu = 1/2\)): Toisen ja kolmannen yhtälön perusteella \[ x+\lambda +y =0\textrm{ ja } 2+\lambda +z =0,\text{ siis }x+y=2+z. \] Neljännestä yhtälöstä saadaan \(z=-1\) ja \(x+y=1\). Viimeisen yhtälön perusteella \(x^2+y^2=24-z^2=23\). Koska \(x^2+y^2+2xy=(x+y)^2 =1\), saadaan \(2xy=1-23=-22\) ja \(xy=-11\). Nyt \((x-y)^2 = x^2+y^2-2xy = 23+22=45\), joten \(x-y=\pm 3\sqrt{5}\). Yhdessä yhtälön \(x+y=1\) kanssa tästä saadaan kaksi kriittistä pistettä \[ P_1 = \big((1+3\sqrt{5})/2,(1-3\sqrt{5})/2,-1\big)\text{ ja } P_2 = \big((1-3\sqrt{5})/2,(1+3\sqrt{5})/2,-1\big). \] Kummassakin pisteessä \(f(x,y,z)=-11-2 = -13\).
Tapaus II (\(x=y\)): Neljännestä yhtälöstä nähdään, että \(z=-2x\), ja viimeisen yhtälön perusteella \(6x^2=24\) eli \(x=\pm 2\). Näin ollen, kriittiset pisteet ovat \[ P_3=(2,2,-4)\text{ ja } P_4=(-2,-2,4). \] Saadaan \[ f(2,2,-4)=4-8=-4\text{ ja } f(-2,-2,4)=4+8=12. \] Siten funktion \(f\) maksimi on \(12\) ja minimi \(-13\).
7. PNS-menetelmä
Regressio-ongelma
Regressioanalyysissa pyritään valitsemaan parametrin \(\mathbf{\beta}\) arvo siten, että käyrä \[ y=f(x;\beta) \] kulkisi mahdollisimman läheltä jokaista havaintopistettä \[ (x_j,y_j)\in \mathbb{R}^2,\, j=1,2,\ldots ,n. \] Tällaista optimaalisesti valittua käyrää kutsutaan regressiomalliksi \(y=f(x;\beta)\), jossa funktion \(f\) muoto on valittu tilanteen ja harkinnan mukaan. Kunhan \(f\) on valittu, niin eräs ratkaisu käyränsovitusongelmaan on pienimmän neliösumman menetelmä.
Pienimmän neliösumman menetelmä
Pienimmän neliösumman menetelmässä pyritään minimoimaan regressiomallin virhetermien \(\varepsilon_j\) \[ \varepsilon_j = y_j - f(x_j;\beta ) \, , \quad j=1,2,\ldots ,n \] neliösummaa eli funktiota \[ F(\beta)= \sum_{j=1}^n\varepsilon_j^2 =\sum_{j=1}^n\big(y_j-f(x_j;\beta)\big)^2. \] muuttamalla parametrivektorin \(\mathbf{\beta}=(\beta_0,\beta_1,\ldots,\beta_m)\) arvoa. Optimaalinen \(\mathbf{\beta}\):n arvo on parametrin \(\beta\) pienimmän neliösumman estimaatti eli PNS-estimaatti.
Kysymys: Miksi ei minimoitaisi lauseketta \(\sum_{j=1}^n|y_j-f(x_j;\beta)|\) neliösumman sijasta?
PNS-sovitus
Kuvassa vihreällä parametreista \(\mathbf{\beta} = (\beta_1, \beta_2, \ldots , \beta_m)\) riippuva sovitettava funktio \(f(x;\mathbf{\beta})\) eräällä kiinteällä parametrin arvolla. Datapisteet \((x_j,y_j)\) ja vastaavat virhetermit \(\varepsilon_j\), kun \(j = 1, \ldots , n\).
Lineaarinen regressio
Lineaarisessa regressiossa \(f(x;\beta) = \beta_0-\beta_1 x\) jossa \(\beta = (\beta_0, \beta_1)\) ja neliösumma on \[ F(\beta_0,\beta_1)=\sum_i (y_i -\beta_0-\beta_1 x_i)^2. \] Etsitään piste \((\beta_0,\beta_1)\) siten, että \(\nabla F(\beta_0,\beta_1)=0\).
Lasketaan osittaisderivaatta \[ \frac{\partial}{\partial \beta_0}F(\beta_0,\beta_1) = 2\big(\beta_1\sum_i x_i+n\beta_0-\sum_i y_i\big). \] Ratkaistaan nollakohta \[ \beta_0=\frac{1}{n}\sum_i y_i-\frac{\beta_1}{n} \sum_i x_i =\overline{\mathbf{y}} -\beta_1 \overline{\mathbf{x}} \] missä \(\overline{\mathbf{x}}\) on datavektorin \(\mathbf{x} = (x_1, x_2, \ldots , x_n)\) komponenttien aritmeettinen keskiarvo.
Lasketaan seuraavaksi osittaisderivaatta \[ \frac{\partial}{\partial \beta_1}F(\beta_0,\beta_1) = 2\big(\beta_0\underbrace{\sum_i x_i}_{=n\overline{x}}+\beta_1\sum_i x_i^2-\sum_i x_iy_i\big). \] Sijoittamalla \(\beta_0\):n lauseke, saadaan \[ n\overline{\mathbf{x}} \overline{\mathbf{y}} - n \beta_1 \overline{\mathbf{x}} ^2+\beta_1 \sum_i x_i^2-\sum_i x_i y_i=0. \] Ratkaistaan nollakohta: \[ \beta_1=\frac{n\overline{\mathbf{x}} \overline{\mathbf{y}} -\sum_i x_iy_i}{n\overline{\mathbf{x}} ^2-\sum_i x_i^2} = \frac{\sum_i(x_i-\overline{\mathbf{x}})(y_i-\overline{\mathbf{y}})}{\sum_i(x_i-\overline{\mathbf{x}})^2}. \] Tarkista jälkimmäinen yhtälö!
Esimerkki
Sovita PNS-suora dataan
\(x_i\) | 0.0 | 1.0 | 2.0 | 3.0 | 4.0 |
---|---|---|---|---|---|
\(y_i\) | 2.10 | 1.92 | 1.84 | 1.71 | 1.64 |
ja estimoi (ekstrapoloi) \(y\) kun \(x=5\).
Saadaan \(\overline{\mathbf{x}}=2.0\), \(\overline{\mathbf{y}}= 1.842\), ja \[ \beta_1 = \frac{-1.13}{10.0} = -0.113. \] Siten \(\beta_0=1.842 +0.113\cdot 2.0= 2.068\). Näin ollen \(y=-0.113x + 2.068\), ja kysytty estimaatti pisteessä \(x=5\) on \(y=-0.113\cdot 5 + 2.068=1.503\).
Esimerkki: Toisen asteen sovitus
Tutkitaan lisäaineen määrän \(x\) vaikutusta kuivumisaikaan \(y\). Eri lisäaineen määrillä \(x_i\) (grammaa) saatiin kuivumisajat \(y_i\) (tuntia), \(i=1,\ldots,9\):
\(x_i\) | 0.0 | 1.0 | 2.0 | 3.0 | 4.0 | 5.0 | 6.0 | 7.0 | 8.0 |
---|---|---|---|---|---|---|---|---|---|
\(y_i\) | 11.0 | 9.4 | 9.1 | 7.0 | 6.2 | 7.1 | 6.6 | 7.5 | 8.2 |
Huomataan, että kuivumisajan riippuvuus lisäaineen määrästä on epälineaarista.
Minimikohdan estimoimiseksi sovitetaan havaintoihin paraabeli \[y=\beta_0+\beta_1x+\beta_2x^2.\]
Pienimmän neliösumman yhtälöryhmä mallille on \[ \frac{\partial}{\partial \beta_k} \sum(y_i-\beta_0-\beta_1x_i-\beta_2x_i^2)^2 = 0, \qquad k=0,1,2. \] Näistä saadaan yhtälöryhmä \[ \left\{ \begin{array}{rcl} n\beta_0 + \beta_1\sum x_i +\beta_2 \sum x_i^2 &=& \sum y_i,\\ \beta_0\sum x_i+\beta_1 \sum x_i^2+\beta_2 \sum x_i^3 &=& \sum x_iy_i\\ \beta_0\sum x_i^2+\beta_1 \sum x_i^3+\beta_2 \sum x_i^4 &=& \sum x_i^2y_i. \end{array}\right. \] Laskemalla yhtälöryhmän kertoimet havainnoista saadaan \[ \left\{ \begin{array}{rcl} 9\beta_0 + 36\beta_1 + 204\beta_2 &=& 72.1\\ 36\beta_0 +204\beta_1 + 1296 \beta_2 &=& 266.6 \\ 204 \beta_0 +1296\beta_1 + 8772\beta_2 &=& 1515.4 \end{array}\right. \]
Ratkaisuna ovat \( \beta_0=11.15\), \(\beta_1=-1.806\) ja \( \beta_2=0.1803\). Pienimmän neliösumman mielessä parhaiten havaintoihin liittyvä paraabeli on siten \[ y=11.15 - 1.806x + 0.1803 x^2. \]
8. Newtonin iteraatio
Newtonin menetelmä
Newtonin menetelmällä voidaan löytää (vähintäänkin derivoituvan) funktion \(f\colon \mathbb{R} \to \mathbb{R}\) nollakohta eli yhtälön \(f(x)=0\) ratkaisu. Silloin kun menetelmä toimii, se suppenee hyvin nopeasti. Silloin kun ei, niin...
Lähdetään liikkeelle jostakin pisteestä \(x_0\), joka on alkuarvaus yhtälön ratkaisulle. Arvioidaan funktiota \(f\) sen tangenttisuoralla pisteessä, eli funktiolla \(l(x)=f(x_0)+f'(x_0)(x-x_0)\). Ratkaistaan yhtälö \(l(x_1)=0\). Toistetaan edellinen käyttäen alkuarvauksena lukua \(x_1\) luvun \(x_0\) sijasta jne. Tämä menettely johtaa algoritmiin, jossa iteraatioaskeleet saadaan kaavasta \[ x_{n+1}= x_n-\frac{f(x_n)}{f'(x_n)}\,\qquad n=0,1,2,\ldots. \] Suppeneminen ja löytyvä nollakohta riippuvat alkuarvauksesta \(x_0\).
Esimerkki
Etsitään likiarvo luvulle \(\sqrt{5}\).
Koska \(2=\sqrt{4}<\sqrt{5}<\sqrt{9}=3\), niin valitaan \(x_0=2\) läheltä ratkaisua. Tässä \(f(x)=x^2-5\), joten \(f'(x)=2x\). Saadaan
\[
x_1 = x_0 - \frac{f(2)}{f'(2)} = 2- \frac{4-5}{2\cdot 2}= \frac{9}{4}.
\]
\[
x_2 = x_1 - \frac{f(9/4)}{f'(9/4)} = \frac{9}{4} - \frac{27/16-5}{2\cdot 9/4} = \frac{161}{72}
\approx 2.2361.
\]
Huomaa, että \(\sqrt{5}\approx 2.236068\), eli jo kahdella iteraatiolla saatiin varsin hyvä likiarvo.
Esimerkki
Etsitään funktion \(f(x)=x^3-x+1\) nollakohdat.
Piirtämällä kuvaaja nähdään, että funktiolla on vain yksi nollakohta jossain pisteiden \(-2\) ja \(-1\) välissä. Asetetaan \(x_0=-1\).
Koska \(f'(x)=3x^2-1\) iteratioksi saadaan \[ x_{n+1} = x_n - \frac{x_n^3-x_n+1}{3x_n^2-1}. \] Saadaan \[ x_0=-1,\quad x_1= -1.5, \quad x_2 = -1.347826, \quad x_3=-1.325200. \] \[ x_4= -1.324718, \quad x_5=-1.324717, \quad \ldots \]
Newtonin menetelmä monen muuttujan tapauksessa
Newtonin menetelmä toimii myös funktion \(\mathbf{f} \colon \mathbb{R}^n\to\mathbb{R}^n\) tapauksessa. Tällöin iteraatiokaavassa oleva derivaatta pitää korvata Jacobin matriisilla \[ D\mathbf{f}(\mathbf{x}) = \begin{bmatrix} \frac{\partial f_1}{\partial x_1} & \frac{\partial f_1}{\partial x_2} & \cdots & \frac{\partial f_1}{\partial x_n}\\ \frac{\partial f_2}{\partial x_1} & \frac{\partial f_2}{\partial x_2} & \cdots & \frac{\partial f_2}{\partial x_n}\\ \vdots & \vdots & & \vdots \\ \frac{\partial f_m}{\partial x_1} & \frac{\partial f_m}{\partial x_2} & \cdots & \frac{\partial f_m}{\partial x_n} \end{bmatrix}. \] Iteraatioaskeleeksi saadaan \[ \mathbf{x}_{n+1} = \mathbf{x}_n- D\mathbf{f} (\mathbf{x}_n)^{-1}\mathbf{f}(\mathbf{x}_n), \quad n=0,1,2,\ldots, \] missä \(D\mathbf{f} (\mathbf{x}_n)^{-1}\) on \(D\mathbf{f} (\mathbf{x}_n)\):n käänteismatriisi.
Esimerkki
Etsitään \(\mathbf{f}(\mathbf{x})=\mathbf{0}\), kun \(\mathbf{x}_0=(1,0,1)\) ja
\[
\mathbf{f}(x,y,z)=(x^2+y^2+z^2-3)\mathbf{i} + (x^2+y^2-z-1)\mathbf{j} +(x+y+z-3)\mathbf{k}.
\]
Saadaan
\[
D \mathbf{f} (x,y,z)=\begin{bmatrix}2x &2y & 2z\\ 2x&2y&-1\\ 1&1&1\end{bmatrix}
\]
ja voidaan laskea
\[
\mathbf{x}_1 = (3/2,1/2,1),\quad \mathbf{x}_2 = (5/4,3/4,1)\quad \text{ ja }\quad \mathbf{x}_2 = (9/8,7/8,1),
\]
mikä on terveellisintä tehdä tietokoneella.
Nähdään, että iteraatiot konvergoivat kohti pistettä \((1,1,1)\), joka on tehtävän tarkka (ja kaikesta päätellen ainoa) ratkaisu.
9. Taso- ja avaruusintegraalit
Tasointegraali
Olkoon \(D\subset \mathbb{R}^2\) joukko tasossa ja \(f\colon D\to \mathbb{R}\) skalaarikenttä. Halutaan määritellä tasointegraali \[ \iint_D f(x,y)\,dA. \] Integraalin arvo on pinnan \(z=f(x,y)\) ja \(xy\)-tason väliin jäävän alueen tilavuus.
Tutkitaan aluksi erikoistapausta \(D=[a,b]\times [c,d]\).
Yhden muuttujan tapaus
Yhden muuttujan tapauksessa integraali saadaan Riemannin summien raja-arvona.
Formaalisti \[ \int_a^b f(x)\,dx = \lim_{n\to\infty} \sum_{i=1}^n f(x_i)\Delta x, \] missä \(a=x_0 < x_1 < \ldots < x_n=b\) on välin \([a,b]\) tasavälinen jako ja \(\Delta x\) on jakovälin pituus.
Usean muuttujan tapaus (tasointegraali, \(\mathbb{R}^2\))
Jaetaan tason osajoukko \(D=[a,b]\times [c,d]\) tasavälisesti ruudukoksi niin, että kummallakin akselilla on \(n\) jakopistettä.
Nyt voidaan määritellä \[ \iint_D f(x,y)\,dA = \lim_{n\to\infty} \sum_{i=1}^n\sum_{j=1}^n f(x_i,y_j)\,\Delta x\Delta y, \] missä \[x_{i} = a + i\frac{b-a}{n},\qquad y_{j} = c + j\frac{d-c}{n}\] ja \(\Delta x\) sekä \(\Delta y\) vastaavat jakovälien pituutta \(x\) ja \(y\)-suunnassa: \[ \Delta x= \frac{b-a}{n},\quad \Delta y = \frac{d-c}{n}. \]
Usean muuttujan tapaus (avaruusintegraali, \(\mathbb{R}^3\))
Tason tapauksessa edellä määriteltyä integraalia kutsutaan tasointegraaliksi. Samaan tapaan voidaan määritellä avaruusintegraali: \[ \iiint_D f(x,y,y)\,dV = \lim_{n\to\infty} \sum_{i=1}^n\sum_{j=1}^n\sum_{k=1}^n f(x_i,y_j,z_k)\,\Delta x\Delta y\Delta z, \] kun \(D=[a_1,b_1]\times [a_2,b_2]\times[a_3,b_3] \subset \mathbb{R}^2\) ja \(f\colon D\to \mathbb{R}\). Tässä \[ \Delta x = \frac{b_1-a_1}{n},\quad \Delta y = \frac{b_2-a_2}{n}\text{ ja } \Delta z = \frac{b_3-a_3}{n}. \] Vieläkin useamman muuttujan funktioita \(f\colon D\subset \mathbb{R}^n\to\mathbb{R}\), missä \(n\ge 2\), voi integroida samaan tapaan.
Huomautuksia
Yhden muuttujan tapauksessa integraaleille pätee Analyysin (ensimmäinen) peruslause: \[ f(x)=\frac{d}{dx}\int_c^x f(t)\,dt,\textrm{ kun }c,x\in[a,b] \] ja \(f\colon [a,b]\to\mathbb{R}\) on jatkuva funktio.
Analyysin peruslauseesta seuraa, että integrointi ja derivointi ovat toistensa vastaoperaatiota, mikä johtaa moniin integroinnissa hyödyllisiin kaavoihin. Analyysin peruslauseella ei kuitenkaan ole aivan samanlaista vastinetta usean muuttujan tapauksessa; Greenin, Gaussin ja Stokesin lauseet ovat kuitenkin sille sukua.
Moninkertainen integraali
Monen muuttujan integraaleja voidaan usein kuitenkin laskea moninkertaisina integraaleina. Kaksiulotteinen tapaus (integrointialue suorakulmio) \[ \iint_D f(x,y)\,dA = \int_c^d \int_a^b f(x,y)\,dx\,dy,\text{ kun } D=[a,b]\times [c,d]. \] Kolmiulotteinen tapaus (integrointialue suorakulmainen särmiö) \[ \iiint_D f(x,y,z)\,dV = \int_{a_3}^{b_3}\int_{a_2}^{b_2}\int_{a_1}^{b_1} f(x,y,z)\,dx\,dy\,dz, \] kun \(D=[a_1,b_1]\times [a_2,b_2]\times [a_3,b_3]\).
Mikäli funktio \(f\colon \mathbb{R}^n \to \mathbb{R}\) (\(n=2,3,\ldots\)) on jatkuva, niin integroimisjärjestyksellä ei ole väliä integraalin arvon kannalta. Laskujen helppouden kannalta väliä kuitenkin on.
Esimerkki
Olkoon \(f(x,y)=xy^2\). Lasketaan \[ \iint_D f(x,y)\,dA,\text{ kun } D=\{(x,y)\in \mathbb{R}^2: 0\le x\le1, \,0\le y\le 1\}. \]
Aluksi kirjoitetaan tasointegraali kaksinkertaisena integraalina, ja lasketaan \begin{align*} \iint_D xy^2\,dA &= \int_0^1\int_0^1 xy^2\,dx\,dy = \int_0^1\bigg[\frac{x^2y^2}{2}\bigg]_{x=0}^{1}\,dy \\ &= \int_0^1 \frac{y^2}{2}\,dy \bigg[\frac{y^3}{6}\bigg]_{y=0}^1 = \frac{1}{6}. \end{align*}
Esimerkki
Olkoon \(f(x,y,z)=xye^z\). Lasketaan \[ \iiint_D f(x,y,z)\,dV,\text{ missä } D=[0,2]\times [0,1] \times [-1,1]. \]Kirjoitetaan avaruusintegraali kolminkertaisena integraalina. Lasketaan \begin{align*} &\iiint_D xye^z\,dV = \int_{-1}^1\int_0^1\int_0^2 xye^z\,dx\,dy\,dz \\ &\quad = \int_{-1}^1\int_0^1 \frac{x^2ye^z}{2}\bigg|_{x=0}^2\,dy\,dz = \int_{-1}^1\int_0^1 2ye^z\,dy\,dz \\ &\quad = \int_{-1}^1 y^2e^z\bigg|_{y=0}^1\,dz = \int_{-1}^1 e^z\,dz = e^z\Big|_{z=-1}^1 = e -e^{-1}. \end{align*}
Integrointi yleisemmissä alueissa
Tutkitaan funktiota \(f\colon D\to \mathbb{R}\), joka on määritelty tason (tai avaruuden) osajoukossa \(D\). Tähän asti on oletettu, että \(D\) on suorakaide (vast. suorakulmainen särmiö). Yleisemmässä tapauksessa voidaan tarkastella suorakulmiota \(\hat D\), jolle \(D\subset \hat D\). Jotta integraali olisi määritelty, täytyy joukon \(D\) olla ''siisti'' (riittää esimerkiksi, että reuna on paloittain sileä).
Määritellään funktio \(\hat f\colon \hat D \to \mathbb{R}\) seuraavasti: \[ \hat f(x,y) = \left\{ \begin{array}{rcl} f(x,y), &\text{kun} &(x,y) \in D,\\ 0, & \text{kun} & (x,y) \in \hat D \setminus D. \end{array}\right. \] Nyt voidaan määritellä \[ \iint_D f(x,y)\,dA := \iint_{\hat D} \hat f(x,y)\,dA. \] Samaan tapaan voidaan määritellä myös avaruusintegraali ei-suorakulmaisen integroimisalueen tapauksessa: \[ \iiint_D f(x,y,z)\,dV := \iiint_{\hat D} \hat f(x,y,z)\,dV, \] kun \(\hat D\) on suorakulmainen särmiö ja \(D \subset \hat D\).
Esimerkki
Olkoon \( D=\{(x,y)\in \mathbb{R}^2 : 0 < x < 1,\, 0 < y < x\} \). Lasketaan funktion \(f(x,y)=xy\) integraali yli alueen \(D\).
\begin{align*} &\iint_D xy\,dA = \int_0^1\bigg(\int_0^x xy\,dy\bigg)dx \\ &\quad \int_0^1\frac{xy^2}{2}\bigg|_{y=0}^x\,dx = \int_0^1\frac{x^3}{2}\,dx = \frac{x^4}{8}\bigg|_{x=0}^1 =\frac{1}{8}. \end{align*} Integrointi on mahdollista suorittaa myös toisessa järjestyksessä: \begin{align*} &\iint_D xy\,dA = \int_0^1\bigg(\int_y^1 xy\,dx\bigg)dy \\ &\quad = \int_0^1\frac{x^2y}{2}\bigg|_{x=y}^1\,dy = \int_0^1\frac{y}{2}-\frac{y^3}{2}\,dy \\ &\quad = \bigg[\frac{y^2}{4}-\frac{y^4}{8}\bigg]_{y=0}^1 = \frac{1}{4}-\frac{1}{8} = \frac{1}{8}. \\ \end{align*}
Esimerkki
Lasketaan funktion \(f(x,y)=e^{x^2}\) integraali edellisen esimerkin alueessa.
\[ \iint_D e^{x^2}\,dA = \int_0^1\bigg(\int_0^x e^{x^2}\,dy\bigg)dx =\int_0^1 xe^{x^2}\,dx \] Sijoituksella \(t=x^2\), \(dt=2x\,dx\) saadaan \[ \frac{1}{2}\int_0^1e^t\,dt = \frac{1}{2}e^t\bigg|_{t=0}^1 = \frac{e}{2}-\frac{1}{2}. \]
9.1. Epäoleelliset integraalit. Muuttujanvaihto taso- ja avaruusintegraaleissa
Epäoleelliset integraalit
Tähän asti integrointi on tapahtunut rajoitetussa alueessa rajoitetulle funktiolle (integrandille). Joskus voidaan kuitenkin integroida rajoittamattomia funktioita ja/tai rajoittamattomassa alueessa.
Tarkastellaan ainoastaan tapausta, jossa funktio \(f\) on ei-negatiivinen eli \(f(\mathbf{u}) \ge 0\) kaikilla \(\mathbf{u}\in D\). Lasketaan funktion \(f(x,y) = e^{-x^2}\) integraali alueessa suorien \(y=\pm x\) rajoittamassa rajoittamattomassa alueessa \(D\), jossa \(x>0\). Mikäli integraali on suppenee, sen arvo saadaan laskemalla \[ \iint_D e^{-x^2}\,dA = \int_0^\infty \int_{-x}^{x} e^{-x^2}\,dy\,dx = \int_0^\infty 2xe^{-x^2}\,dx \] \[ = \lim_{R\to \infty} \int_0^R 2xe^{-x^2}\,dx. \] Integraalin laskemiseksi huomataan, että \(\frac{d}{dx} e^{-x^2} = -2xe^{-x^2}\). Siten \[ \lim_{R\to \infty} \int_0^R 2xe^{-x^2}\,dx = \lim_{R\to\infty} -e^{-x^2}\Big|_{x=0}^R = \lim_{R\to\infty}1-e^{-R^2}=1. \]
Esimerkki
Olkoon \[D_1=\lbrace (x,)\in \mathbb{R}^2 : 0 < x < 1, \, |y| \leq x^2 \rbrace\] ja rajoittamaton funktio \(f(x,y)=1/x^2\).
(i) Lasketaan integraali \[ \iint_{D_1}\frac{1}{x^2}\,dA =\int_0^1\int_{-x^2}^{x^2}\frac{1}{x^2}\,dy\,dx \] \[ =\int_0^1 2\,dx =2. \]
(ii) Lasketaan saman funktion integraali alueessa \[D_2=\lbrace (x,y)\in\mathbb{R}^2 : 0 < x < 1,\, |y|\leq \sqrt{x}\rbrace.\] \[ \iint_{D_2}\frac{1}{x^2}\,dA =\int_0^1\int_{-\sqrt{x}}^{\sqrt{x}}\frac{1}{x^2}\,dy\,dx \] \[ =\int_0^1 2\sqrt{x}\frac{1}{x^2}\,dx =\int_0^1 2x^{-3/2}\,dx =\lim_{\epsilon\to 0+} \frac{2x^{-1/2}}{-1/2}\bigg|_{x=\epsilon}^1 = \infty. \] Suppeneminen riippuu integroitavan funktion lisäksi myös alueesta!
Muuttujanvaihto taso- ja avaruusintegraaleissa
Tutkitaan funktiota \(\mathbf{F}\colon G \to D\), missä \(D\) ja \(G\) ovat \(\mathbb{R}^2\):n osajoukkoja. Oletetaan, että funktion \(\mathbf{F}\) kaikki osittaisderivaatat ovat olemassa ja jatkuvia. Lisäksi oletetaan, että \(\mathbf{F}\) on bijektio: Jokaista pistettä \((x,y) \in D\) vastaa yksikäsitteinen piste \((u,v)\in G\), jolle \(\mathbf{F}(u,v)= (x,y)\). Tällöin erityisesti \(D=\mathbf{F}(G)\).
Tutkitaan aluksi muuttujanvaihtoa tasointegraalin tapauksessa: \[ \iint_D f(x,y)\,dx\,dy = \iint_{G} ??? \,du\,dv. \] Tarvitaan tieto siitä, miten pinta-ala skaalautuu funktiossa \((x,y) = \mathbf{F}(u,v)\).
Ketjusäännöllä \[ dx = \frac{\partial x}{\partial u}du + \frac{\partial x}{\partial v}dv\text{ ja } dy = \frac{\partial y}{\partial u}du + \frac{\partial y}{\partial v}dv. \] Edettäessä vektorin \(\mathbf{a}\) suuntaan \((x,y)\)-koordinaateissa, koordinaatti \(v\) on vakio ja siten \(dv=0\). Saadaan \[ \mathbf{a} \approx \frac{\partial x}{\partial u}du\,\mathbf{i} + \frac{\partial y}{\partial u}du\,\mathbf{j}. \] Samaan tapaan voidaan päätellä, että \[ \mathbf{b} \approx \frac{\partial x}{\partial v}dv\,\mathbf{i} + \frac{\partial y}{\partial v}dv\,\mathbf{j}. \] Tässä \(\mathbf{i}\) ja \(\mathbf{j}\) ovat koordinaattiakseleiden suuntaiset yksikkövektorit.
Approksimaatiokaava pinta-alaelementin \(dA\) muutokselle siis on \[ dA = dx \, dy \approx |\mathbf{a} \times \mathbf{b}| = \left\|\begin{array}{ccc} \mathbf{i} & \mathbf{j} & \mathbf{k} \\ \frac{\partial x}{\partial u}du & \frac{\partial y}{\partial u}du & 0 \\ \frac{\partial x}{\partial v}dv & \frac{\partial y}{\partial v}dv & 0 \end{array}\right\| \] Käytetään merkintää (huom. neliömatriiseille \(\det A=\det A^T\)) \[ \left\|\begin{array}{cc} \frac{\partial x}{\partial u} & \frac{\partial x}{\partial v} \\ \frac{\partial y}{\partial u} & \frac{\partial y}{\partial v} \end{array}\right\|\,du\,dv := \big|\det D \mathbf{F}(u,v)\big|\,du\,dv. \] Determinantti \(\det D \mathbf{F}(u,v)\) on funktion \(\mathbf{F}\colon \mathbb{R}^2\to \mathbb{R}^2\) Jacobin determinantti. Sille käytetään myös merkintää \[ \det D \mathbf{F}(u,v)=\frac{\partial(x,y)}{\partial(u,v)} \text{ kun } (x,y) = \mathbf{F}(u,v). \]
Jacobin determinantin itseisarvo \(|\det D \mathbf{F}(u,v)|\) kertoo paikallisen pinta-alan muutoksen kuvattaessa \((u,v)\)-koordinaattien infinitesimaalinen pinta-ala \(du\,dv\) vastaavalle \((x,y)\)-koordinaateissa lausutulle pinta-alalle \(dx\,dy\) funktion \((x,y) = \mathbf{F}(u,v)\) välityksellä.
Tasointegraalin muuttujanvaihtokaavaksi siis saadaan \[ \iint_D f(x,y) \,dx\,dy = \iint_{G} g(u,v) \big | \det D\mathbf{F} (u,v)\big| \,du\,dv \] missä \(g(u,v)=f(x(u,v),y(u,v))\) ja \(D=\mathbf{F}(G)\). Tässä \(\mathbf{F}\) on integroimisalueiden \(D\) ja \(G\) välinen bijektio. Jacobin determinantin etumerkki kertoo, onko \(\mathbf{F}\) suunnan säilyttävä vai kääntävä. Itseisarvo tarvitaan, jotta positiivisen funktion integraali ei muuttuisi negatiiviseksi eräillä \(\mathbf{F}\).
Esimerkki
Lasketaan neljän paraabelin \(y=x^2\), \(y=2x^2\), \(x=y^2\) ja \(x=3y^2\) rajoittamaan alueen \(D\) pinta-ala.
Huomataan, että integroimisalue kuvautuu suorakulmioksi \(G = [1/2 , 1] \times [1/3 , 1]\) muunnoksella \[ \mathbf{G}(x,y) = u\mathbf{i} + v\mathbf{j}, \quad u(x,y)=\frac{x^2}{y},\,\,v(x,y)=\frac{y^2}{x}. \]
Halutaan kuitenkin käänteiskuvaus \(\mathbf{F} = \mathbf{G}^{-1}\colon G\to D\), joka vie koordinaatit \((u,v)\) käyräviivaisille \((x,y)\)-koordinaateille. Lineaarialgebran perusteella \[ \det D {{\mathbf{F}}}(u,v)=\frac{1}{\det D \mathbf{G}(x,y)}. \] Lasketaan \[ \frac{\partial u}{\partial x} = \frac{2x}{y}, \quad \frac{\partial u}{\partial y} = -\frac{x^2}{y^2}. \] Saadaan myös \[ \frac{\partial v}{\partial x} = -\frac{y^2}{x^2}, \quad \frac{\partial v}{\partial y} = \frac{2y}{x}. \]
Lasketaan edelleen \[ \det D \mathbf{G}(x,y) = \left|\begin{array}{cc} \frac{\partial u}{\partial x} & \frac{\partial u}{\partial y} \\ \frac{\partial v}{\partial x} & \frac{\partial v}{\partial y} \end{array}\right| = \left|\begin{array}{cc} \frac{2x}{y} & -\frac{x^2}{y^2} \\ -\frac{y^2}{x^2} & \frac{2y}{x} \end{array}\right| \] \[ = 4-1 = 3,\text{ eli } \big|\det D {\mathbf{F}} (u,v)\big|=\frac{1}{3}. \] Tulokseksi siis saadaan \[ \iint_D 1\,dx\,dy = \iint_G \frac{1}{3}\,du\,dv = \frac{1}{3}\cdot \frac{2}{3}\cdot \frac{1}{2} = \frac{1}{9}. \] Yleensä ei käy niin onnellisesti, että sama koordinaatistomuunnos vie integroitavan alueen suorakulmiolle samalla kun integroitava funktio menee vakioksi.
9.2. Napa-, sylinteri- ja pallokoordinaatistot. Pintaintegraali
Napakoordinaatit
Piste \((x,y)\in \mathbb{R}^2\) voidaan kirjoittaa muodossa \((r,\theta)\), missä \(r\geq0\) ja \(0\le \theta < 2\pi\). Napakulma \(\theta\) on yksikäsitteinen jos \(r > 0\).
Alkeisgeometriasta saadaan kaavat \[ \left\{ \begin{array}{l} x=r\cos \theta\\ y=r\sin \theta \end{array}\right. \Leftrightarrow \left\{ \begin{array}{l} r^2=x^2+y^2 \\ \tan{\theta} = y/x. \end{array}\right. \] Vrt. kompleksiluvun polaarimuoto \(x + i y = r e^{i \theta}\).
Koordinaatistomuunnoksen \((r, \theta) \mapsto (x,y)\) Jacobin determinantille saadaan kaava \[ \frac{\partial(x,y)}{\partial (r,\theta)} = \left|\begin{array}{cc} \frac{\partial x}{\partial r} & \frac{\partial x}{\partial \theta}\\ \frac{\partial y}{\partial r} & \frac{\partial y}{\partial \theta} \end{array}\right| = \left|\begin{array}{cc} \cos \theta & -r\sin \theta\\ \sin \theta & r\cos\theta \end{array}\right| = r. \] Siten muuttujanvaihtokaavaa varten saadaan pinta-alan venytys \[ dx\,dy = \bigg|\frac{\partial(x,y)}{\partial (r,\theta)}\bigg| \,dr\,d\theta = r\,dr\,d\theta. \] Tasointegraali napakoordinaateissa \[ \iint_D f(x,y)\,dx\,dy = \iint_G g(r,\theta)r\,dr\,d\theta, \] missä \(g(r,\theta) = f(r\cos\theta,r\sin\theta)\).
Esimerkki
(i) Olkoon \(D=\lbrace (x,y)\in \mathbb{R}^2 : 1 < x^2 + y^2 < 4\rbrace\). Lasketaan napakoordinaateissa integraali \[ I=\iint_D \frac{1}{x^2+y^2}\,dx\,dy. \] Saadaan \[ I=\int_0^{2\pi}\int_1^2\frac{1}{r^2}r\,dr\,d\theta = \int_0^{2\pi} d\theta \cdot \int_1^2\frac{dr}{r} =2\pi\ln r\Big|_{r=1}^2 = 2\pi \ln 2. \]
(ii) Integraali \[ \int_{-\infty}^\infty e^{-x^2}\,dx \] on erittäin tärkeä mm. todennäköisyyslaskennassa ja tilastotieteessä. Tämä integraali on vaikea, koska integraalifunktiota ei ole mahdollista kirjoittaa alkeisfunktioiden avulla.
Integraali on kuitenkin mahdollista laskea seuraavan tempun avulla: Huomataan aluksi, että \[ I = \int_{-\infty}^\infty \int_{-\infty}^\infty e^{-x^2-y^2}\,dx\,dy = \bigg(\int_{-\infty}^\infty e^{-x^2}\,dx\bigg)^2. \] Laskemalla epäoleellinen tasointegraali napakoordinaateissa \[ I = \int_0^{2\pi}\int_0^\infty e^{-r^2}r\,dr\,d\theta = \int_0^{2\pi}d\theta \cdot \int_0^\infty r e^{-r^2}\,dr \] \[ = 2\pi \int_0^\infty{r e^{-r^2}\,dr} = -\pi \lim_{R \to \infty}{\int_0^R (-2r) e^{-r^2}\,dr}. \]
Nyt \(\frac{d}{dr} e^{-r^2} = -2r e^{-r^2}\), joten integraaliksi saadaan: \[ \int_0^R (-2r) e^{-r^2}\,dr = e^{-R^2} - 1 \] Viemällä \(R \to \infty\) tulee \(I = \pi\) ja siitä alkuperäisen integraalin arvo \[ \int_{-\infty}^\infty e^{-x^2}\,dx = \sqrt{I} = \sqrt{\pi}. \] Miksi temppu toimi?
Muuttujanvaihto avaruusintegraalissa
Muunnoskaavat \((u,v,w) \mapsto (x,y,z)\) ovat \[ \left\{ \begin{array}{l} x=x(u,v,w),\\ y=y(u,v,w),\\ z=z(u,v,w). \end{array}\right. \] Tällöin \[ dx\,dy\,dz = \bigg|\frac{\partial(x,y,z)}{\partial (u,v,w)}\bigg|\,du\,dv\,dw, \] missä \[ \frac{\partial(x,y,z)}{\partial (u,v,w)} = \left|\begin{array}{ccc} \frac{\partial x}{\partial u} & \frac{\partial x}{\partial v} & \frac{\partial x}{\partial w} \\ \frac{\partial y}{\partial u} & \frac{\partial y}{\partial v} & \frac{\partial y}{\partial w}\\ \frac{\partial z}{\partial u} & \frac{\partial z}{\partial v} & \frac{\partial z}{\partial w} \end{array}\right|. \] Jos siis \(g(u,v,w) = f(x(u,v,w),y(u,v,w),z(u,v,w))\), niin \[ \iiint_D f(x,y,z)\,dx\,dy\,dz = \iiint_G g(u,v,w)\, \bigg|\frac{\partial(x,y,z)}{\partial (u,v,w)}\bigg|\,du\,dv\,dw. \]
Sylinterikoordinaatit
Koordinaatit \((r,\theta,z)\), missä \(r \geq 0\), \(0\le \theta<2\pi\), \(z\in\mathbb{R}\). Suoralla \(r = 0\) (eli \(z\)-akselilla) napakulma \(\theta\) ei ole yksikäsitteinen.Tällöin muunnoskaavat \((r,\theta,z) \mapsto (x,y,z)\) ovat \begin{align*} \begin{cases} x &= r\cos\theta, \\ y &= r\sin\theta, \\ z &= z. \end{cases} \end{align*} Ja muunnoksen Jacobin determinantiksi saadaan \[ dx\,dy\,dz = \bigg|\frac{\partial(x,y,z)}{\partial (r,\theta,z)}\bigg|\,dr\,d\theta\,dz = r\,dr\,d\theta\,dz. \]
Sylinterikoordinaateissa on helppo esittää pyörähdyskappaleita \(z\)-akselin ympäri muodossa \[ r = f(z), \quad \text{jossa} \quad z \in [a,b] \text{ ja } \theta \in [0, 2 \pi), \] missä \(f\) on ei-negatiivinen funktio. Sylinterisymmetriset tehtävät!
Esimerkki
Lasketaan funktion \(f\) määräämän pyörähdyskappaleen \(\Omega\) tilavuus \[ \iiint_{\Omega} dx\, dy\, dz = \int_a^b\int_0^{2\pi}\int_0^{f(z)} r\,dr\,d\theta\,dz \] \[ = \int_a^b \left (2\pi \cdot \frac{1}{2}f(z)^2 \right ) \, dz = \pi \int_a^b f(z)^2 \, dz, \] mikä lienee tuttu kaava.
Pallokoordinaatit
Koordinaatit \((r,\theta,\phi)\), missä \(r \geq 0\), \(0\le \theta<2\pi\), \(0\le \phi \leq \pi\).
Korotus- eli napakulmaa \(\pi/2 - \phi\) käytetään usein \(\phi\):n sijasta. Atsimuuttikulma \(\theta\) ja korotuskulma ovat yksikäsitteisiä, jos pisteen etäisyys \(z\)-akselista \( > 0\). Muunnoskaavat ovat \begin{align*} \begin{cases} x&=r\sin\phi \cos\theta,\\ y&=r\sin\phi \sin\theta,\\ z&=r\cos\phi, \end{cases} \end{align*} ja muunnoksen Jacobin determinantiksi saadaan \[ dx\,dy\,dz = \bigg|\frac{\partial(x,y,z)}{\partial (r,\theta,\phi)}\bigg|\,dr\,d\theta\,d\phi = r^2\sin\phi \,dr\,d\theta\,d\phi. \]
Esimerkki
Lasketaan \(R\)-säteisen pallon \(\mathbb{B}^3(R)\) tilavuus: \[ V(\mathbb{B}^3) = \iiint_{\mathbb{B}^3(R)} 1\,dx\,dy\,dz = \int_0^R\int_0^{2\pi}\int_0^\pi r^2\sin\phi\,d\phi\,d\theta\,dr \] \[ = \int_0^R\int_0^{2\pi} -r^2\cos\phi\bigg|_{\phi=0}^\pi\,d\theta\,dr = \int_0^R\int_0^{2\pi} 2r^2\,d\theta\,dr \] \[ =\int_0^R 4\pi r^2\,dr = \frac{4\pi r^3}{3}\bigg|_{r=0}^R = \frac{4\pi R^3}{3}. \]
Kaksiulotteinen pinta-ala avaruudessa
Tutkitaan kaksiulotteista kaareutuvaa pintaa \(S\), joka on (piirtämisen helpottamiseksi) \(xy\)-tason yläpuolella avaruudessa \(\mathbb{R}^3\).
Tarkastellaan aluksi \(xy\)-tason neliön yläpuolelle jäävän osan pinta-alaa. Se on ilmeisesti suurempi tai yhtäsuuri kuin vastaavan neliön pinta-ala.
Tästä johtuen pinta-aladifferentiaali \(dS\) on suurempi tai yhtäsuuri kuin kuin \(dx\,dy\). Itseasiassa \(dx\,dy\) saadaan, jos \(dS\) projisoidaan \(xy\)-tasoon. Projektio voidaan kirjoittaa kaavana \[ dx\,dy = \cos \gamma\,dS, \] missä \(\gamma\) on pinnan \(S\) normaalivektorin \(\mathbf{N}\) ja \(z\)-akselin suuntaisen yksikkövektorin \(\mathbf{k}\) välinen kulma. Toisaalta pistetulon määritelmästä saadaan \[ \mathbf{N} \cdot \mathbf{k} = \|\mathbf{N}\| \|\mathbf{k}\| \cos \gamma, \] ja siis \[ dS = \frac{1}{\cos \gamma}\,dx\,dy = \frac{\|\mathbf{N}\| \|\mathbf{k}\|}{\mathbf{N} \cdot \mathbf{k}}\,dx\,dy. \]
Aikaisemmin on johdettu pinnan (ylöspäin suunnatulle) normaalivektorille esitys \[ \mathbf{N} = -\frac{\partial z}{\partial x}\mathbf{i} - \frac{\partial z}{\partial y}\mathbf{j} + \mathbf{k}. \] Saadaan \[ \|\mathbf{N}\| = \sqrt{1+ \Big(\frac{\partial z}{\partial x}\Big)^2 + \Big(\frac{\partial z}{\partial y}\Big)^2} \] Lisäksi \(\|\mathbf{k} \| =1\) ja \(\mathbf{N}\cdot \mathbf{k} = 1\), joten \[ dS = \sqrt{1+ \Big(\frac{\partial z}{\partial x}\Big)^2 + \Big(\frac{\partial z}{\partial y}\Big)^2}\,dx\,dy. \] Kaltevuuden huomioiva korjaustekijä yleistää tasointegraalin pintaintegraaliksi.
Esimerkki
Tarkastellaan sylinterin \(x^2+y^2=a^2\), \(a>0\) leikkaamaa palasta hyperbolisesta paraboloidista \(z=x^2-y^2\). Mikä on palasen pinta-ala?
Lasketaan \[ \frac{\partial}{\partial x} z = 2x,\qquad \frac{\partial}{\partial y} z = -2y. \] Siten pinta-aladifferentiaaliksi saadaan \[ dS = \sqrt{1+ \Big(\frac{\partial z}{\partial x}\Big)^2 + \Big(\frac{\partial z}{\partial y}\Big)^2}\,dx\,dy \] \[ = \sqrt{ 1 + 4(x^2+y^2)} \,dx\,dy \] \[ =\sqrt{1+ 4r^2}\, r\,dr\,d\theta, \] napakoordinaateissa ilmaistuna.
Lasketaan nyt integraali napakoordinaateissa: \[ \textrm{Ala}(S)= \int_0^{2\pi} \int_0^a r\sqrt{1+4r^2}\,dr\,d\theta \] \[ = \frac{\pi}{4} \int_0^a 8r\sqrt{1+4r^2}\,dr \] \[ = \frac{\pi}{4} \bigg|_{r=0}^a\frac{2}{3}(1+4r^2)^{3/2} =\frac{\pi}{6} \big[(1+4a^2)^{3/2} -1\big]. \]
9.3. Taso- ja avaruusintegraalien sovellutuksia
Moninkertaisten integraalien sovelluksia
Tähän mennessä moninkertaisten integraalien sovelluksina on esiintynyt:
Alueen \(D \subset \mathbb{R}^2\) pinta-ala \[ \textrm{A}(D) = \iint_D 1\,dA \]
- Kappaleen \(D \subset \mathbb{R}^3\) tilavuus \[ \textrm{V}(D) = \iiint_D 1\,dV \]
Mekaniikassa tulevat lisäksi vastaan nämä:
Kappaleen massa \[ m(D) = \iiint_D \rho(x,y,z)\,dV \] ja hitausmomentti kappaleen pyöriessä \(z\)-akselin ympäri: \[ I_z(D) = \iiint_D\rho(x,y,z)(x^2+y^2)\,dV. \] Tässä \(\rho(x,y,z)\) on materiaalin tiheys pisteessä \((x,y,z)\).
Kaksiulotteisen tasolevyn keskiön (painopiste) \((\bar x,\bar y)\) laskeminen \[ \bar x = \frac{1}{A(D)} \iint_D x\,dA, \qquad \bar y = \frac{1}{A(D)} \iint_D y\,dA, \] jossa pinta-ala \(A(D)\) on laskettu tasointegraalilla jo aiemmin.
Jos levyn massa ei ole tasaisesti jakautunut, integraalia korjataan paikasta riippuvalla tiheydellä \(\rho(x,y)\) \[ \bar x = \frac{1}{m(D)} \iint_D x \rho(x,y) \,dA, \qquad \bar y = \frac{1}{m(D)} \iint_D y \rho(x,y) \,dA. \] jossa massa \(m(D) = \iint_D \rho(x,y) \,dA \) lasketaan tasointegraalilla.
Massakeskipiste
Kolmiulotteisen kappaleen \(D\) massakeskipiste \((\bar x,\bar y, \bar z)\) \[ \bar x = \frac{1}{m(D)} \iiint_D x \rho(x,y,z)\,dV, \] \[ \bar y = \frac{1}{m(D)} \iiint_D y \rho(x,y,z)\,dV, \] \[ \bar z = \frac{1}{m(D)} \iiint_D z \rho(x,y,z)\,dV, \] missä \(\rho = \rho(x,y,z)\) on kappaleen tiheys pisteessä \((x,y,z)\) ja \(m(D)\) on kappaleen massa (tilavuusintegraalilla). Kaava voidaan kirjoittaa myös vektorimuodossa \[ \bar x\mathbf{i} + \bar y \mathbf{j} + \bar z\mathbf{k} = \frac{\iiint_D \mathbf{r} \rho\, dV}{\iiint_D\rho \,dV}, \] missä \(\mathbf{r} = x\mathbf{i} + y\mathbf{j} + z\mathbf{k}\).
Esimerkki
Lasketaan epäyhtälöiden \(0\le x\le 1\), \(0\le y\le 1\) ja \(0\le z\le 1\) määräämän yksikkökuution \(D\) massakeskipiste, kun tiheys \(\rho(x,y,z)= z\).
Huomautus. Yksikkökuutio \(D\) voidaan myös määritellä käyttäen niin kutsuttua karteesista tuloa: \[ D = [0,1] \times [0,1] \times [0,1] = [0,1]^3. \] Tämä merkintätapa tarkoittaa samaa kuin ylläoleva määritelmä epäyhtälöiden avulla.
Lasketaan ensin massa \[ \iiint_D \rho \,dV = \int_0^1 \int_0^1 \int_0^1 z \,dx\,dy\,dz \] \[ = \int_0^1 z\,dz = \bigg|_{z=0}^1\frac{1}{2}z^2 = \frac{1}{2}. \] Saadaan \[ \bar x = \frac{\int_0^1 \int_0^1 \int_0^1 xz \,dx\,dy\,dz}{1/2} = \frac{\Big(\Big|_{x=0}^1 \frac{1}{2}x^2\Big)\Big(\Big|_{z=0}^1 \frac{1}{2}z^2\Big)}{1/2} \] \[ = \frac{(1/2)^2}{1/2} = \frac{1}{2}. \]
Vastaavasti \[ \bar y = \frac{\int_0^1 \int_0^1 \int_0^1 yz \,dx\,dy\,dz}{1/2} = \frac{(1/2)^2}{1/2} = \frac{1}{2}. \] Edelleen voidaan laskea \[ \bar z = \frac{\int_0^1 \int_0^1 \int_0^1 z^2 \,dx\,dy\,dz}{1/2} = \frac{\Big|_{z=0}^1 \frac{1}{3}z^3}{1/2} \] \[ = \frac{(1/3)}{(1/2)} = \frac{2}{3}. \] Massakeskipisteeksi saadaan \[ (\bar x, \bar y,\bar z) = (1/2,1/2,2/3). \]
Hitausmomentti
Tarkastellaan tilannetta, jossa pistemäiset kappaleet kiertävät origoa \(xy\)-tasossa ympyrän muotoista rataa pitkin samalla kulmanopeudella.
Kappaleiden yhteenlaskettu liike-energia saadaan laskemalla summa \[ E= \sum_{i=1}^N \frac{1}{2} m_iv_i^2= \frac{1}{2} \Big[\sum_{i=1}^N m_i r_i^2\Big]\omega^2= \frac{1}{2}\Big[\sum_{i=1}^N m_i(x_i^2+y_i^2)\Big]\omega^2, \] missä \(\omega\) on kulmanopeus ja \(m_i\), \(x_i\) sekä \(y_i\) ovat \(i\):nnen kappaleen massa ja paikka. Summaa \[ \sum_{i=1}^N m_i(x_i^2+y_i^2) = \sum_{i=1}^N m_i r_i^2 \] kutsutaan hitausmomentiksi. Ajattelemalla \(z\)-akselin ympäri pyörivä kappale joukoksi "infinitesimaalisen pieniä" pisteitä, voidaan edelläolevasta summasta päätellä kappaleen liike-energia: \[ E=\frac{1}{2} \bigg[ \iiint_D (x^2+y^2)\rho(x,y,z)\,dV\bigg]\omega^2 =\frac{1}{2} I_z\omega^2, \] missä \[ I_z = \iiint_D(x^2+y^2)\rho(x,y,z)\,dV = \iiint_D r_z^2 dm \] on kappaleen hitausmomentti \(z\)-akselin suhteen (\(r_z^2 = x^2 + y^2\) ja massa-alkio \(dm = \rho(x,y,z)\,dV\)).
Esimerkki
Lasketaan sylinterin \[ D= \{(x,y,z): x^2+y^2\le a^2\textrm{ ja }0\le z\le 1\},\qquad a>0 \] hitausmomentti \(z\)-akselin suhteen, kun tiheys on vakio \(\rho=\rho_0\).
Lasketaan \[ I_z = \iiint_D (x^2+y^2)\rho_0\,dV \] \[ = \rho_0 \int_0^1 \int_0^{2\pi}\int_0^a r^2r \,dr\,d\theta\,dz \] \[ = 2\pi\rho_0\int_0^ar^3\,dr = \frac{1}{2}\pi\rho_0a^4. \] Toisaalta sylinterin massa on \[ m=\iiint_D \rho_0\,dV = \rho_0\textrm{V}(D)=\rho_0\pi a^2. \] Siten hitausmomentti voidaan kirjoittaa \[ I_z = \frac{1}{2}(\pi \rho_0a^2)a^2 = \frac{1}{2}ma^2. \]