Differentiaali- ja integraalilaskenta 2, kevät 2022 (Aalto MOOC)
Kurssiasetusten perusteella kurssi on päättynyt 25.02.2022 Etsi kursseja: Differentiaali-
Differentiaali- ja integraalilaskenta 2
Copyright Harri Hakula, Antti Rasila, Pekka Alestalo
Lisenssi CC BY-SA
4. Ketjusäännöt ja lineaarinen approksimointi
Motivaatio
Yleistetään derivoinnin ketjusääntö \[ \frac{d}{dx}f\big(g(x)\big) = f'\big(g(x)\big)g'(x) \] usean muuttujan funktioille \(f\).
Ketjusääntö liittyy suoraan myös moniin käytännön sovelluksiin. Voidaan ajatella fysikaalista suuretta kuten lämpötilaa, mekaanisen systeemin kokonaisenergiaa, jotka riippuvat useista eri toissijaisista muuttujista (kuten ajasta, paikasta, tai nopeudesta). Nämä muuttujat voivat riippua edelleen kolmansista muuttujista (paikka ja nopeus esimerkiksi ajasta). Halutaan tarkastella kiinnostavan fysikaalisen suureen muutosnopeutta mainittujen kolmansien muuttujien suhteen.
Esimerkki
Retkeilijä liikkuu karttaa käyttäen mäkisessä maastossa. Olkoon \((x,y)\) retkeilijän paikka kartalla, \(z=f(x,y)\) kulloinenkin korkeus meren pinnasta ja \[ \mathbf{r}(t)=\left(u(t),v(t)\right) \] retkeilijän paikka kartalla hetkellä \(t\). Retkeilijän paikan korkeus eli etäisuus meren pinnan tasosta hetkellä \(t\) on siis yhdistetty funktio \[ z=f\left(u(t),v(t)\right) = g(t). \] Kuinka nopeasti retkelijän paikan korkeus muuttuu ajan kuluessa?
Ilmeisestikin vastaus kysymykseen on funktion \(g(t)\) derivaatta. Lasketaan: \begin{align*} \lim_{h\to 0}\frac{g(t+h)-g(t)}{h} &= \lim_{h\to 0}\frac{f(u(t+h),v(t+h))-f(u(t),v(t))}{h} \\ &= \lim_{h\to 0}\frac{f(u(t+h),v(t+h))-f(u(t),v(t+h))}{h}\\ &\quad + \lim_{h\to 0}\frac{f(u(t),v(t+h))-f(u(t),v(t))}{h} \end{align*} Yhden muuttujan ketjusäännön perusteella \[ g'(t)=f_{x}\big(u(t),v(t)\big)u'(t)+f_{y}\big(u(t),v(t)\big)v'(t). \]
Ketjusäännöt
Olkoon \(z\) muuttujien \(x,y\) jatkuvasti derivoituva funktio (eli funktio, jolla on jatkuvat 1. kertaluvun osittaisderivaatat). Jos \(x,y\) ovat muuttujan \(t\) jatkuvasti derivoituvia funktioita, niin \[ \frac{dz}{dt} = \frac{\partial z}{\partial x}\frac{dx}{dt} + \frac{\partial z}{\partial y}\frac{dy}{dt}. \] Jos \(x,y\) ovat kahden muuttujan \(s,t\) jatkuvasti derivoituvia funktioita, niin \begin{equation} \frac{\partial z}{\partial s} = \frac{\partial z}{\partial x}\frac{\partial x}{\partial s} + \frac{\partial z}{\partial y}\frac{\partial y}{\partial s} \end{equation} ja \begin{equation} \frac{\partial z}{\partial t} = \frac{\partial z}{\partial x}\frac{\partial x}{\partial t} + \frac{\partial z}{\partial y}\frac{\partial y}{\partial t}. \end{equation}
Keskeisiä kysymyksiä:
Mikä on yleinen idea näissä kaavoissa?
Kuinka voidaan muodostaa yleisessä tapauksessa laskentakaava yhdistetyn funktion (osittais)derivaatoille?
Ajatellaanpa, että \(z = f(u,v,t)\), jossa \(u = u(x,y)\) ja \(v=v(y,t)\). Tarkastellaan graafina "infinitesimaalisen muutoksen etenemistä" muuttujasta \(t\) muuttujaan \(z\) kaikkien etenemisreittien kautta.
Kuinka tilanne muuttuu, jos lisäksi \(x = x(t)\) ja \(y= y(t),\) jolloin \(z = z(t)\) ja kysytään kaavaa derivaatalle \(\frac{d z}{d t}\)? Saadaan \[ \frac{\partial z}{\partial t} = \frac{\partial f}{\partial v} \frac{\partial v}{\partial t} + \frac{\partial f}{\partial t} \] ja \begin{align*} \frac{d z}{d t} & = \frac{\partial f}{\partial u} \left ( \frac{\partial u}{\partial x} \frac{d x}{d t} + \frac{\partial u}{\partial y} \frac{d y}{d t} \right ) \\ &\quad+ \frac{\partial f}{\partial v} \left ( \frac{\partial v }{\partial t} + \frac{\partial v}{\partial y} \frac{d y}{d t} \right ) + \frac{\partial f}{\partial t}, \end{align*} jossa on yhteensä viisi termiä.
Esimerkki
Olkoon \(f\colon \mathbb{R}^2\to\mathbb{R}\) jatkuvasti derivoituva. Etsitään \[ \frac{\partial}{\partial x} f(x^2y,x+2y)\text{ ja } \frac{\partial}{\partial y} f(x^2y,x+2y). \]
Saadaan \begin{align*} \frac{\partial}{\partial x} f(x^2y,x+2y) &= f_{x}(x^2y,x+2y)\frac{\partial}{\partial x} (x^2y) \\ &\quad +f_{y}(x^2y,x+2y)\frac{\partial}{\partial x}(x+2y) \\ &= 2xy f_{x}(x^2y,x+2y)+ f_{y}(x^2y,x+2y). \end{align*} Vastaavasti voidaan laskea \begin{align*} \frac{\partial}{\partial y} f(x^2y,x+2y) &= f_{x}(x^2y,x+2y)\frac{\partial}{\partial y} (x^2y) \\ & +f_{y}(x^2y,x+2y)\frac{\partial}{\partial y}(x+2y) \\ &= x^2 f_{x}(x^2y,x+2y)+ 2f_{y}(x^2y,x+2y). \end{align*}
Esimerkki
Lämpötila ilmakehässä \(({}^\circ\)C) riippuu paikasta \((x,y,z)\) sekä ajasta \(t\). Ajatellaan lämpötilaa näistä parametrista riippuvana funktiona \(T(x,y,z,t)\). Jos funktio \(T\) esittää sääpalloon liitetyn lämpömittarin mittaamaa lämpötilaa, määritetään \(T\):n muutos ajan suhteen.Määritetään lämpötilan muutos hetkellä \(t=1\), kun \[ T(x,y,z,t)=\frac{xy}{1+z}(1+t), \] ja sääpallo etenee reittiä \(\mathbf{r}(t)=(t,2t,t-t^2)\). Koska lämpömittarin lukeman muutos riippuu kaikista neljästä parametrista, mitään niistä ei voida jättää huomiotta.
Lämpötilan muutoksen kaavaksi saadaan siten \[ \frac{dT}{dt} = \frac{\partial T}{\partial x}\frac{dx}{dt} +\frac{\partial T}{\partial y}\frac{dy}{dt} +\frac{\partial T}{\partial z}\frac{dz}{dt} +\frac{\partial T}{\partial t}. \] Koordinaattifunktioiden arvot hetkellä \(t=1\) ovat \[ x=1,\quad y=2\text{ ja } z=0. \] Koordinaattifunktioiden derivaattojen arvot hetkellä \(t=1\) ovat \[ \frac{dx}{dt}=1,\quad \frac{dy}{dt}=2\text{ ja } \frac{dz}{dt}=-1. \] Siten hetkellä \(t=1\) saadaan \begin{align*} \frac{\partial T}{\partial x} &= \frac{y}{1+z}(1+t)=4, &&\frac{\partial T}{\partial y} = \frac{x}{1+z}(1+t)=2, \\ \frac{\partial T}{\partial z} &= \frac{-xy}{(1+z)^2}(1+t)=-4, &&\frac{\partial T}{\partial t} = \frac{xy}{1+z}=2. \end{align*} Näin ollen, \[ \frac{dT}{dt}\bigg|_{t=1} = 4\cdot 1 + 2\cdot 2 + (-4) \cdot (-1) +2 = 14. \]
Approksimaatiot
Yksiulotteisessa tapauksessa muotoa \(y=f(x)\) olevan funktion kuvaajan tangenttisuora \(L(x)\) pisteessä \(a\) saadaan kaavasta \[ L(x) = f(a) + f'(a)(x-a). \] Tangenttisuoran lauseke antaa myös tavan approksimoida funktiota \(f\) pisteen \(a\) läheisyydessä: \(f(x)\approx L(x)\).
Miksi approksimaatiota tarvitaan, jos kerran tietokone voi laskea nopeasti ja tarkasti? Kun halutaan löytää "peukalosääntö" päässälaskun helpottamiseksi ja ymmärryksen lisäämiseksi. Kun funktio \(f\) on olemassa ainoastaan taulukoituna, esimerkiksi mittaustuloksista.
Lineaariset approksimaatiot usean muuttujan funktioille
Tapauksessa \(n=2\) saadaan funktiota \(f(x,y)\) approksimoiva tangenttitaso \(L(x,y)\), joka voidaan laskea osoittaisderivaattojen avulla kaavasta \[ f(x,y) \approx L(x,y) = f(a,b)+f_{x}(a,b)(x-a)+f_{y}(a,b)(y-b). \] Vieläkin useamman muuttujan tapauksessa saadaan ihan samannäköinen kaava, joskin enemmän osittaisderivaattatermejä.
Esimerkki
Etsitään lineaarinen approksimaatio funktiolle \[ f(x,y)=\sqrt{2x^2+e^{2y}} \] pisteessä \((2,0)\), ja arvioidaan funktion arvoa pisteessä \((2.2,-0.2)\).
Saadaan \(f(2,0)=3\). Funktion osittaisderivaatat ovat \[ f_{x}(x,y) = \frac{2x}{\sqrt{2x^2+e^{2y}}}, \quad f_{x}(2,0)=\frac{4}{3}. \] ja \[ f_{y}(x,y) = \frac{e^{2y}}{\sqrt{2x^2+e^{2y}}}, \quad f_{y}(2,0)=\frac{1}{3}. \] Siten \[ L(x,y)=3 +\frac{4}{3}(x-2)+\frac{1}{3}(y-0). \] Haluttu approksimaatio siis on \[ f(2.2,-0.2) \approx L(2.2,-0.2) = 3 +\frac{4}{3}(2.2-2)+\frac{1}{3}(-0.2-0)=3.2. \] Vertailun vuoksi funktion \(f(x,y)\) todellinen arvo pisteessä \((2.2,-0.2)\) on noin \(3.2172\).
Huomautuksia
Toisin kuin yksiulotteisessa tapauksessa pelkkä osittaisderivaattojen olemassaolo ei riitä takaamaan edes funktion \(f(x,y)\) jatkuvuutta. Esimerkiksi \[ f(x,y)=\left\{\begin{array}{rl} 0, & \text{kun }x=0\text{ tai }y=0,\\ 1, &\text{muuten}. \end{array}\right. \] ja \[ f(x,y)=\left\{\begin{array}{rl} \frac{2xy}{x^2 +y^2}, & \text{kun }x^2+y^2>0,\\ 0, &\text{kun } (x,y)=(0,0). \end{array}\right. \] Siksi tilannetta on tarpeen analysoida tarkemmin. Halutaan ehto, joka kertoo milloin tangenttitaso \(L(x,y)\) on mielekäs approksimaatio funktiolle \(f(x,y)\) lähellä pistettä \((a,b)\).
Differentioituvuus
Määritelmä. Funktiota \(f(x,y)\) sanotaan differentioituvaksi pisteessä \((a,b)\), jos \[ \lim_{(h,k)\to (0,0)} \frac{f(a+h,b+k)-f(a,b)-h\,f_{x}(a,b)-k\,f_{y}(a,b)}{\sqrt{h^2+k^2}}=0. \]
Saadaan seuraava tulos:
Lause. Jos \(f_{x},f_{y}\) ovat jatkuvia jossakin pisteen \((a,b)\) ympäristössä, niin \(f\) on differentioituva pisteessä \((a,b)\).
Esimerkki
Lasketaan virhetermi \(f(x+h,y+k)-f(x,y)-h\,f_{x}(x,y)-k\,f_{y}(x,y)\), kun \(f(x,y)=x^3+xy^2\).
Osittaisderivaatoiksi saadaan \(f_{x}(x,y)=3x^2+y^2\) ja \(f_{y}(x,y)=2xy\), joten \begin{align*} &f(x+h,y+k)-f(x,y)-h\,f_{x}(x,y)-k\,f_{y}(x,y) \\ &\quad =(x+h)^3+(x+h)(y+k)^2-x^3-xy^2-(3x^2+y^2)h -2xyk\\ &\quad=3xh^2+h^3+2yhk+hk^2+xk^2. \\ \end{align*} Lausekeen \(h\)- ja \(k\)-termit lähestyvät nollaa samalla nopeudella kuin \(h^2+k^2\), kun \((h,k)\to 0\), joten differentioituvuuden määritelmä selvästi toteutuu.