4. Ketjusäännöt ja lineaarinen approksimointi

Motivaatio

Yleistetään derivoinnin ketjusääntö \[ \frac{d}{dx}f\big(g(x)\big) = f'\big(g(x)\big)g'(x) \] usean muuttujan funktioille \(f\).

Ketjusääntö liittyy suoraan myös moniin käytännön sovelluksiin. Voidaan ajatella fysikaalista suuretta kuten lämpötilaa, mekaanisen systeemin kokonaisenergiaa, jotka riippuvat useista eri toissijaisista muuttujista (kuten ajasta, paikasta, tai nopeudesta). Nämä muuttujat voivat riippua edelleen kolmansista muuttujista (paikka ja nopeus esimerkiksi ajasta). Halutaan tarkastella kiinnostavan fysikaalisen suureen muutosnopeutta mainittujen kolmansien muuttujien suhteen.

Esimerkki

Retkeilijä liikkuu karttaa käyttäen mäkisessä maastossa. Olkoon \((x,y)\) retkeilijän paikka kartalla, \(z=f(x,y)\) kulloinenkin korkeus meren pinnasta ja \[ \mathbf{r}(t)=\left(u(t),v(t)\right) \] retkeilijän paikka kartalla hetkellä \(t\). Retkeilijän paikan korkeus eli etäisuus meren pinnan tasosta hetkellä \(t\) on siis yhdistetty funktio \[ z=f\left(u(t),v(t)\right) = g(t). \] Kuinka nopeasti retkelijän paikan korkeus muuttuu ajan kuluessa?

Ilmeisestikin vastaus kysymykseen on funktion \(g(t)\) derivaatta. Lasketaan: \begin{align*} \lim_{h\to 0}\frac{g(t+h)-g(t)}{h} &= \lim_{h\to 0}\frac{f(u(t+h),v(t+h))-f(u(t),v(t))}{h} \\ &= \lim_{h\to 0}\frac{f(u(t+h),v(t+h))-f(u(t),v(t+h))}{h}\\ &\quad + \lim_{h\to 0}\frac{f(u(t),v(t+h))-f(u(t),v(t))}{h} \end{align*} Yhden muuttujan ketjusäännön perusteella \[ g'(t)=f_{x}\big(u(t),v(t)\big)u'(t)+f_{y}\big(u(t),v(t)\big)v'(t). \]

Ketjusäännöt

Olkoon \(z\) muuttujien \(x,y\) jatkuvasti derivoituva funktio (eli funktio, jolla on jatkuvat 1. kertaluvun osittaisderivaatat). Jos \(x,y\) ovat muuttujan \(t\) jatkuvasti derivoituvia funktioita, niin \[ \frac{dz}{dt} = \frac{\partial z}{\partial x}\frac{dx}{dt} + \frac{\partial z}{\partial y}\frac{dy}{dt}. \] Jos \(x,y\) ovat kahden muuttujan \(s,t\) jatkuvasti derivoituvia funktioita, niin \begin{equation} \frac{\partial z}{\partial s} = \frac{\partial z}{\partial x}\frac{\partial x}{\partial s} + \frac{\partial z}{\partial y}\frac{\partial y}{\partial s} \end{equation} ja \begin{equation} \frac{\partial z}{\partial t} = \frac{\partial z}{\partial x}\frac{\partial x}{\partial t} + \frac{\partial z}{\partial y}\frac{\partial y}{\partial t}. \end{equation}

Keskeisiä kysymyksiä:
Mikä on yleinen idea näissä kaavoissa? Kuinka voidaan muodostaa yleisessä tapauksessa laskentakaava yhdistetyn funktion (osittais)derivaatoille?

Ajatellaanpa, että \(z = f(u,v,t)\), jossa \(u = u(x,y)\) ja \(v=v(y,t)\). Tarkastellaan graafina "infinitesimaalisen muutoksen etenemistä" muuttujasta \(t\) muuttujaan \(z\) kaikkien etenemisreittien kautta.

Kuinka tilanne muuttuu, jos lisäksi \(x = x(t)\) ja \(y= y(t),\) jolloin \(z = z(t)\) ja kysytään kaavaa derivaatalle \(\frac{d z}{d t}\)? Saadaan \[ \frac{\partial z}{\partial t} = \frac{\partial f}{\partial v} \frac{\partial v}{\partial t} + \frac{\partial f}{\partial t} \] ja \begin{align*} \frac{d z}{d t} & = \frac{\partial f}{\partial u} \left ( \frac{\partial u}{\partial x} \frac{d x}{d t} + \frac{\partial u}{\partial y} \frac{d y}{d t} \right ) \\ &\quad+ \frac{\partial f}{\partial v} \left ( \frac{\partial v }{\partial t} + \frac{\partial v}{\partial y} \frac{d y}{d t} \right ) + \frac{\partial f}{\partial t}, \end{align*} jossa on yhteensä viisi termiä.

Huomautus. Tässä on käytetty sekä notaatiota \(\frac{\partial z}{\partial t}\) että \(\frac{\partial f}{\partial t}\), jotka tarkoittavat eri asiaa!

Esimerkki

Olkoon \(f\colon \mathbb{R}^2\to\mathbb{R}\) jatkuvasti derivoituva. Etsitään \[ \frac{\partial}{\partial x} f(x^2y,x+2y)\text{ ja } \frac{\partial}{\partial y} f(x^2y,x+2y). \]

Saadaan \begin{align*} \frac{\partial}{\partial x} f(x^2y,x+2y) &= f_{x}(x^2y,x+2y)\frac{\partial}{\partial x} (x^2y) \\ &\quad +f_{y}(x^2y,x+2y)\frac{\partial}{\partial x}(x+2y) \\ &= 2xy f_{x}(x^2y,x+2y)+ f_{y}(x^2y,x+2y). \end{align*} Vastaavasti voidaan laskea \begin{align*} \frac{\partial}{\partial y} f(x^2y,x+2y) &= f_{x}(x^2y,x+2y)\frac{\partial}{\partial y} (x^2y) \\ & +f_{y}(x^2y,x+2y)\frac{\partial}{\partial y}(x+2y) \\ &= x^2 f_{x}(x^2y,x+2y)+ 2f_{y}(x^2y,x+2y). \end{align*}

Esimerkki
Lämpötila ilmakehässä \(({}^\circ\)C) riippuu paikasta \((x,y,z)\) sekä ajasta \(t\). Ajatellaan lämpötilaa näistä parametrista riippuvana funktiona \(T(x,y,z,t)\). Jos funktio \(T\) esittää sääpalloon liitetyn lämpömittarin mittaamaa lämpötilaa, määritetään \(T\):n muutos ajan suhteen.

Määritetään lämpötilan muutos hetkellä \(t=1\), kun \[ T(x,y,z,t)=\frac{xy}{1+z}(1+t), \] ja sääpallo etenee reittiä \(\mathbf{r}(t)=(t,2t,t-t^2)\). Koska lämpömittarin lukeman muutos riippuu kaikista neljästä parametrista, mitään niistä ei voida jättää huomiotta.

Lämpötilan muutoksen kaavaksi saadaan siten \[ \frac{dT}{dt} = \frac{\partial T}{\partial x}\frac{dx}{dt} +\frac{\partial T}{\partial y}\frac{dy}{dt} +\frac{\partial T}{\partial z}\frac{dz}{dt} +\frac{\partial T}{\partial t}. \] Koordinaattifunktioiden arvot hetkellä \(t=1\) ovat \[ x=1,\quad y=2\text{ ja } z=0. \] Koordinaattifunktioiden derivaattojen arvot hetkellä \(t=1\) ovat \[ \frac{dx}{dt}=1,\quad \frac{dy}{dt}=2\text{ ja } \frac{dz}{dt}=-1. \] Siten hetkellä \(t=1\) saadaan \begin{align*} \frac{\partial T}{\partial x} &= \frac{y}{1+z}(1+t)=4, &&\frac{\partial T}{\partial y} = \frac{x}{1+z}(1+t)=2, \\ \frac{\partial T}{\partial z} &= \frac{-xy}{(1+z)^2}(1+t)=-4, &&\frac{\partial T}{\partial t} = \frac{xy}{1+z}=2. \end{align*} Näin ollen, \[ \frac{dT}{dt}\bigg|_{t=1} = 4\cdot 1 + 2\cdot 2 + (-4) \cdot (-1) +2 = 14. \]

Approksimaatiot

Yksiulotteisessa tapauksessa muotoa \(y=f(x)\) olevan funktion kuvaajan tangenttisuora \(L(x)\) pisteessä \(a\) saadaan kaavasta \[ L(x) = f(a) + f'(a)(x-a). \] Tangenttisuoran lauseke antaa myös tavan approksimoida funktiota \(f\) pisteen \(a\) läheisyydessä: \(f(x)\approx L(x)\).

Miksi approksimaatiota tarvitaan, jos kerran tietokone voi laskea nopeasti ja tarkasti? Kun halutaan löytää "peukalosääntö" päässälaskun helpottamiseksi ja ymmärryksen lisäämiseksi. Kun funktio \(f\) on olemassa ainoastaan taulukoituna, esimerkiksi mittaustuloksista.

Lineaariset approksimaatiot usean muuttujan funktioille

Tapauksessa \(n=2\) saadaan funktiota \(f(x,y)\) approksimoiva tangenttitaso \(L(x,y)\), joka voidaan laskea osoittaisderivaattojen avulla kaavasta \[ f(x,y) \approx L(x,y) = f(a,b)+f_{x}(a,b)(x-a)+f_{y}(a,b)(y-b). \] Vieläkin useamman muuttujan tapauksessa saadaan ihan samannäköinen kaava, joskin enemmän osittaisderivaattatermejä.

Esimerkki

Etsitään lineaarinen approksimaatio funktiolle \[ f(x,y)=\sqrt{2x^2+e^{2y}} \] pisteessä \((2,0)\), ja arvioidaan funktion arvoa pisteessä \((2.2,-0.2)\).

Saadaan \(f(2,0)=3\). Funktion osittaisderivaatat ovat \[ f_{x}(x,y) = \frac{2x}{\sqrt{2x^2+e^{2y}}}, \quad f_{x}(2,0)=\frac{4}{3}. \] ja \[ f_{y}(x,y) = \frac{e^{2y}}{\sqrt{2x^2+e^{2y}}}, \quad f_{y}(2,0)=\frac{1}{3}. \] Siten \[ L(x,y)=3 +\frac{4}{3}(x-2)+\frac{1}{3}(y-0). \] Haluttu approksimaatio siis on \[ f(2.2,-0.2) \approx L(2.2,-0.2) = 3 +\frac{4}{3}(2.2-2)+\frac{1}{3}(-0.2-0)=3.2. \] Vertailun vuoksi funktion \(f(x,y)\) todellinen arvo pisteessä \((2.2,-0.2)\) on noin \(3.2172\).

Huomautuksia

Toisin kuin yksiulotteisessa tapauksessa pelkkä osittaisderivaattojen olemassaolo ei riitä takaamaan edes funktion \(f(x,y)\) jatkuvuutta. Esimerkiksi \[ f(x,y)=\left\{\begin{array}{rl} 0, & \text{kun }x=0\text{ tai }y=0,\\ 1, &\text{muuten}. \end{array}\right. \] ja \[ f(x,y)=\left\{\begin{array}{rl} \frac{2xy}{x^2 +y^2}, & \text{kun }x^2+y^2>0,\\ 0, &\text{kun } (x,y)=(0,0). \end{array}\right. \] Siksi tilannetta on tarpeen analysoida tarkemmin. Halutaan ehto, joka kertoo milloin tangenttitaso \(L(x,y)\) on mielekäs approksimaatio funktiolle \(f(x,y)\) lähellä pistettä \((a,b)\).

Differentioituvuus

Määritelmä. Funktiota \(f(x,y)\) sanotaan differentioituvaksi pisteessä \((a,b)\), jos \[ \lim_{(h,k)\to (0,0)} \frac{f(a+h,b+k)-f(a,b)-h\,f_{x}(a,b)-k\,f_{y}(a,b)}{\sqrt{h^2+k^2}}=0. \]

Saadaan seuraava tulos:

Lause. Jos \(f_{x},f_{y}\) ovat jatkuvia jossakin pisteen \((a,b)\) ympäristössä, niin \(f\) on differentioituva pisteessä \((a,b)\).

Esimerkki

Lasketaan virhetermi \(f(x+h,y+k)-f(x,y)-h\,f_{x}(x,y)-k\,f_{y}(x,y)\), kun \(f(x,y)=x^3+xy^2\).

Osittaisderivaatoiksi saadaan \(f_{x}(x,y)=3x^2+y^2\) ja \(f_{y}(x,y)=2xy\), joten \begin{align*} &f(x+h,y+k)-f(x,y)-h\,f_{x}(x,y)-k\,f_{y}(x,y) \\ &\quad =(x+h)^3+(x+h)(y+k)^2-x^3-xy^2-(3x^2+y^2)h -2xyk\\ &\quad=3xh^2+h^3+2yhk+hk^2+xk^2. \\ \end{align*} Lausekeen \(h\)- ja \(k\)-termit lähestyvät nollaa samalla nopeudella kuin \(h^2+k^2\), kun \((h,k)\to 0\), joten differentioituvuuden määritelmä selvästi toteutuu.