6. Ääriarvojen luokittelu

6.1. Lagrangen kertoimet

Lagrangen kertoimet

Usein optimointitehtävissä halutaan asettaa rajoitusehtoja optimoitaville muuttujille. Tyypillinen esimerkki tällaisesta tehtävästä on peltipurkin muodon optimointi: Halutaan minimoida purkin pinta-ala (eli käytetty materiaali) \(A(h,r)=2\pi rh+2\pi r^2\) niin, että tilavuus \(V(r,h)=\pi r^2 h\) on vakio.

Duaalitehtävä: Halutaan maksimoida purkin tilavuus \(V(r,h)\) siten, että pinta-ala \(A(h,r)\) on vakio. Primaali- ja duaalitehtävillä on sama ratkaisu. Tämän sanoo maalaisjärkikin, mutta itse asiassa ratkaisuun johtavat yhtälötkin ovat (olennaisesti) samoja.

Havaitaan, että mikäli ongelmalla on ratkaisu, niin ratkaisupisteessä \((a,b)\) vektorien \(\nabla f\) ja \(\nabla g\) on oltava joko yhdensuuntaisia tai vastakkaissuuntaisia (mikäli \(\nabla g(a,b) \neq 0\)). Miksi? Koska muussa tapauksessa funktiolla \(f\) olisi nollasta poikkeva suunnattu derivaatta käyrän \(g(x,y)=0\) tangentin suuntaan pisteessä \((a,b)\), ja siis minimi ei voi olla pisteessä \((a,b)\).

Entä jos tehtävänä olisi maksimoida \(f(x,y)\) ehdolla \(g(x,y)=0\)? Entä jos tehtävänä olisi maksimoida \(g(x,y)\) ehdolla \(f(x,y)=c\)?

Mikäli optimipiste on olemassa, se on Lagrangen funktion \[ L(x,y,\lambda) = f(x,y) + \lambda g(x,y) \] kriittinen piste (eli gradientin nollakohta). Menetelmä yleistyy myös useammalle muuttujalle. Esimerkiksi kolmen muuttujan tapauksessa Lagrangen funktio on \[ L(x,y,z,\lambda,\mu) = f(x,y,z) + \lambda g(x,y,z) + \mu h(x,y,z), \] missä \(f\) on minimoitava funktio ja rajoite-ehdot ovat \(g(x,y,z)=0\) sekä \(h(x,y,z)=0\).

Esimerkki

Minimoidaan funktio \(f(x,y)=x^2+y^2\) ehdolla \(g(x,y)=x^2y-16=0\). Muodostetaan aluksi Lagrangen funktio \[ L(x,y,\lambda)=x^2+y^2+\lambda(x^2y-16). \] Yhtälöt kriittisille pisteille ovat \begin{align*} 0 &=\frac{\partial L}{\partial x} = 2x(1+\lambda y),\\ 0 &=\frac{\partial L}{\partial y} = 2y+\lambda x^2,\\ 0 &=\frac{\partial L}{\partial \lambda}= x^2y-16,\\ \end{align*} joista viimeinen on aina itse rajoitusehto.

Ensimmäisestä yhtälöstä saadaan \(x=0\) tai \(\lambda y=-1\), mutta \(x=0\) on ristiriidassa kolmannen yhtälön kanssa. Siten toisesta yhtälöstä \[ 0=2y^2+\lambda yx^2 = 2y^2-x^2. \] Tästä saadaan edelleen \(x=\pm \sqrt{2}y\), ja \(2y^3=16\) eli \(y=2\). Ääriarvoja (mahdollisia minimejä) on siis kaksi \((x,y) = (\pm 2\sqrt{2},2)\). Pitää selvittää muilla keinoin, ovatko nämä minimejä vai maksimeja.

Esimerkki

Yritetään etsiä Lagrangen kertoimien menetelmällä funktion \(f(x,y)=y\) minimi ehdolla \(g(x,y)=y^3-x^2=0\). Helposti havaitaan, että minimi \(f(x,y)=0\) saavutetaan pisteessä \((0,0)\).

Muodostetaan Lagrangen funktio \[ L(x,y,\lambda)=y+\lambda(y^3-x^2). \] Saadaan yhtälöt \[ -2\lambda x =0,\quad 1+3\lambda y^2=0,\text{ ja } y^3-x^2=0. \] Nämä yhtälöt ovat keskenään ristiriidassa, joten ratkaisua niille ei ole. Huomaa, että \(\nabla g(0,0) =\mathbf{0}\) minimipisteessä. Tästä nähdään, että Lagrangen kertoimet näkevät ääriarvoja vain pisteissä, joissa \(\nabla g(0,0) \neq \mathbf{0}\).

Esimerkki

Etsitään ääriarvot funktiolle \(f(x,y,z)=xy+2z\) ehdoilla \(x+y+z=0\) ja \(x^2+y^2+z^2=24\).

Koska \(f\) on jatkuva ja annettujen leikkausjoukkojen leikkaus on ympyräviiva (eli rajoitettu ja suljettu joukko), niin ääriarvot ovat olemassa. Muodostetaan Lagrangen funktio \[ L(x,y,z,\lambda,\mu)=xy+2z+\lambda(x+y+z)+\mu(x^2+y^2+z^2-24). \] Lagrangen funktion osittaisderivaatoista saadaan yhtälöt \begin{align*} & y+\lambda+2\mu x=0, \\ & x+\lambda+2\mu y=0, \\ & 2+\lambda+2\mu z=0, \\ & x+y+z = 0,\text{ ja } \\ & x^2+y^2+z^2-24=0. \end{align*} Kahden ensimmäisen yhtälön erotus johtaa yhtälöön \((x-y)(1-2\mu)=0\), joten joko \(\mu = 1/2\) tai \(x=y\). Tutkitaan molemmat tapaukset.

Tapaus I (\(\mu = 1/2\)): Toisen ja kolmannen yhtälön perusteella \[ x+\lambda +y =0\textrm{ ja } 2+\lambda +z =0,\text{ siis }x+y=2+z. \] Neljännestä yhtälöstä saadaan \(z=-1\) ja \(x+y=1\). Viimeisen yhtälön perusteella \(x^2+y^2=24-z^2=23\). Koska \(x^2+y^2+2xy=(x+y)^2 =1\), saadaan \(2xy=1-23=-22\) ja \(xy=-11\). Nyt \((x-y)^2 = x^2+y^2-2xy = 23+22=45\), joten \(x-y=\pm 3\sqrt{5}\). Yhdessä yhtälön \(x+y=1\) kanssa tästä saadaan kaksi kriittistä pistettä \[ P_1 = \big((1+3\sqrt{5})/2,(1-3\sqrt{5})/2,-1\big)\text{ ja } P_2 = \big((1-3\sqrt{5})/2,(1+3\sqrt{5})/2,-1\big). \] Kummassakin pisteessä \(f(x,y,z)=-11-2 = -13\).

Tapaus II (\(x=y\)): Neljännestä yhtälöstä nähdään, että \(z=-2x\), ja viimeisen yhtälön perusteella \(6x^2=24\) eli \(x=\pm 2\). Näin ollen, kriittiset pisteet ovat \[ P_3=(2,2,-4)\text{ ja } P_4=(-2,-2,4). \] Saadaan \[ f(2,2,-4)=4-8=-4\text{ ja } f(-2,-2,4)=4+8=12. \] Siten funktion \(f\) maksimi on \(12\) ja minimi \(-13\).