Metoda Lagrangeových multiplikátorů: Porovnání verzí

Smazaný obsah Přidaný obsah
Zmena znamenka aby sedela rovnice o dva radky nize. Nove konzistentni s anglickou strankou: https://en.wikipedia.org/wiki/Lagrange_multiplier#Multiple_constraints
značky: URL ve shrnutí editace z Vizuálního editoru
JAnDbot (diskuse | příspěvky)
m formát zápisu šablon; kosmetické úpravy
Řádek 2:
'''Metoda Lagrangeových multiplikátorů''' neboli '''Lagrangeova metoda neurčitých koeficientů''' je metoda, jak nalézt extrémy diferencovatelné funkce za předpokladu platnosti diferencovatelných [[omezující podmínky|omezujících podmínek]]. Uveřejnil ji [[Joseph-Louis Lagrange]] počátkem 19. století.
 
Jestliže hledáme extrémy funkce <math>f\left( x_1, \ldots, x_n \right)</math> za předpokladu platnosti ''m'' vazeb (omezujících podmínek) ve tvaru
 
:<math>g_k\left( x_1, \ldots , x_n \right) = 0,</math>
 
kde ''n'' a ''k'' jsou přirozená čísla a ''k'' nabývá hodnot mezi 1 a ''m'', tak metoda Lagrangeových multiplikátorů začíná vytvořením ''Lagrangeovy funkce'' <math>\mathcal{L}</math>, závislé na ''n'' + ''m'' proměnných:
 
:<math>\mathcal{L}\left( x_1,\ldots , x_n, \lambda_1, \ldots, \lambda _m \right) = f\left( x_1, \ldots, x_n \right) - \sum\limits_{k=1}^m {\lambda_k g_k\left( x_1, \ldots , x_n \right)}.</math>
Řádek 24:
:<math>\nabla_{\mathbf{x}, \boldsymbol{\lambda}} \mathcal{L} (\mathbf{x}, \boldsymbol{\lambda})=0,</math>
 
což znamená, že Lagrangeovu funkci je potřeba postupně zderivovat podle všech jejích ''n'' + ''m'' proměnných, derivace položit rovny nule a soustavu vyřešit. Řešení udávají souřadnice bodů, v nichž může (ale nemusí) existovat hledaný vázaný extrém.
 
== Příklad ==
[[ImageSoubor:Lagrange very simple.svg|thumbnáhled|rightvpravo|upright=1.1|Extrémní hodnoty lineární fukce na kružnici]]
 
Najděme maximum [[lineární funkce]] <math>f(x,y)=x+y</math> vázané na jednotkovou kružnici <math>x^2+y^2=1</math>.
 
Vazba je
 
:<math>g(x,y)=x^2+y^2-1,</math>
takže Lagrangeova funkce je
 
:<math>\begin{align}
Řádek 69:
:<math>\left(\tfrac{\sqrt{2}}{2},\tfrac{\sqrt{2}}{2}, -\tfrac{1}{\sqrt{2}}\right), \qquad \left(-\tfrac{\sqrt{2}}{2}, -\tfrac{\sqrt{2}}{2}, \tfrac{1}{\sqrt{2}}\right).</math>
 
Vypočítáme hodnoty {{mvarMvar|f}} v těchto bodech (zajímají nás jen první dvě souřadnice stacionárních bodů, třetí souřadnice odpovídá multiplikátoru, který v tuto chvíli už nepotřebujeme):
 
:<math>f\left(\tfrac{\sqrt{2}}{2},\tfrac{\sqrt{2}}{2}\right)=\sqrt{2}, \qquad f\left(-\tfrac{\sqrt{2}}{2}, -\tfrac{\sqrt{2}}{2}\right)=-\sqrt{2}.</math>
Řádek 75:
Vázané maximum tedy je <math>\sqrt{2}</math> a vázané minimum <math>-\sqrt{2}</math>.
 
== Geometrický význam ==
[[FileSoubor:LagrangeMultipliers3D.png|rightvpravo|thumbnáhled|upright 1.5|Funkce dvou proměnných ''f''(''x'', ''y'') je znázorněna fialovou plochou. Úlohou je najít maximální hodnotu této funkce ležící na červené vazebné křivce ''g''(''x'', ''y'') = 0 (vázaný extrém). Modré ovály jsou „vrstevnice“ funkce ''f'', tedy geometrická místa s konstantní hodnotou funkce; menší modrý ovál je vrstevnice, na které leží vázaný extrém.]]
[[FileSoubor:LagrangeMultipliers2D.svg|rightvpravo|thumbnáhled|upright 1.5|Půdorys situace znázorněné na předchozím grafu. Je vidět, že vrstevnice, na které leží vázaný extrém, se dotýká křivky g v bodě, v němž obě křivky mají stejný směr – stejnou [[tečna|tečnu]] ]]
Ve dvourozměrném případě na obrázcích je naznačena funkce f a její vrstevnice ''f''(''x'', ''y'') = 0, jakož i křivka ''g''(''x'', ''y'') = 0 odpovídající vazbě. Hledáme nejvyšší hodnotu ''f'', která se nachází na bodech této červeně vyznačené křivky (tj. vázaný extrém).
 
Vázaný extrém se může vyskytnout pouze na vrstevnici, kterou křivka vazby neprotíná. Jinak totiž se na jedné straně od takové vrstevnice nacházejí hodnoty vyšší a na druhé straně nižší než ''f''(''x'', ''y''), a proto zde nemůže nastat extrém; postupem po křivce vazby se totiž hned v sousedství daného bodu dostaneme na hodnoty vyšší nebo nižší než v tomto bodě.
 
Pokud se vrstevnice a křivka vazby neprotínají, musejí se dotýkat (být si lokálně [[tečna]]mi). Stačí tedy analyticky vyjádřit, že se dvě křivky dotýkají, a máme nutnou podmínku vázaného extrému. K tomu účelu si uvědomme, že „lokální směr“ přímky nebo plochy určuje [[gradient (matematika)|gradient]] – vektor, mířící ve směru největšího zakřivení, a tedy kolmý na tečnu. Na nižším obrázku jsou gradienty naznačeny jako malé šipky vycházející z křivek.
 
Protože tečny jsou stejné, musejí být až na měřítko shodné i gradienty – musejí mířit stejným (anebo přesně opačným) směrem. Existuje tedy nenulová konstanta <math>\lambda</math> tak, že v bodě dotyku (''x'', ''y'') platí
Řádek 90:
neboli
 
: <math>\nabla f - \lambda \cdot \nabla g = 0,</math>
 
kde <math>\nabla f</math> je gradient <math>f</math> v tomto bodě a <math>\nabla g</math> je gradient <math>g</math> tamtéž. Souřadnice gradientů dostaneme jako [[parciální derivace]] příslušných funkcí podle jednotlivých souřadnic, což umožní uvedenou [[vektor]]ovou rovnici rozepsat po souřadnicích:
 
: <math>\left\{\begin{array}{llcc}
Řádek 99:
\end{array}\right.</math>
 
Pokud k těmto dvěma rovnicím připojíme ještě třetí, vazební rovnici ''g''(''x'', ''y'') = 0, dostaneme přesně totéž, co bychom získali parciálním derivováním příslušné Lagrangeovy funkce
 
:<math>\begin{align}
Řádek 107:
podle všech tří jejích argumentů a položením jednotlivých derivací rovných nule.
 
Tato úvaha není důkazem v přísném smyslu, protože se opírá o geometrickou intuici a neřeší různé zvláštní případy (zejména co se stane, když některý z gradientů vymizí – je roven nulovému vektoru). Lze ji však snadno zobecnit na více proměnných a vazeb, a odůvodnit tak obecnou Lagrangeovu metodu.
 
[[Kategorie:Optimalizace (matematika)]]