Kuidas kasutada Lagrange’i kordajaid

Arvutuses kasutatakse Lagrange’i kordajaid tavaliselt piiratud optimeerimisprobleemide korral. Seda tüüpi probleeme saab laialdaselt rakendada ka muudes valdkondades, näiteks majanduses ja füüsikas. Lagrange’i kordaja ülesande põhistruktuur on alljärgnevas seoses: L(x,y;λ)=f(x,y)+λg(x,y){displaystyle {mathcal {L}}( x,y;lambda )=f(x,y)+lambda g(x,y)}kus f(x,y){displaystyle f(x,y)} on optimeeritav funktsioon, g( x,y){displaystyle g(x,y)} on piirang ja λ{displaystyle lambda } on Lagrange’i kordaja. Seejärel määrame tulemuseks oleva võrrandisüsteemi lahendamiseks ∇L=∇f+λ∇g=0{displaystyle nabla {mathcal {L}}=nabla f+lambda nabla g=0} ; sageli soovime protsessi λ{displaystyle lambda } tühistada. Neid probleeme saab hõlpsasti üldistada suuremate mõõtmete ja piirangutega.

1
Leidke x3y{displaystyle x^{3}y} maksimaalne väärtus ellipsil 3×2+y2=6{displaystyle 3x^{2}+y^{2}=6}. See on Lagrange’i kordaja probleem, sest me soovime optimeerida funktsiooni, mille suhtes kehtib piirang. Optimeerimisprobleemides määrame tuletisteks tavaliselt 0 ja jätkame sealt. Kuid antud juhul ei saa me seda teha, kuna x3y{displaystyle x^{3}y} maksimaalne väärtus ei pruugi asuda ellipsil. On selge, et f(x,y)=x3y{displaystyle f(x, y)=x^{3}y} ja g(x,y)=3×2+y2=6.{displaystyle g(x,y)=3x^{2}+y^{2}=6.}

2
Võtke Lagrange’i L{displaystyle {mathcal {L}}} gradient. Kui määrate selle väärtusele 0, saame kahest võrrandist koosneva kolme muutujaga süsteemi.∇f+λ∇g=0{displaystyle nabla f+lambda nabla g=0}{3x2y+λ6x=0x3+Î »2y=0{displaystyle {begin{cases}3x^{2}y+lambda 6x&=0\x^{3}+lambda 2y&=0end{cases}}}

3
Tühistage λ{displaystyle lambda } ja määrake võrrandid üksteisega võrdseks. Kuna me sellega ei tegele, peame selle tühistama. Siin korrutame esimese võrrandi y{displaystyle y}-ga ja teise võrrandi 3x-ga.{displaystyle 3x.}{3x2y2+λ6xy=03×4+λ6xy=0{displaystyle {begin{cases} 3x^{2}y^{2}+lambda 6xy&=0\3x^{4}+lambda 6xy&=0end{cases}}}3x2y2−3×4=0x2(y2−x2)=0{ kuvastiil {begin{aligned}3x^{2}y^{2}-3x^{4}&=0\x^{2}(y^{2}-x^{2})&=0 lõpp{joondatud}}}

4
Seostage x{displaystyle x} ja y{displaystyle y}. Ülaltoodud võrrandis näeme, et kui x≠0, y2−x2=0.{displaystyle xneq 0, y^{2}-x^{2}=0.} See annab meile alloleva seose .y=x{displaystyle y=x}

5
Asendage piiranguvõrrandis avaldis y{displaystyle y} väärtusega x{displaystyle x}. Nüüd, kui oleme selle kasuliku seose tuletanud, saame lõpuks leida väärtused x{displaystyle x} ja y jaoks.{displaystyle y.}g=3×2+x2=6x=y=±32{displaystyle {begin{ joondatud}g&=3x^{2}+x^{2}=6\x&=y=pm {sqrt {frac {3}{2}}}end{joondatud}}}

6
Asendage optimeerimisvõrrandis x{displaystyle x} ja y{displaystyle y} väärtused. Leidsime funktsiooni x3y{displaystyle x^{3}y} maksimaalse väärtuse ellipsil 3×2+y2=6.{displaystyle 3x^{2}+y^{2}=6.}x3y=94 {displaystyle x^{3}y={frac {9}{4}}}

7
Leidke minimaalne kaugus vahemikust x2yz=1{displaystyle x^{2}yz=1} lähtepunktini. Tuletage meelde kaugust kujul x2+y2+z2.{displaystyle {sqrt {x^{2}+y^{2}+z^{2}}}.} See on funktsioon, mida me püüame optimeerida. piirangufunktsioon x2yz−1=0.{displaystyle x^{2}yz-1=0.} Selle avaldise kasutamine on aga mõnevõrra keeruline. Sel juhul saame eemaldada ruutjuure ja optimeerida x2+y2+z2{displaystyle x^{2}+y^{2}+z^{2}}, kuna töötame samas domeenis (ainult positiivsed arvud), nii et numbrid on samad. Peame lihtsalt meeles pidama, et optimeeritav funktsioon on ruutjuurega avaldis.L(x,y,z;λ)=(x2+y2+z2)+λ(x2yz−1){displaystyle { mathcal {L}}(x,y,z;lambda )=(x^{2}+y^{2}+z^{2})+lambda (x^{2}yz-1)}

8
Võtke Lagrangi gradient ja määrake iga komponendi väärtuseks 0.{∂L∂x=2x+λ2xyz=0∂L∂y=2y+λx2z=0∂L∂z=2z+λx2y= 0{displaystyle {begin{cases}{frac {partial {mathcal {L}}}{partial x}}=2x+lambda 2xyz&=0\{frac {partial {mathcal {L }}}{partial y}}=2y+lambda x^{2}z&=0\{frac {partial {mathcal {L}}}{partial z}}=2z+lambda x^{ 2}y&=0end{cases}}}

9
Tühista λ{displaystyle lambda }. Siin korrutage esimene võrrand x-ga, {displaystyle x,} teine ​​võrrand 2y-ga, {displaystyle 2y,} ja kolmas võrrand arvuga 2z.{displaystyle 2z.}{2×2+λ2x2yz=04y2+Î »2x2yz=04z2+λ2x2yz=0{displaystyle {begin{cases}2x^{2}+lambda 2x^{2}yz&=0\4y^{2}+lambda 2x^{2} yz&=0\4z^{2}+lambda 2x^{2}yz&=0end{cases}}}

10
Seostage muutujad üksteisega, lahendades ühe neist. Kasutame y,{displaystyle y,}, kuigi ka x{displaystyle x} ja z{displaystyle z} sobivad hästi.x2=2y2=2z2{displaystyle x^{2}=2y^{2}=2z^ {2}}Ülaltoodud võrrand annab meile kogu teabe, mida vajame vahemaa optimeerimiseks.

11
Hankige y{displaystyle y} väärtus, asendades selle piirangufunktsiooniga. Kuna me teame y=z,{displaystyle y=z,}, saame piirangufunktsiooni kirjutada lihtsalt y{displaystyle y} kujul ja selle lahendada.(2y2)(y)(y)=1y=2− 1/4{displaystyle {begin{aligned}(2y^{2})(y)(y)&=1\y&=2^{-1/4}end{joondatud}}}

12
Asendage y{displaystyle y} väärtus kaugusega. Pidage meeles, et kuigi me optimeerisime kauguse ruutu, otsime siiski tegelikku kaugust.x2+y2+z2=2y2+y2+y2=4y2=2â‹…2−1/4=23/4{ kuvastiil {begin{align}{sqrt {x^{2}+y^{2}+z^{2}}}&={sqrt {2y^{2}+y^{2}+y^ {2}}}\&={sqrt {4y^{2}}}\&=2cdot 2^{-1/4}\&=2^{3/4}end{joondatud }}}