Implicitfüggvény-tétel

Az implicitfüggvény-tétel a matematikai analízis, közelebbről a differenciálelmélet leghatékonyabban alkalmazható tétele olyan feladatokra, amikor egy adott nemlineáris egyenletrendszer megoldásait próbálják megkeresni. Legegyszerűbb esetben arról van szó, hogy egy síkbeli görbe egyenletéből kifejezhető-e az y változó az x segítségével, és ezzel megadható-e a görbe egy szakasza függvénygrafikonként.

Bevezetés

Implicit megadású függvényről akkor beszélünk, amikor egy függvény megadása nem (az explicit módon) y = f(x) alakban történik, hanem az x és y kapcsolatát egy mindkét változót tartalmazó

F ( x , y ) = 0 {\displaystyle F(x,y)=0\,}

egyenlet írja le. A fogalom Cauchytól származik (1823).[1]

Például adjunk meg olyan függvényt, melynek grafikonja valamely kör egy szakasza. Az

x 2 + y 2 = 1 {\displaystyle x^{2}+y^{2}=1\,}

egyenletű körből könnyű az y változót kifejezni, az y = 1 x 2 {\displaystyle y={\sqrt {1-x^{2}}}} és y = 1 x 2 {\displaystyle y=-{\sqrt {1-x^{2}}}} alakokat kapjuk. Bonyolultabb esetekben, például a

e x y + a r c t g y 4 sin y = x {\displaystyle e^{x^{y}}+\mathrm {arctg} \,y^{4}-\sin y=x\,}

esetén semmi reményünk, hogy az y változóra valamilyen egyenletrendezéssel általános képletet kapjunk. Az ilyen példák miatt nevezik ezeket a típusú függvényeket implicit, avagy régi, választékos kifejezéssel élve bennrekedt függvényeknek. A differenciálszámítás szempontjából megelégedhetünk azzal, ha az implicit függvény deriváltját ki tudjuk számolni. Sok esetben ebből már következtethetünk a függvényre vagy annak viselkedésére is.

A modern analízis szemszögéből egy N × M {\displaystyle \rightarrow } K normált terek között ható F függvény aN és bM pontokhoz tartozó implicit függvényén olyan, az a egy U környezetén értelmezett és a b egy V környezetébe képező f:U {\displaystyle \rightarrow } V függvényt értünk, melyre f(a)=b és minden xU pont esetén rendelkezik az

F ( x , f ( x ) ) = 0 {\displaystyle F(x,f(x))=0\,}

tulajdonsággal. Amelyet szavakban úgy fogalmazhatunk meg, hogy az F(x,y)=0 egyenletből az y változó kifejezhető y=f(x) alakban.

Tágabb értelemben egy F : H × K {\displaystyle \rightarrow } L kétváltozós halmazelméleti függvény (a,b) ∈ H × K párhoz tartozó implicit függvénye olyan f, a H egy részhalmazán értelmezett, K-ba képező függvény, mely a-ban értelmezve van, f(a)=b és minden az értelmezési tartományába tartozó x pontra: F(x,f(x))=F(a,b).

Az egyváltozós eset

TételImplicitfüggvény-tétel R-beli implicit függvényre – Legyen F az R2 egy részhalmazán értelmezett, R-be képező függvény, mely az értelmezési tartománya egy (a,b) belső pontjában erősen differenciálható, F(a,b) = 0 és

2 F ( a , b ) 0 {\displaystyle \partial _{2}F(a,b)\neq 0}

(azaz (a,b)-ben az y szerinti parciális deriváltja nem nulla). Ekkor van a-nak olyan I {\displaystyle I} és b-nek olyan J {\displaystyle J} környezete, hogy F-nek egyértelműen létezik az (a,b) párhoz tartozó f: I {\displaystyle I} {\displaystyle \rightarrow } J {\displaystyle J} implicit függvénye, mely erősen differenciálható a-ban és deriváltja:

f ( a ) = 1 F ( a , b ) 2 F ( a , b ) {\displaystyle f'(a)=-{\frac {\partial _{1}F(a,b)}{\partial _{2}F(a,b)}}}

Bizonyítás. A (a,b)-beli erős differenciálhatóságból következik, hogy F folytonosan differenciálható (a,b)-ben. Választhatunk tehát olyan I {\displaystyle I} és J nyílt intervallumokat, a és b körül, hogy I {\displaystyle I} × J-n ∂2F sehol sem nulla, azonos előjelű. Feltehetjük, hogy ∂2F pozitív. Vegyük észre, hogy az implicit függvény létezése egyenértékű azzal, hogy minden x I {\displaystyle I} -re az F( x , . ) parciális függvénynek zérushelye van J-ban, hiszen ekkor minden x-hez létezik olyan y ∈ J, hogy F(x,y)=0. Belátjuk, hogy minden ilyen x-hez egyetlen zérushelye van F( x , . )-nek.

Az F kétváltozós függvény (a,b)-beli érintősíkja és az xy sík metszete közel egybeesik az implicit függvény görbéjével. Az érintősíknak ebből a felülethez simuló tulajdonságából vezethető le az implicitfüggvény-tétel. Egy esetben nem állíthatjuk általánosan, hogy létezik ilyen függvény, ha a síkok metszésvonala párhuzamos az y tengellyel. Ekkor nem feltétlenül létezik az y=f(x) implicit függvény, vagy legalábbi is biztosan nem differenciálható.

Tekintsük a folytonos F( a , . ) parciális függvényt. Az erős differenciálhatóságból és a pozitívra választott deriváltból következik, hogy ez I {\displaystyle I} -n szigorúan monoton növekvő. Mivel b-ben zérushelye van ( F(a,b)=0 ), ezért van olyan y 2 {\displaystyle y_{2}} > b pont, hogy ott F( a , . ) pozitív és y 1 {\displaystyle y_{1}} < b pont, hogy ott F( a , . ) negatív. Ekkor F folytonossága miatt van az (a, y 1 {\displaystyle y_{1}} ) pontnak olyan környezete, ahol F negatív és van az (a, y 2 {\displaystyle y_{2}} ) pontnak olyan környezete, ahol F pozitív. Most definiáljuk át I {\displaystyle I} -t és J-t úgy, hogy I {\displaystyle I} × J-n az F egy J-beli elem fölött mindenhol pozitív, egy J-beli elem alatt mindenhol negatív értéket vegyen föl.

Az erős differenciálhatóságból az is következik, hogy minden x ∈ I {\displaystyle I} -re az F( x , . ) függvény is szigorúan monoton növekvő, negatív és pozitív értéket is felvevő folytonos függvény, így a Bolzano-tétel alapján létezik y x {\displaystyle y_{x}} zérushelye és mindegyiknek egyetlen zérushelye létezik. Állítjuk, hogy a φ: I {\displaystyle I} {\displaystyle \rightarrow } J, x {\displaystyle \mapsto } y x {\displaystyle y_{x}} függvény implicit függvénye F-nek, azaz minden x ∈ I {\displaystyle I} -re F(x,φ(x))=0.

Könnyen belátható, hogy φ folytonos a-ban, hiszen ha a-hoz közeledve mindig találnánk olyan x pontot, hogy φ(x) egy adott ε-nál mindig jobban eltér b-től, akkor φ(x) egy olyan környezetbe esne bele, ahol F mindenhol egy pozitív számnál nagyobb vagy mindenhol egy negatív számnál kisebb. Ám, F(x,φ(x))=0, így ez ellentmondana F folytonos tulajdonságának.

φ erősen differenciálható (a,b)-ben, hiszen tetszőleges x 1 {\displaystyle x_{1}} , x 2 {\displaystyle x_{2}} I {\displaystyle I} -re az F erős differenciálhatósága miatt fennáll

0 = F ( x 1 , φ ( x 1 ) ) F ( x 2 , φ ( x 2 ) ) = {\displaystyle 0=F(x_{1},\varphi (x_{1}))-F(x_{2},\varphi (x_{2}))=}
= 1 F ( a , b ) ( x 2 x 1 ) + 2 F ( a , b ) ( φ ( x 2 ) φ ( x 1 ) ) + {\displaystyle =\partial _{1}F(a,b)(x_{2}-x_{1})+\partial _{2}F(a,b)(\varphi (x_{2})-\varphi (x_{1}))+}
+ ε ( x 2 x 1 ) + η ( φ ( x 2 ) φ ( x 1 ) ) {\displaystyle +\varepsilon \cdot (x_{2}-x_{1})+\eta \cdot (\varphi (x_{2})-\varphi (x_{1}))}

azaz (a pozitív ∂2F(a,b) miatt pozitívra választható ∂2F(a,b)+η miatt):

φ ( x 2 ) φ ( x 1 ) x 2 x 1 = 1 F ( a , b ) + ε 2 F ( a , b ) + η {\displaystyle {\frac {\varphi (x_{2})-\varphi (x_{1})}{x_{2}-x_{1}}}=-{\frac {\partial _{1}F(a,b)+\varepsilon }{\partial _{2}F(a,b)+\eta }}}

és innen ( x 1 {\displaystyle x_{1}} , x 2 {\displaystyle x_{2}} ) {\displaystyle \to } (a,a) határátmenetet véve, a másodendű tagok eltűnését követően kapjuk az állítás eredményét.

Felhívjuk a figyelmet arra, hogy az implicit függvény értékére fennáll ugyan a

φ ( x ) = φ ( a ) 1 F ( a , b ) + ε 2 F ( a , b ) + η ( x a ) {\displaystyle \varphi (x)=\varphi (a)-{\frac {\partial _{1}F(a,b)+\varepsilon }{\partial _{2}F(a,b)+\eta }}(x-a)}

egyenlőség, de mivel ε és η ki nem írt argumentumaiban szerepel φ(x), ezért ez sem egy explicit alak.

Kapcsolat az inverzfüggvény-tétellel

Vegyük észre, hogy mivel mindegyik F( x , . ) parciális függvény szigorúan monoton, így az (x,y) {\displaystyle \mapsto } (x, F(x,y)) függvény is injektív. Érdemes tehát az inverzét felírni, az (x,z) {\displaystyle \mapsto } (x,y) függvényt. Mivel minden egyes x és z pontra egyetlen y van, hogy F(x,y)=z, ezért z=0 esetén is minden x-hez egyetlen y van, hogy F(x,y)=0, mely az F implicit függvényét szolgáltatja. Ennek a függvénynek a szükséges differenciálhatósági tulajdonságainak bizonyításához hatékonyan használhatjuk fel az inverzfüggvény-tételt. Nem véletlen a kapcsolat a két tétel között. Az előző bizonyítást és a többváltozós eset bizonyítását is végezhetjük az inverzfüggvény-tétellel, sőt az utóbbi esetben csak ezzel. Másrészt az is igaz, hogy a két tétel állítása ekvivalens egymással.

Példák

Tekintsük a következő egyenletű síkgörbét:

x 5 + x y + y 5 = 3 {\displaystyle x^{5}+xy+y^{5}=3\,}

Nem lenne könnyű feladat kifejezni belőle y-t, mert az ötödfokú egyenletnek nincs általános megoldóképlete. Mivel a bal oldal akárhányszor differenciálható, ezért joggal feltételezhetjük, hogy bizonyos pontokban létezik implicit függvénye. Tegyük fel, hogy φ ilyen függvény. Ekkor az egyenlet

x 5 + x φ ( x ) + ( φ ( x ) ) 5 = 3 {\displaystyle x^{5}+x\varphi (x)+(\varphi (x))^{5}=3}

alakú, melynek minden olyan x-nél, ahol φ differenciálható:

5 x 4 + φ ( x ) + x φ ( x ) + 5 φ 4 ( x ) φ ( x ) = 0 {\displaystyle 5x^{4}+\varphi (x)+x\varphi '(x)+5\varphi ^{4}(x)\cdot \varphi '(x)=0}

ahonnan a derivált: φ ( x ) = 5 x 4 + φ ( x ) 5 φ 4 ( x ) + x {\displaystyle \varphi '(x)=-{\frac {5x^{4}+\varphi (x)}{5\varphi ^{4}(x)+x}}} vagy szimbolikusan: y = 5 x 4 + y 5 y 4 + x {\displaystyle y'=-{\frac {5x^{4}+y}{5y^{4}+x}}} . Alaposabb vizsgálatokkal kideríthető, hogy ez a derivált minden pontban létezik és negatív, így az implicit függvény mindenhol létezik és szigorúan monoton csökkenő. Vegyük észre, hogy a nevezőben lévő kifejezés pont ∂yF(x,y) és az implicit függvény létezésének feltétele pont a nevező nullától különböző volta.

Többváltozós eset

Ebben az esetben is az „érintősík” végtelenül közelítő tulajdonsága játszik majd fontos szerepet. Jól látható az összefüggés, ha feltesszük, hogy F egy Rn×Rm-en értelmezett affin függvény, azaz egy lineáris leképezés eltoltja. Ekkor

F(x,y) = F(a+h,b+k) = F(a,b)+dF1(a,b)h+dF2(a,b)k.

Amennyiben y = y(x) olyan, hogy y(a) = b és F(x,y(x)) = 0, akkor fennáll a 0 = dF1(a,b)h + dF2(a,b)k egyenlőség és k kifejezhető, amennyiben az A = dF2(a,b) mátrix invertálható. A B = dF1(a,b) jelöléssel ekkor

k = -(A-1 {\displaystyle \cdot } B) h.

Általános esetben ez csak egy másodrendűen kicsiny tag hozzávételével lesz igaz, de az implicit függvény létezésének belátásához szükséges a fenti gondolatmenet is.

Banach-terek esetén (melyek akár végtelen dimenziósak is lehetnek) a tétel a következő.

TételImplicitfüggvény-tétel Banach-terekre – Legyen E, H, G Banach-terek, F:E × H {\displaystyle \rightarrow } G olyan függvény, mely (a,b) ∈ E × H-ban erősen differenciálható. Ha a ∂2F(a,b) lineáris leképezés injektív és az inverzével együtt folytonos, akkor egyértelműen létezik az F-nek egy az (a,b) párhoz tartozó f lokális implicit függvénye, ez erősen differenciálható a-ban és differenciálja:

d f ( a ) = ( 2 F ( a , b ) ) 1 ( 1 F ( a , b ) ) {\displaystyle df(a)=-(\partial _{2}F(a,b))^{-1}\circ (\partial _{1}F(a,b))}

Vagy egy kevésbé absztrakt tétel:

TételImplicitfüggvény-tétel Rn-re – Legyen F:Rn×Rm {\displaystyle \rightarrow } Rm folytonosan differenciálható függvény, (a,b) ∈ Rn×Rmolyanok, hogy F(a,b)=0 és det ( F i ( a , b ) y k ) i , k = 1 , . . . , m 0 {\displaystyle \det \left({\frac {\partial F_{i}(a,b)}{\partial y_{k}}}\right)_{i,k=1,...,m}\neq 0} . Ekkor egyértelműen létezik F-nek egy az (a,b)-hez tartozó lokális implicit függvénye.

Hivatkozások

Jegyzetek

  1. Szőkefalvi-Nagy Béla: Valós függvények és függvénysorok, Tankönyvkiadó, Budapest, 1972; Előszó, 14. o.

Források

  • A PlanetMath Implicit function theorem szócikke Archiválva 2006. július 2-i dátummal a Wayback Machine-ben
  • Matematika Matematikaportál • összefoglaló, színes tartalomajánló lap