Gradientti

Esimerkkinä kahden muuttujan funktion f ( x , y ) = x e x 2 + y 2 {\displaystyle f(x,y)={\frac {x}{e^{x^{2}+y^{2}}}}} gradientti ilmaistuna vektorikenttänä. Väri kuvaa funktion arvoa (isot punaisella, pienet sinisellä) ja vektorit gradienttia kussakin pisteessä.

Gradientti on matemaattinen differentiaalioperaattori, joka on määritelty usean muuttujan skalaarifunktioille f : R n R {\displaystyle f:\mathbb {R} ^{n}\rightarrow \mathbb {R} } . Gradientti ilmaisee funktion suurimman muutosnopeuden (gradienttivektorin pituus) ja tämän suurimman muutoksen suunnan. Funktio kasvaa voimakkaimmin gradientin suuntaan ja vähenee voimakkaimmin negatiivisen gradientin suuntaan.[1]

Karteesisessa koordinaatistossa gradientti on vektori, jonka komponentteina ovat funktion osittaisderivaatat. Esimerkiksi kolmen muuttujan funktion gradientti merkitään g r a d ( f ) {\displaystyle grad(f)} tai symbolin nabla avulla f {\displaystyle \nabla f} ja määritellään

f ( x , y , z ) = x f ( x , y , z ) i + y f ( x , y , z ) j + z f ( x , y , z ) k {\displaystyle \nabla f(x,y,z)={\frac {\partial }{\partial x}}f(x,y,z){\vec {i}}+{\frac {\partial }{\partial y}}f(x,y,z){\vec {j}}+{\frac {\partial }{\partial z}}f(x,y,z){\vec {k}}} ,

missä i , j {\displaystyle {\vec {i}},{\vec {j}}} ja k {\displaystyle {\vec {k}}} -komponenttien kertoimet ovat funktion osittaisderivaattoja muuttujien x , y {\displaystyle x,y} ja z {\displaystyle z} suhteen. Yleisen n {\displaystyle n} muuttujan funktion gradientti määritellään

f ( x ) = [ f x 1 ( x ) , f x 2 ( x ) , , f x n ( x ) ] T {\displaystyle \nabla f(\mathbf {x} )={\begin{bmatrix}{\frac {\partial f}{\partial x_{1}}}(\mathbf {x} ),&{\frac {\partial f}{\partial x_{2}}}(\mathbf {x} ),&\cdots &,{\frac {\partial f}{\partial x_{n}}}(\mathbf {x} )\end{bmatrix}}^{T}} ,

missä x {\displaystyle \mathbf {x} } on funktion muuttujien muodostama vektori

x = [ x 1 , x 2 , , x n ] T {\displaystyle \mathbf {x} ={\begin{bmatrix}x_{1},&x_{2},&\cdots ,&x_{n}\end{bmatrix}}^{T}} .

Gradienttia voidaan pitää derivaatan yleistyksenä usean muuttujan funktioille. Gradientti on erikoistapaus Jacobin matriisista, joka on määritelty monen muuttujan vektoriarvoisille funktioille f : R n R p {\displaystyle \mathbf {f} :\mathbb {R} ^{n}\rightarrow \mathbb {R} ^{p}} .

Määritelmiä ja laskusääntöjä

Differentiaali

Yhden muuttujan tapauksessa funktion differentiaali määriteltiin

Δ f ( x ) = f ( x ) Δ x {\displaystyle \Delta f(x)=f'(x)\Delta x\;} ,

ja yleisesti funktion differentiaali määritellään gradientin avulla

Δ f ( x ) = f Δ x {\displaystyle \Delta f(\mathbf {x} )=\nabla f\cdot \Delta \mathbf {x} } ,

missä piste kuvaa kahden vektorin pistetuloa.

Suunnattu derivaatta

Gradientin avulla voidaan määrittää helposti myös suunnattu derivaatta: Funktion suunnattu derivaatta vektorin e {\displaystyle {\vec {e}}} suuntaan on

e f ( x ) = f ( x ) e 0 {\displaystyle \partial _{\vec {e}}f(\mathbf {x} )=\nabla f(\mathbf {x} )\cdot {\vec {e}}_{0}} ,

missä e 0 {\displaystyle {\vec {e}}_{0}\;} on e {\displaystyle {\vec {e}}\;} :n suuntainen yksikkövektori (vektori, jonka pituus on yksi). Pistetulo on suurin, kun lasketaan suunnattua derivaattaa gradientin suuntaan ja pienin, kun lasketaan suunnattua derivaattaa negatiivisen gradientin suuntaan.[2]

Ketjusääntö

Mikäli funktion muuttujat riippuvat esimerkiksi parametrista t, eli

x = [ x 1 ( t ) , x 2 ( t ) , , x n ( t ) ] T {\displaystyle \mathbf {x} ={\begin{bmatrix}x_{1}(t),&x_{2}(t),&\cdots ,&x_{n}(t)\end{bmatrix}}^{T}} ,

saadaan funktion derivaatta parametrin suhteen gradientin avulla lausekkeesta

d f ( x ( t ) ) d t = f ( x ) x ( t ) {\displaystyle {\frac {df(\mathbf {x} (t))}{dt}}=\nabla f(\mathbf {x} )\cdot \mathbf {x} '(t)} ,

missä siis

x ( t ) = [ x 1 ( t ) , x 2 ( t ) , , x n ( t ) ] T {\displaystyle \mathbf {x} '(t)={\begin{bmatrix}x_{1}'(t),&x_{2}'(t),&\cdots ,&x_{n}'(t)\end{bmatrix}}^{T}} .

Tämä tunnetaan niin sanottuna ketjusääntönä.

Gradientti käyräviivaisissa koordinaatistoissa

Napakoordinaatistossa annetulle funktiolle gradientti on

f ( r , ϕ ) = e r f r + e ϕ 1 r f ϕ {\displaystyle \nabla f(r,\phi )={\vec {e}}_{r}{\frac {\partial f}{\partial r}}+{\vec {e}}_{\phi }{\frac {1}{r}}{\frac {\partial f}{\partial \phi }}} ,

sylinterikoordinaatistossa

f ( r , ϕ , z ) = e r f r + e ϕ 1 r f ϕ + e z f z {\displaystyle \nabla f(r,\phi ,z)={\vec {e}}_{r}{\frac {\partial f}{\partial r}}+{\vec {e}}_{\phi }{\frac {1}{r}}{\frac {\partial f}{\partial \phi }}+{\vec {e}}_{z}{\frac {\partial f}{\partial z}}}

sekä pallokoordinaatistossa

f ( r , θ , ϕ ) = e r f r + e θ 1 r f θ + e ϕ 1 r sin θ f ϕ {\displaystyle \nabla f(r,\theta ,\phi )={\vec {e}}_{r}{\frac {\partial f}{\partial r}}+{\vec {e}}_{\theta }{\frac {1}{r}}{\frac {\partial f}{\partial \theta }}+{\vec {e}}_{\phi }{\frac {1}{r\sin \theta }}{\frac {\partial f}{\partial \phi }}} .

Huomaa, että viimeinen laskusääntö on pätevä pallokoordinaatistossa, jossa muunnoskaavat ovat { x = r sin θ cos ϕ y = r sin θ sin ϕ z = r cos θ {\displaystyle {\begin{cases}x=r\sin \theta \cos \phi \\y=r\sin \theta \sin \phi \\z=r\cos \theta \end{cases}}}

Katso myös

  • Derivaatta
  • Roottori
  • Divergenssi

Lähteet

  1. Adams, Robert A.: ”12.7 Gradients and Directional Derivatives”, Calculus: A Complete Course, s. 680. Pearson: Addison Wesley, 6. painos.
  2. Adams, Robert A.: ”12.7 Gradients and Directional Derivatives”, Calculus: A Complete Course, s. 681. Pearson: Addison Wesley, 6. painos.

Kirjallisuutta

  • Pitkäranta, Juhani: Calculus Fennicus – TKK:n 1. lukuvuoden laaja matematiikka (2000–2013) (pdf) Helsinki: Avoimet oppimateriaalit ry. ISBN 978-952-7010-12-9 ISBN 978-952-7010-6 (pdf).

Aiheesta muualla

  • Weisstein, Eric W.: Gradient MathWorld. (englanniksi)
  • "Gradient 1" (Arkistoitu – Internet Archive) – Khan Academy (englanniksi)