Bariantza

Estatistikan, bariantza datu-multzo batek nahiz probabilitate-banaketa batek duen sakabanatzearen neurri absolutu bat da. Hain zuzen, bariantzaren erro karratu positiboa desbideratze estandarra da, eta azken honek datu bakoitza batezbesteko aritmetiko sinpletik zenbat desbideratzen den adierazten du. Kalkuluaren aldetik, bariantza batezbestekoari buruzko bigarren mailako momentua ere bada. Aldakortasun edo sakabanatze neurri izateaz gainera, bere propietate matematikoak direla eta, maiz agertzen da azterketa estatistikoetan. Esate baterako, aldagai batek duen aldakortasun-maila bariantzaren bitartez neurtzen da eta bariantza oso hau beste aldagai edo faktore zenbaitek eragindako aldakortasun-mailetan zatitu daiteke, aldagai horren kausak hauteman eta kausa horien eragina zehazteko, bariantza-analisian eta karratu txikienen erregresioan egiten den bezala.

Kalkulua datuetarako

Honela adierazi eta kalkulatzen da, datuak x 1 , x 2 , , x n {\displaystyle x_{1},x_{2},\ldots ,x_{n}} izanik:

s X 2 = 1 N i = 1 N ( x i x ¯ ) 2 {\displaystyle s_{X}^{2}={\frac {1}{N}}\sum _{i=1}^{N}(x_{i}-{\overline {x}})^{2}\,}

Aurreko formulari jarraiki, pauso hauek jarraitu behar dira kalkulurako:

  1. batezbesteko aritmetiko sinplea ( x ¯ {\displaystyle {\overline {x}}} ) kalkulatu;
  2. x i x ¯ {\displaystyle x_{i}-{\overline {x}}} , datu bakoitzak batezbestekora duen distantzia alegia, kalkulatu;
  3. batuketa egitean konpentsa ez daitezen, distantzia karratuak kalkulatu;
  4. distantzia karratu horien batezbestekoa kalkulatzen da, zati n datu kopurua eginez.

Laburrago kalkulatzeko formula bat ere badago, aurreko formulatik erator daitekeena:

s X 2 = i = 1 n x i 2 n x ¯ 2 {\displaystyle s_{X}^{2}={\frac {\sum _{i=1}^{n}{x_{i}^{2}}}{n}}-{\overline {x}}^{2}\,}

Desbideratze estandarra bariantzaren erro karratu positiboa da:

s X = 1 N i = 1 N ( x i x ¯ ) 2 = i = 1 n x i 2 n x ¯ 2 {\displaystyle s_{X}={\sqrt {{\frac {1}{N}}\sum _{i=1}^{N}(x_{i}-{\overline {x}})^{2}\,}}={\sqrt {{\frac {\sum _{i=1}^{n}{x_{i}^{2}}}{n}}-{\overline {x}}^{2}}}\,}

Adibidea datu bakanduetarako

Kalkulurako adibide gisa, azterketa batean ikasle zenbaitek jasotako kalifikazio hauek hartuz (puntutan): 6-7-9-5-3.

Jatorrizko formula Formula laburtua
x i {\displaystyle x_{i}\,} ( x i x ¯ ) 2 {\displaystyle (x_{i}-{\overline {x}})^{2}\,}
6 (6-6)2=0
7 (7-6)2=1
9 (9-6)2=9
5 (5-6)2=1
3 (3-6)2=9
30 20
Lehendabizi, batezbesteko aritmetiko sinplea kalkulatzen da:
x ¯ = i x i n = 30 5 = 6 {\displaystyle {\overline {x}}={\frac {\sum _{i}x_{i}}{n}}={\frac {30}{5}}=6}
Jarraian,
s x 2 = i ( x i x ¯ ) 2 n = 20 5 = 4 s X = 4 = 2 {\displaystyle s_{x}^{2}={\frac {\sum _{i}(x_{i}-{\overline {x}})^{2}}{n}}={\frac {20}{5}}=4\rightarrow s_{X}={\sqrt {4}}=2}
Bariantza 4 puntu2 izango da, beraz. Desbidazio estandarra emaitza horren erro karratua da: 2 puntu.
x i {\displaystyle x_{i}\,} x i 2 {\displaystyle x_{i}^{2}\,}
6 62=36
7 72=49
9 92=81
5 52=25
3 32=9
30 200
Lehendabizi, batezbesteko aritmetiko sinplea kalkulatzen da:
x ¯ = i x i n = 30 5 = 6 {\displaystyle {\overline {x}}={\frac {\sum _{i}x_{i}}{n}}={\frac {30}{5}}=6}
Jarraian,
s x 2 = i x i 2 n x ¯ 2 = 200 5 6 2 = 4 s X = 4 = 2 {\displaystyle s_{x}^{2}={\frac {\sum _{i}x_{i}^{2}}{n}}-{\overline {x}}^{2}={\frac {200}{5}}-6^{2}=4\rightarrow s_{X}={\sqrt {4}}=2}
Arestiko emaitza berdinak eskuratzen dira, baina kalkuluak erosoago eginez.

Adibidea maiztasun-tauletatarako

Datuak maiztasun-taula batean bildu direnean, maiztasun-taulatik bertatik egin daiteke kalkulua. Aiseago egiten da formula laburtuarekin, hurrengo adibidean egiten den bezala.

xi(balioak) ni(maiztasunak) nixi nixi2
5 2 10 50
6 3 18 108
8 1 64 64
baturak 6 36 670
s x 2 = i n i ( x i x ¯ ) 2 i n i = i n i x i 2 i n i x ¯ 2 = 222 6 ( 36 6 ) 2 = 1 {\displaystyle s_{x}^{2}={\frac {\sum _{i}n_{i}(x_{i}-{\overline {x}})^{2}}{\sum _{i}n_{i}}}={\frac {\sum _{i}n_{i}x_{i}^{2}}{\sum _{i}n_{i}}}-{\overline {x}}^{2}={\frac {222}{6}}-{\Bigg (}{\frac {36}{6}}{\Bigg )}^{2}=1}

Adibidea tartetan bildutako datuetarako

Datuak tartetan bildu direnean, tarte horietako erdipuntuak hartzen dira kalkuluetarako balio adierazgarri moduan.

Tarteak ni(maiztasunak) xi(balioak) nixi nixi2
0-40 5 20 100 2000
40-80 30 60 1800 108000
80-120 10 100 1000 100000
baturak 45 2900 210000
s x 2 = i n i ( x i x ¯ ) 2 i n i = i n i x i 2 i n i x ¯ 2 = 210000 45 ( 2900 45 ) 2 = 513.63 {\displaystyle s_{x}^{2}={\frac {\sum _{i}n_{i}(x_{i}-{\overline {x}})^{2}}{\sum _{i}n_{i}}}={\frac {\sum _{i}n_{i}x_{i}^{2}}{\sum _{i}n_{i}}}-{\overline {x}}^{2}={\frac {210000}{45}}-{\Bigg (}{\frac {2900}{45}}{\Bigg )}^{2}=513.63}

Tarte bakoitzean hartutako erdipuntuaren hurbilketak dakarren errorea zuzentzeko Shepparden zuzenketa delakoa erabiltzen da, datuak banaketa normalari jarraiki banatzen direnean eta tarte-zabalera konstantea denean soilik aplika daitekeena (b, tarte-zabalera):

s ~ X 2 = s X 2 b 2 12 = 513.63 40 2 12 = 380.3 {\displaystyle {\tilde {s}}_{X}^{2}=s_{X}^{2}-{\frac {b^{2}}{12}}=513.63-{\frac {40^{2}}{12}}=380.3}

Kalkulua probabilitate banakuntzetarako

Honela definitzen da, μ = E [ X ] {\displaystyle \mu =E[X]} izanik itxaropen matematikoa:

var [ X ] = σ X 2 = E [ ( X μ ) 2 ] {\displaystyle \operatorname {var} [X]=\sigma _{X}^{2}=E[(X-\mu )^{2}]}

Banakuntza jarraitua bada, honela kalkulatzen da, integralak X aldagaiaren balioen Ω ( X ) {\displaystyle \Omega (X)} eremuan ebaluatu behar direlarik:

var [ X ] = σ X 2 = Ω ( X ) ( x μ ) 2 p ( x ) d x {\displaystyle \operatorname {var} [X]=\sigma _{X}^{2}=\int _{\Omega (X)}(x-\mu )^{2}\,p(x)\,dx\,} , non μ = Ω ( X ) x p ( x ) d x {\displaystyle \mu =\int _{\Omega (X)}x\,p(x)\,dx}

Banakuntza diskretua bada, x i , p ( x i ) {\displaystyle x_{i},p(x_{i})} aldagaiaren balio eta beren probabilitateak izanik:

var ( X ) = σ X 2 = i p i ( x i μ ) 2 {\displaystyle \operatorname {var} (X)=\sigma _{X}^{2}=\sum _{i}p_{i}(x_{i}-\mu )^{2}\,} , non μ = i x i p ( x i ) {\displaystyle \mu =\sum _{i}x_{i}\,p(x_{i})\,}

Definizioaren formula garatuz, jatorriari buruzko momentuetan oinarritutako adierazpen batera heltzen da, kalkulurako erosoagoa dena:

var [ X ] = σ X 2 = E [ ( X μ ) 2 ] = E [ X 2 ] μ 2 = E [ X 2 ] E [ X ] 2 {\displaystyle \operatorname {var} [X]=\sigma _{X}^{2}=E[(X-\mu )^{2}]=E[X^{2}]-\mu ^{2}=E[X^{2}]-E[X]^{2}}


Banakuntza diskretu baterako adibidea

0 eta 1 balioak 0.4 eta 0.6 probabilitateaz hartzen dituen probabilitate-banaketaren bariantza kalkulatu behar da.

Jatorrizko formula Formula laburtua
x i {\displaystyle x_{i}\,} p ( x i ) {\displaystyle p(x_{i})\,} x i p ( x i ) {\displaystyle x_{i}p(x_{i})\,} ( x i μ ) 2 p ( x i ) {\displaystyle (x_{i}-\mu )^{2}p(x_{i})\,}
0 0.4 0 0.144
1 0.6 0.6 0.096
baturak 1 μ = 0.6 {\displaystyle \mu =0.6\,} σ 2 = 0.24 {\displaystyle \sigma ^{2}=0.24\,}
Lehendabizi, itxaropen matematikoa kalkulatzen da, hirugarren zutabean egiten den bezala.
Jarraian, bariantza kalkulatzeko, bere formula aplikatzen da zuzenean laugarren zutabean.
x i {\displaystyle x_{i}\,} p ( x i ) {\displaystyle p(x_{i})\,} x i p ( x i ) {\displaystyle x_{i}p(x_{i})\,} x i 2 p ( x i ) {\displaystyle x_{i}^{2}p(x_{i})\,}
0 0.4 0 0
1 0.6 0.6 0.6
baturak 1 μ = 0.6 {\displaystyle \mu =0.6\,} E [ X 2 ] = 0.6 {\displaystyle E[X^{2}]=0.6\,}
Itxaropen matematikoa hirugarren zutabean kalkulatzen da.
Jarraian, laugarren zutabean, E [ X 2 ] {\displaystyle E[X^{2}]\,} kalkulatzen da.
σ 2 = E [ X 2 ] E [ X ] 2 = 0.6 0.6 2 = 0.24 {\displaystyle \sigma ^{2}=E[X^{2}]-E[X]^{2}=0.6-0.6^{2}=0.24}

Banakuntza jarraitu baterako adibidea

f X ( x ) = 2 x ;   0 < x < 1 {\displaystyle f_{X}(x)=2x;\ 0<x<1\,} banaketaren bariantza kalkulatu behar da,

Jatorrizko formula Formula laburtua
Lehendabizi, itxaropen matematikoa kalkulatzen da:
μ = E [ X ] = Ω x f ( x ) d x = 0 1 x 2 x d x = 0.66 {\displaystyle \mu =E[X]=\int _{\Omega }xf(x)dx=\int _{0}^{1}x2xdx=0.66}
Jarraian, bariantza kalkulatzeko:
σ 2 = Ω ( x μ ) 2 f ( x ) d x = 0 1 ( x 0.66 ) 2 2 x d x = 0.055 {\displaystyle \sigma ^{2}=\int _{\Omega }(x-\mu )^{2}f(x)dx=\int _{0}^{1}(x-0.66)^{2}\cdot 2xdx=0.055}
Lehendabizi, itxaropen matematikoa kalkulatzen da:
μ = E [ X ] = Ω x f ( x ) d x = 0 1 x 2 x d x = 0.666 {\displaystyle \mu =E[X]=\int _{\Omega }xf(x)dx=\int _{0}^{1}x2xdx=0.666}
Jarraian, E [ X 2 ] {\displaystyle E[X^{2}]\,} kalkulatzen da:
E [ X 2 ] = Ω ( x ) 2 f ( x ) d x = 0 1 x 2 2 x d x = 0.5 {\displaystyle E[X^{2}]=\int _{\Omega }(x)^{2}f(x)dx=\int _{0}^{1}x^{2}\cdot 2xdx=0.5}
Azkenik, bariantza honela kalkulatzen da
σ 2 = E [ X 2 ] E [ X ] 2 = 0.5 0.666 2 = 0.055 {\displaystyle \sigma ^{2}=E[X^{2}]-E[X]^{2}=0.5-0.666^{2}=0.055}

Bariantzaren propietateak

Bariantza beti da ez-negatiboa

Bariantza ez da inongo kasutan negatiboa. 0 balioa ere har dezake, datu guztiak berdinak direnean nahiz 1 probabilitatea duen konstante baten kasuan.

Bigarren mailako momentu txikiena

Bariantza bigarren mailako momentu txikiena da:

  • datuetarako, i ( x i k ) 2 n {\displaystyle {\frac {\sum _{i}(x_{i}-k)^{2}}{n}}} adierazpena minimotzen duen k {\displaystyle k\,} balioa x ¯ {\displaystyle {\overline {x}}} da;
  • probabilitate banakuntzetarako, E [ ( X k ) 2 ] {\displaystyle E[(X-k)^{2}]} minimiotzen duen k {\displaystyle k\,} balioa μ {\displaystyle \mu } da.

Aldagai-aldaketa lineala

  • Y = a + b X {\displaystyle Y=a+bX\,} aldagai-aldaketa lineala egiten bada, a ,   b {\displaystyle a,\ b\,} konstanteak izanik,
    • datuen bariantzari buruz, s Y 2 = b 2 s X 2 {\displaystyle s_{Y}^{2}=b^{2}s_{X}^{2}} ,
    • probabilitate-banakuntzen bariantzari buruz, v a r [ Y ] = b 2 v a r [ X ] {\displaystyle var[Y]=b^{2}var[X]}

Hau da, datu guztiei (edo zorizko aldagaiari) konstante bat gehitu edo kentzeagatik, bariantzaren emaitza ez da aldatzen, baina konstante batez bidertzean, bariantza bider konstante hori karratura bidertzen da.

Aldagaien baturaren bariantza

X 1 , X 2 , , X n {\displaystyle X_{1},X_{2},\ldots ,X_{n}} aldagaiak elkarrekiko independenteak badira:

v a r [ X 1 + X 2 + + X n ] = v a r [ X 1 ] + v a r [ X 2 ] + + v a r [ X n ] {\displaystyle var[X_{1}+X_{2}+\cdots +X_{n}]=var[X_{1}]+var[X_{2}]+\cdots +var[Xn]}

Aurreko berdintza aldagaiak elkarrekiko korrelazio linealik gabeak direnean ere betetzen da.

Oro har, independenteak ez badira, bariantzak eta aldagai-bikote guztien kobariantzak gehitu behar dira[1]:

v a r [ X 1 + X 2 + + X n ] = i v a r [ X i ] + i j i c o v [ X i , X j ] = i v a r [ X i ] + 2 i j > i c o v [ X i , X j ] {\displaystyle var[X_{1}+X_{2}+\cdots +X_{n}]=\sum _{i}var[X_{i}]+\sum _{i}\sum _{j\neq i}cov[X_{i},X_{j}]=\sum _{i}var[X_{i}]+2\sum _{i}\sum _{j>i}cov[X_{i},X_{j}]}

Bi aldagaien kasurako, esate baterako:

v a r [ X 1 + X 2 ] = v a r [ X 1 ] + v a r [ X 2 ] + 2 c o v [ X 1 , X 2 ] {\displaystyle var[X_{1}+X_{2}]=var[X_{1}]+var[X_{2}]+2cov[X_{1},X_{2}]}

Bariantza bi aldagai berdinen arteko kobariantza da

Bariantza kobariantza berezi bat besterik ez da, non kobariantzan parte hartzen duten bi aldagaiak berdinak diren:

v a r [ X ] = c o v [ X , X ] {\displaystyle var[X]=cov[X,X]}

Erreferentziak

  1. (Ingelesez) Feldman, Richard M.; Valdez Flores, Ciriaco. (2010). Applied Probability and Stochastic Processes. Springer, 32 or...

Kanpo lotutak

  • Bariantza, Gizapedian.
Wikiztegian orri bat dago honi buruz: bariantza .

Kanpo estekak

Autoritate kontrola
  • Wikimedia proiektuak
  • Wd Datuak: Q175199
  • Commonscat Multimedia: Variance / Q175199

  • Identifikadoreak
  • GND: 4078739-4
  • NDL: 00561029
  • Hiztegiak eta entziklopediak
  • Britannica: url
  • Wd Datuak: Q175199
  • Commonscat Multimedia: Variance / Q175199