Kā aprēķināt korelācijas koeficientu


Statistical Programming with R by Connor Harris (Jūnijs 2019).

Anonim

Pēc definīcijas korelācijas koeficients (normalizēts korelācijas moments) ir divu nejaušo mainīgo (CER) sistēmas korelācijas momenta attiecība pret maksimālo vērtību. Lai saprastu šī jautājuma būtību, vispirms ir nepieciešams iepazīties ar korelācijas momenta jēdzienu.

Jums būs nepieciešams

  • - papīrs;
  • - pildspalva.

Instrukcija

1

Definīcija: CER X un Y korelācijas moments ir otrās kārtas centrālais centrālais moments (sk. 1. att.).
Šeit W (x, y) ir CER kopējais varbūtības blīvums
Korelācijas moments ir raksturīgs: a) CER vērtību savstarpēja izplatība attiecībā pret vidējo vērtību vai matemātisko cerību punktu (mx, my); b) lineārā savienojuma pakāpe starp CB X un Y.

2

Korelācijas momenta īpašības.
1. R (xy) = R (yx) - no definīcijas.
2. Rxx = Dx (dispersijas) - no definīcijas.
3. Neatkarīgiem X un YR (xy) = 0.
Patiešām, šajā gadījumā M {Hc, Yc} = M {Hc} M {Yc} = 0. Šajā gadījumā tas ir lineārā savienojuma trūkums, bet ne jebkurš, bet, teiksim, kvadrātiskais savienojums.
4. Ja ir "stingrs lineārs savienojums starp X un Y, Y = aX + b - | R (xy) | = bxby = max.
5. –Bhbyy≤R (xy) ≤bhby.

3

Tagad atgriezīsimies pie korelācijas koeficienta r ​​(xy), kura nozīme ir lineārā saikne starp CB. Tās vērtība svārstās no -1 līdz 1, turklāt tai nav dimensijas. Saskaņā ar iepriekš minēto mēs varam pierakstīt:
R (xy) = R (xy) / bhby (1)

4

Lai noskaidrotu normalizētās korelācijas momenta nozīmi, iedomājieties, ka eksperimentāli iegūtās CB X un Y vērtības ir plaknes koordinātas. "Cietā" lineārā savienojuma klātbūtnē šie punkti precīzi atradīsies uz taisnās līnijas Y = aX + b. Veikt tikai pozitīvas korelācijas vērtības (ar a

5

Kad r (xy) = 0, visi iegūtie punkti būs iekšā elipse ar centru pie (mx, mans), kuru pusassu lielumu nosaka dispersijas CB vērtības
Šajā brīdī šķiet, ka r (xy) aprēķināšanas jautājumu var uzskatīt par izsmeltu (sk. 1. formulu). Problēma ir tā, ka pētnieks, kurš eksperimentāli ieguva CB vērtības, nevar zināt 100% varbūtības blīvumu W (x, y). Tāpēc ir labāk pieņemt, ka izlases problēma tiek ņemta vērā konkrētajai problēmai (ti, iegūta eksperimentā) un izmantot nepieciešamo daudzumu aplēses. Tad rezultāts
mx * = (1 / n) (x1 + x2 +.

+ xn) (CB Y ir tas pats). Dx * = (1 / (n-1)) ((x1 - mx *) ^ 2+ (x2 - mx *) ^ 2+.


+ (xn- mx *) ^ 2). R * x = (1 / (n-1)) ((x1 - mx *) (y1 - mans *) + (x2 - mx *) (y2 - mans *) +.

+ (xn-mx *) (yn- *)). bx * = sqrtDx (tas pats CB Y).
Tagad mēs varam droši izmantot formulu (1) aplēsēm.

  • Korelācijas koeficienta īpašības 2019. gadā