Opi yksinkertainen lineaarinen regressio ja miten se toimii

Tilastollisten tilastotietojen lähestymistapa kvantitatiivisten tietojen analysointiin

Kohteliaisuus Colin Broug, valokuvaaja. © 10. kesäkuuta 2010 Stock.xchng

Lineaarisia regressiomalleja käytetään osoittamaan tai ennustamaan kahden muuttujan tai tekijän suhde. Ennustettavia tekijöitä (tekijä, jonka yhtälö ratkaistaan ) kutsutaan riippuva muuttuja. Sellaisia ​​tekijöitä, joita käytetään ennustamaan riippuvaisen muuttujan arvoa, kutsutaan itsenäisiksi muuttujiksi.

Hyvä tieto ei aina kerro täydellistä tarinaa. Regressioanalyysiä käytetään yleisesti tutkimuksessa, sillä se osoittaa, että muuttujien välillä on korrelaatio.

Mutta korrelaatio ei ole sama kuin syy-yhteys . Jopa lineaarinen lineaarinen regressio, joka sopii hyvin datapisteisiin, ei voi sanoa jotain lopullista syy-seuraus-suhteesta.

Yksinkertaisessa lineaarisessa regressiossa kukin havainto koostuu kahdesta arvosta. Yksi arvo on riippuvaiselle muuttujalle ja yksi arvo on itsenäiselle muuttujalle.

Yksinkertainen lineaarinen regressiomalli

Yksinkertainen lineaarinen regressiomalli on esitetty näin: y = ( β 0 + β 1 + Ε

Matemaattisella konventilla kaksi yksinkertaiseen lineaariseen regressioanalyysiin liittyvää tekijää nimetään x: ksi ja y: ksi .

Yhtälö, joka kuvaa kuinka y liittyy x: ään, kutsutaan regressiomalliksi . Lineaarinen regressiomalli sisältää myös virheetermin , jota edustaa Ε tai kreikkalainen epsilon-kirjain. Virheen termiä käytetään kuvaamaan y : n vaihtelevuutta, jota ei voida selittää lineaarisella suhteella x: n ja y: n välillä .

Siinä on myös parametreja, jotka edustavat tutkittavaa väestöä. Nämä mallin parametrit , joita edustaa ( β 0 + β 1 x ).

Yksinkertainen lineaarinen regressiomalli

Yksinkertainen lineaarinen regressioyhtälö on esitetty näin: Ε ( y ) = ( β 0 + β 1 x ).

Yksinkertainen lineaarinen regressioyhtälö on graafoitu suoraksi linjaksi.

( β 0 on regressiolinjan y- leikkaus.

P 1 on kaltevuus.

Ε ( y ) on y: n keskiarvo tai odotettu arvo tietyn x: n arvon osalta.

Regressiolinjalla voi olla positiivinen lineaarinen suhde, negatiivinen lineaarinen suhde tai ei suhdetta. Jos yksinkertainen lineaarinen regressiossa oleva graafoitu viiva on tasainen (ei vino), kahden muuttujan välillä ei ole suhdetta. Jos regressiolinja laskeutuu ylöspäin viivan alemman päähän kaavion y- sieppauksessa (akselilla), ja ylävirran pituus, joka ulottuu ylöspäin graafikenttään, poispäin x- leikkauksesta (akseli) on olemassa positiivinen lineaarinen suhde . Jos regressiolinja laskeutuu alaspäin viivan ylemmän pään kanssa kaavion y- leikkauskohdassa (akseli) ja alarunko, joka ulottuu alaspäin graafiseen kentään, kohti x- leikkausta (akseli) on negatiivinen lineaarinen suhde.

Arvioitu lineaarinen regressioyhtälö

Jos populaation parametrit tunnettiin, voidaan yksinkertaisen lineaarisen regressioyhtälön (jäljempänä esitetty) käyttää y : n keskiarvon laskemiseksi tunnetun x: n arvon perusteella.

Ε ( y ) = ( β 0 + β 1 x ).

Käytännössä parametrien arvoja ei kuitenkaan tunneta, joten ne on arvioitava käyttämällä väestön näytteen tietoja . Väestöpariometrit on arvioitu käyttämällä näytetilastoja . Näytetilastoja edustaa b 0 + b 1. Kun näytetilastot on korvattu väestöparametreilla, muodostuu arvioitu regressioyhtälö.

Arvioitu regressioyhtälö esitetään alla.

( ŷ ) = ( β 0 + β 1 x

( ŷ ) lausutaan y hattu .

Arvioitua yksinkertaista regressioyhtälöä kuvaava kaavio kutsutaan arvioiduksi regressiolinjaksi.

B 0 on y-leikkaus.

B 1 on kaltevuus.

Ŷ ) on y : n arvioitu arvo tietyn x- arvon osalta.

Tärkeä huomautus: Regressioanalyysia ei käytetä muuttujien syy-ja -vaikutussuhteiden tulkitsemiseen. Regressioanalyysi voi kuitenkin osoittaa, kuinka muuttujat liittyvät tai missä määrin muuttujat ovat toisiinsa yhteydessä.

Näin tekemällä regressioanalyysi pyrkii tekemään merkittäviä suhteita, jotka edellyttävät asiantuntevaa tutkijaa tarkemmin .

Tunnetaan myös nimellä: bivariate regressio, regressioanalyysi

Esimerkkejä: Pienimmän neliösumman menetelmä on tilastollinen menetelmä näytetietojen käyttämiseksi arvioidun regressioyhtälön arvon löytämiseksi. Pienimmän neliösumman menetelmää ehdotti Carl Friedrich Gauss, joka syntyi vuonna 1777 ja kuoli vuonna 1855. Pienimmän neliösumman menetelmää käytetään edelleen laajalti.

Lähteet:

Anderson, DR, Sweeney, DJ ja Williams, TA (2003). Taloustieteiden perustiedot (3. laitos) Mason, Ohio: Lounais, Thompson Learning.

______. (2010). Selitys: Regressioanalyysi. MIT-uutiset.

McIntyre, L. (1994). Tupakkatietojen käyttö usean regressiivisen johdannon avulla. Tilastotieteen laitos, 2 (1).

Mendenhall, W., ja Sincich, T. (1992). Tilastollinen tekniikka ja tiede (3. laitos), New York, NY: Dellen Publishing Co.

Panchenko, D. 18.443 Sovellusten tilastot, syksy 2006, jakso 14, yksinkertainen lineaarinen regressio. (Massachusetts Institute of Technology: MIT OpenCourseWare)