Izmantojot gabaliem, lai pārbaudītu modeļa pieņēmumi

link:https://www.ma.utexas.edu/users/mks/statmistakes/modelcheckingplots.html

Vispārējo uzmanību!:

1. Diemžēl, šīm metodēm ir parasti labāk pie stāsta jums, kad modeļa pieņēmumu, nav derīgas, nekā, kad to dara.

2. Dažādas metodes ir dažādas modelētajiem pieņēmumiem, tāpēc papildu modeļa pārbaudes gabaliem var būt nepieciešama; noteikti jākonsultējas ar labas atsauces par konkrētu tehniku, jūs apsver, izmantojot.

Vispārējs noteikums īkšķis: Pirmās pārbaudīt jebkuru neatkarību pieņēmumi, tad jebkurš vienlīdzīga dispersija, pieņemot, pēc tam visus pieņēmumus, uz izplatīšanu (piemēram, normal), mainīgo lielumu.

Pamatojums: Metodes parasti ir mazāk stabils, lai novirzes no neatkarības1 un visnoturīgākais, lai novirzes no normālā2, 3.

Ieteikumi un vadlīnijas, lai pārbaudītu konkrētu modeli pieņēmumi

Pārbaudīt neatkarību

Neatkarību pieņēmumiem, parasti tiek formulēts kļūdu ziņā, nevis kā arī mainīgos lielumus. Piemēram, vienkāršās lineārās regresijas modeļa vienādojums ir

Y = α + ßx + ε,

kur Y ir rezultātu (atbildes), mainīgā un ε apzīmē kļūdas apzīmējums (arī izlases mainīgo). Tā ir kļūda, ka nosacījumi, kas ir pieņemts, lai būtu neatkarīga4, nav vērtības reakcijas mainīgo.

Mēs nezinām vērtības kļūda noteikumiem ε, tāpēc mēs varam tikai gabals ar atlikumu ei (definēts kā novērotā vērtība yi mīnus uzstādīta vērtība, atkarībā no modeļa), kura aptuvenais kļūdu ziņā.

Noteikums Īkšķis:, Lai pārbaudītu neatkarību, zemes gabala atlikumu pret kādu laiku mainīgie klāt (piemēram, lai no novērošanas punkta, jebkura teritorijas mainīgie klāt, un jebkura mainīgo, kuri tiek izmantoti tehniku (piemēram, faktori, regressors). Modelis, kas nav izlases liecina, neatkarības trūkums.

Pamatojums: Atkarība no laika vai telpiskiem mainīgajiem lielumiem ir izplatītākie avoti, neatkarības trūkums, bet otru zemes gabalu, var arī noteikt, neatkarības trūkums.

Piezīmes:
1. Tāpēc, ka laiks un telpiskā saistība ir tik bieža, tas ir svarīgi, veicot novērojumus ierakstīt jebkurā laikā, vai telpiskiem mainīgajiem lielumiem, kas varētu atvest ietekmēt rezultātus. Tas ne tikai ļauj jums, lai atlikušo zemes gabalu, lai atklātu iespējamās neatkarības trūkums, bet arī ļauj jums mainīt tehnika, iekļaujot papildu laiku, vai telpiskiem mainīgajiem lielumiem, ja neatkarības trūkums ir konstatēts šo zemes gabalu.

2. Jo tas ir zināms, ka atlikumu summa ir nulle, viņi nav neatkarīgi, lai arī gabals ir ļoti aptuvena.

Pārbaudes par vienādu dispersiju

Gabals atlikumu pret aprīkots vērtības (lielākajā daļā gadījumu, šie ir aprēķināts nosacīts nozīmē, atkarībā no modeļa), tā kā tas nav nekas neparasts, lai ierobežotu atšķirības, ir atkarīga no nosacījuma nozīmē, jo īpaši, lai palielinātu kā ierobežotas ir palielināt. (Tas parādās kā piltuves vai megaphone formu, lai atlikušo zemes gabalu.)

Uzmanību: Hipotēzes pārbaudes vienlīdzīga dispersija, bieži vien nav uzticami, jo tie arī ir modelētajiem pieņēmumiem un parasti neiztur novirzes no šiem pieņēmumiem.

Pārbaudes norma vai cita izplatīšanas

Uzmanību: histogrammu (neatkarīgi no to iznākuma vērtības vai atliekām), nav labs veids, kā pārbaudīt normalitāte, jo histograms pašus datus, bet izmantojot dažādas bin izmēri (a klases-platums) un/vai dažādu cut-punktiem starp nodalījumiem var izskatīties pavisam atšķirīgi. Example.

Tā vietā, izmantojiet varbūtību gabals (arī zināt, kā quantile gabals vai Q-Q gabals). Noklikšķiniet uz šeit pdf failu, paskaidrojot, kādi tie ir. Lielākā daļa statistikas programmatūra ir funkcija, kas ražo šos.

Uzmanību: Varbūtība, zemes gabali maziem datu kopas, kas bieži vien ir maldinoša; tā ir ļoti grūti pateikt, vai ir vai nav maza datu kopumu, kas nāk no konkrēta izplatīšana.

Pārbaudīt linearitāte

Apsverot vienkāršās lineārās regresijas modeli, tas ir svarīgi, lai pārbaudītu linearitātes pieņēmums — t.i., ka nosacījums ir, atbildes reakcijas rādītāju, ir lineāra funkcija prognozēt mainīgās. Grafikus reakcijas mainīgo vs prognozēt bieži vien var dot priekšstatu par to, vai tas ir patiess. Tomēr, viens vai abi no šiem uzlabojumiem var būt nepieciešami:

1. Gabals atlikumu (nevis atbildes) vs. prognozēt. Ārpus izlases modeli, liecina, ka vienkāršs lineārs modelis nav piemērots; jums var būt nepieciešams, lai pārveidotu atbildi vai prognozēt, vai pievienot kvadrāta vai augstākās termiņš režīmā.

2. Izmantot scatterplot gludāka, piemēram, lowess (pazīstams arī kā lesa), lai dotu vizuāla novērtēšana nosacījuma nozīmē. Šādu smoothers ir pieejama daudzās regresijas programmatūras paketes. Uzmanību: Jums var būt nepieciešams, lai izvēlētos vērtību gludi parametrs. Padarīt pārāk liela būs oversmooth; padarot to par pārāk mazo nebūs pietiekami gludām.

Kad, ņemot vērā lineārās regresijas tikai ar diviem noteikumiem, uzzīmējot reakcijas (vai atliekām) pret diviem terminiem (padarot trīsdimensiju grafikā) var palīdzēt platums piemērotību lineārais modelis, it īpaši, ja jūsu programmatūras, kas ļauj jums pagriezt grafikā.

Brīdinājums: nav iespējams novērtēt no scatterplots, vai lineārais modelis vairāk nekā diviem faktoriem, kas ir piemērots. Viens veids, lai risinātu šo problēmu, ir, lai mēģinātu pārveidot prognozēt tuvināt daudzveidīgo normalitāte.5 Tas nodrošinās, ne tikai to, ka lineārais modelis ir piemērots visām (pārveidots) prognozēt kopā, bet, ka lineārais modelis ir piemērots pat tad, ja daži pārveidoti prognozēt ir samazinājies no modeļa.6


1. Daži paņēmieni var tikai liek nekorelē kļūdas, nevis neatkarīgu kļūdas, bet modelis-pārbaude, zemes gabali nepieciešams, ir vienādi.

2. Noturīgums novirzes no normālā ir saistīti ar Centrālā robežteorēma, jo lielākā daļa novērtējumu ir lineārās kombinācijas apsvērumus, un tādēļ aptuveni normāli, ja novērojumu skaits ir liels.

3. Šajā kontekstā, “stabilitāti” var būt formulēts, sākot no izbraukšanas no modeļa pieņēmumu par I Tipa kļūdas koeficients. Skatīt Van Belle (2008) Statistikas Noteikumi, Īkšķis-173 – 177 un atsauces dotas tur sīkāk.

4. Daži preparāti, regresijas, kļūdas noteikumi ir tikai pieņemts, ka nav saistīts, ne vienmēr ir neatkarīga.

5. Skatīt Pavārs un Weisberg (1999), kas tiek Piemēroti Regresijas Tostarp Skaitļošanas un Grafikas, lpp. 324 – 329 viens veids, kā to izdarīt.

6. Ja lineārais modelis der ar visiem faktoriem, kas iekļauta, tā nav taisnība, ka lineārais modelis joprojām būs derīgas, kad daži pareģo ir samazinājies. Piemēram, ja E(Y|X1, X2) = 1 + 2X1+3X2 (tā, ka lineārais modelis der, ja Y ir samazinājies gan X1un X2), bet E X1| X2) = log(X1), tad to var aprēķināt, ka E(Y|X1) = 1 +2X1 + 3log(X1), kas saka, ka lineārais modelis nav piemērots, ja y ir samazinājies par X1 vien.