Welke statistische test moet ik gebruiken wanneer mijn regressie niet normaal verdeeld is?

Mijn test is niet normaal verdeeld hoe kan ik ervoor zorgen dat mijn regressie toch normaal verdeeld word.

Weet jij het antwoord?

/2500

Statistische toetsen hebben eigenlijk niets met regressie te maken, met regressie streef je er naar een zo nauwkeurig mogelijk model van de werkelijkheid te maken, een toets is er om vast te stellen of er een effect is. Bij regressie ga je er impliciet al vanuit dat het effect er is en probeer je de grootte van het effect vast te stellen, c.q. een model te maken van de werkelijkheid. Je meet bijvoorbeeld hoe groen het water is en wil daarmee voorspellen hoeveel plankton er aanwezig is. Je gaat er dan eigenlijk al vanuit dat groen en plankton aan elkaar gerelateerd zijn. Door wat metingen te doen in de praktijk kun je zien hoe goed de groenheid de hoeveelheid plankton voorspelt. Bij regressie wil je eigenlijk altijd dat de fouten normaal (lees door stom toeval) verdeeld zijn, dat kun je checken in Excel met de data analysis add on. Op het oog kun je het zien als de fout boven en onder de regressielijn of functie niet afhangt van waar je op de functie zit.Bijvoorbeeld geen puntenwolkjes links onder de regressielijn en rechts boven de regressielijn, dan is je model niet optimaal. Er zijn nog wel andere haken en ogen aan, want vaak zijn de metingen bij heel groen of heel helder water wat minder nauwkeurig. Dan hoor je ook nog wegingsfactoren toe te voegen. Een goed boek voor data analyse met behulp van excel is advanced excel for scientific data analysis van robert de levie. http://www.amazon.com/Advanced-Excel-scientific-data-analysis/dp/0984712305 Het is mogelijk dat je variabele lognormaal verdeeld is. Door de logaritme te nemen van je data kun je dan verder daarmee rekenen. Lognormale verdelingen zijn bijvoorbeeld aan te treffen bij lengte en gewicht en dergelijke (zie bron).Regressie zou inhouden dat ik van de honderd vissen de lengte en het gewicht noteer. Voor regressieanalyse zou ik dan gebruik maken van de logaritmes van deze grootheden. Anders zouden extreme lengtes en gewichten een onevenredig grote invloed uitoefenen op je regressie, en je kunt een regressielijn gebruiken in plaats van een functie.

Stel zelf een vraag

Ben je op zoek naar het antwoord die ene vraag die je misschien al tijden achtervolgt?

/100