Wat is het verschil tussen kansberekening en standaard deviatie?

Je hebt een kansberekening gemaakt. Daarna bereken je de standaard deviatie. Stel: je hebt 20% kans op '1000' 60% kans op '500' en 20% kans op '500'. Gemiddelde is 500
De standaarddeviatie is 316.

Mijn vraag is: waarom bereken je na de kansberekening ook de standaard dev.? Waarom zeg je eerst: er is 20% kans op 1000 ....'' etc '' en dmv sigma interval dat 95% van de waarneming tussen x en x liggen? Wat het verschil tussen beiden, de kansberekening en de stand. dev.? Wat is het nut van stand. dev.?

Weet jij het antwoord?

/2500

Met de standaarddeviatie geef je de spreiding binnen je steekproef weer. Stel je gemiddelde is 500. De spreiding kan dan zijn: 10 met 0 en 10 met 1000. De standaarddeviatie is dan groot. De spreiding kan echter ook klein zijn: 10 met 499 en 10 met 501, hierbij is de standaarddeviatie klein. De standaarddeviatie staat dus eigenlijk los van kansberekening.

Bronnen:
cursus.statistiek

Standaard deviatie is meer iets voor de beschrijvende statistiek. Als de bomen in een bos gemiddeld 25 meter hoog zijn wil je ook wel weten hoeveel spreiding er in hun lengtes zit. Andere dingen die je dan wilt weten is hoe groot de meeste bomen zijn en of er ook heel grote bomen tussen zitten. Het zou kunnen dat 25 meter het meeste voorkomt en de standaardafwijking maar 2 meter is. (uniform productiebos met populieren) of dat de meest voorkomende lengte 20 meter is met enkele woudreuzen van 60 meter er tussen, dan heb je een meer scheve verdeling. Als je de standaardafwijking weet en er is een normale verdeling (typisch symmetrische klokvorm van de gegevens), dan kun je de kansen gaan berekenen op uitschieters en dergelijke. Tegenwoordig kun je heel veel zien aan grafieken in Excel en dan het is al snel duidelijk of je de typische hoedvorm tegenkomt. Als het een normale verdeling lijkt, dan kun je tests doen die daar een objectieve maat voor geven. Een algemene regel is dat als je van de grafieken niet veel wijzer wordt het ook weinig zin heeft om nog allerlei statistische tests op te gaan doen. Die tests moet je eerder gebruiken voor een correcte verslaglegging. Dit soort verdelingen is afgeleid van de kansrekening omdat de variatie in boomlengte in een uniform bos wordt toegeschreven aan het toeval. Dat is meer voor het gemak, omdat je niet alle factoren kent die de groei van de boom hebben beinvloed (er kan een ree aan hebben geknabbeld, allerlei zaken waar je geen weet van hebt.) De normale verdeling onstaat in deze theorie door een vaste groeisnelheid voor iedere boom plus of min de invloed van de toevalsvariabelen (stochasten). Stel dat er dertig variabelen (ree, konijn, mineralen et cetera) zijn, dan zou je die kunnen beschrijven met een dobbelsteen. Gooi je 1 dan trek je 0.3 af van de waarde, gooi je 2 dan 0.2 etcetera. Voor de volgende toevalsvariabele doe je weer hetzelfde. Als je dat voor alle bomen in het bos doet dan krijg je een normale verdeling met 25 als gemiddelde en meest voorkomende waarde. Op deze manier verklaart de kansrekening dus eigenlijk de beschrijvende statistiek. De verdeling van de dobbelsteen is een uniforme verdeling (elke worp komt even veel voor), maar de som van de dertig uitkomsten voor een flink aantal bomen volgt ongeveer een normale verdeling (officieel een binomiale verdeling).

De standaarddeviatie geeft de spreiding aan bij een normale verdeling. Een normale verdeling betekent dat er geen extreme uitschieters naar boven of naar beneden voorkomen. Het bomenvoorbeeld: de bomen zijn gemiddeld 25 meter hoog en er is sprake van een normale verdeling. De standaarddeviatie is 3. Dan kun je met zekerheid zeggen dat 95% van alle bomen een lengte hebben die ligt tussen de 19 en 31 meter. Die 19 meter is het gemiddelde minus 2x de standaarddeviatie en die 31 meter is het gemiddelde plus 2x de standaarddeviatie. In zoverre heeft een kansberekening dus iets met de deviatie te maken dat je dit over een groep bomen met een bepaalde zekerheid kunt zeggen.

Stel zelf een vraag

Ben je op zoek naar het antwoord die ene vraag die je misschien al tijden achtervolgt?

/100