Hét vraag- en antwoordplatform van Nederland

Hoe bereken je de correlatie tussen een nominaal meetniveau en een ratio meetniveau?

Voorbeeld: Ik ben benieuwd of er samenhang is tussen het aantal medewerkers van een bedrijf en het wel/niet hebben van een webshop. Mijn hypothese is dat hoe groter het aantal medewerkers is, hoe groter de kans is dat zo'n bedrijf een webshop heeft.

Kortom:
Kolom 1 = aantal medewerkers (geheel getal)
Kolom 2 = wel/geen webshop (ja/nee)

Mijn vraag is, hoe bereken ik de correlatie tussen deze twee? Kan ik bijvoorbeeld bij kolom 2 de 'ja' omzetten in '1' en de 'nee' in '0'? Of zijn er eventueel andere methoden om het verband tussen een getal en een 'ja/nee' antwoord te bepalen?

Verwijderde gebruiker
5 jaar geleden
in: Wiskunde
7.8K
TurfGraver
5 jaar geleden
"Mijn hypothese is dat hoe groter het aantal medewerkers is, hoe groter de kans is dat zo'n bedrijf een webshop heeft."
Hoeveel webshop zijn er waar maar 1 werknemer achter zit denk je?
TurfGraver
5 jaar geleden
Daarnaast zijn er ook bedrijven met veel werknemers zonder webshop.
Zal meer van de dienst, product afhangen volgens mij.
Verwijderde gebruiker
5 jaar geleden
@TurfGraver Het voorbeeld heb ik verzonnen om het wat te versimpelen. In werkelijkheid gaat het om de correlatie tussen het aantal werknemers bij industriële bedrijven en het wel/niet leasen van veiligheidskleding. Mijn vraag is niet of de hypothese klopt, maar hoe de correlatie tussen die twee variabelen kan worden berekend ;)
TurfGraver
5 jaar geleden
Ja, als 'ja' doet waarde mee in afweging en ander niet of iets anders.
Maar ik zou ook de afweging nemen van de 'nee' en vergelijken.
Dus, bij hoeveel medewerkers hebben een 'ja' maar ook met zelfde aantal medewerkers zijn er met een 'nee' ?
kierkegaard47
5 jaar geleden
Je zegt dat je vraag niet is òf de hypothese klopt. Als de achterliggende probleem echter wel is dat je wilt toetsen of de hypothese klopt, dan zou ik dat niet met correlaties doen. Ik zou dan het gemiddelde aantal werknemers berekenen van bedrijven die géén leasekleading aanschaffen en het gemiddelde voor bedrijven die dat wèl doen, en daar een T-toets op loslaten om te kijken of het verschil significant is. Is de bedoeling daarentegen echt om een correlatiecoëfficient te berekenen, dan schijnt dat te kunnen met een zgn 'point biserial correlation coefficient', zie bv. https://en.wikipedia.org/wiki/Point-biserial_correlation_coefficient (ik heb hier zelf overigens geen directe ervaring mee) Even googlen kan je zo vertellen hoe je dat in bv. SPSS doet, indien gewenst.
Verwijderde gebruiker
5 jaar geleden
@kierkegaard47 De punt-biseriële correlatiecoëfficiënt is inderdaad waar ik naar zocht! Het blijkt hetzelfde te zijn als de correlatie van Pearson, maar de tweede variabele is in dit geval dichotoom. Mocht iemand geïnteresseerd zijn in de berekening, deze video heeft mij geholpen: https://www.youtube.com/watch?v=76ipx-ta8FY Plak je reactie even als antwoord, dan kan ik de vraag sluiten :)

Heb je meer informatie nodig om de vraag te beantwoorden? Reageer dan hier.

Antwoorden (1)

(Op het verzoek van vraagsteller vanuit de reactie als antwoord geplakt).

Als je achterliggende probleem is dat je wilt toetsen of de hypothese klopt, dan zou ik dat niet met correlaties doen. Ik zou dan het gemiddelde aantal werknemers berekenen van bedrijven die géén leasekleading aanschaffen en het gemiddelde voor bedrijven die dat wèl doen, en daar een T-toets op loslaten om te kijken of het verschil significant is.

Is de bedoeling daarentegen echt om een correlatiecoëfficient te berekenen, dan schijnt dat te kunnen met een zgn 'point biserial correlation coefficient', zie bv. https://en.wikipedia.org/wiki/Point-biserial_correlation_coefficient

(ik heb hier zelf overigens geen directe ervaring mee)

Even googlen kan je zo vertellen hoe je dat in bv. SPSS doet, indien gewenst.
(Lees meer...)
kierkegaard47
5 jaar geleden

Weet jij het beter..?

Het is niet mogelijk om je eigen vraag te beantwoorden Je mag slechts 1 keer antwoord geven op een vraag Je hebt vandaag al antwoorden gegeven. Morgen mag je opnieuw maximaal antwoorden geven.

0 / 2500
Gekozen afbeelding