Hoe gaan onderzoekers om met gemiddelde leeftijd als mensen iets (nog) niet gedaan hebben?

Laten we nemen een onderzoek naar de gemiddelde leeftijd van de eerste tongzoen.
We nemen een onderzoeksgroep van jongeren van 16-30 jaar oud. Zeg 1000.
Stel dat iedereen gezoend heeft dan is er makkelijk een gemiddelde te trekken. Alle leeftijden opgeteld/1000
Maar wat als blijkt dat er een hoop mensen tussen zitten die nog helemaal niet getongzoend hebben?
Hoe wordt dat dan berekend? Ik neem aan dat het eruit halen van deze mensen een probleem oplevert (ik neem aan dat dat het gemiddelde lager zal maken dan terecht is), maar misschien zie ik een hele simpele elegante oplossing over het hoofd.
En wat als je mensen zou volgen over hun leven en ze helemaal nooit zouden tongzoenen?

Of is dit eigenlijk niet zo'n probleem voor de onderzoekers aangezien ze dit juist zullen verwoorden en wordt dit dan vaak een probleem in (niet-wetenschappelijke) publicatie?

Weet jij het antwoord?

/2500

Er is geen vaste oplossing voor, en dit soort statistisch/methodologische problemen worden ook niet altijd door de onderzoekers onderkend. De statistische onderbouwing van veel wetenschappelijke artikelen is onvoldoende. Goede tijdschriften eisen dat dit soort aspecten goed worden beschreven in de methode-sectie van het artikel, zodat de gemaakte keuzes (uitsluiten van nooit-zoeners, of het toekennen van een pseudo-leeftijd) duidelijk zijn. In iets ander verband; 'missing data' zijn een groot probleem. Bij medisch onderzoek is er vaak een groot verschil tussen Intend-To-Treat en Per-Protocol analyse, waarbij in het laatste geval uitvallers worden genegeerd en in het eerste geval niet.

Stel zelf een vraag

Ben je op zoek naar het antwoord die ene vraag die je misschien al tijden achtervolgt?

/100