Er zijn veel meer leerlingen met wiskunde B dan met wiskunde A.
Er zijn bij wiskunde B hogere cijfers dan bij wiskunde A.
De B-groep scoort ook negens, de A-groep niet.
De onafgeronde cijfers. Onbekend is nu hoe de cijfers binnen een klasse verdeeld zijn.
Bij is cp = voor de A-groep en cp = voor de B-groep.
Het verschil is .
B scoort beter, want de meeste B-leerlingen scoren boven en de meeste A-leerlingen onder de .
De B-grafiek ligt onder de A-grafiek.
Aflezen grootste verticale verschil:
de -waarde is
de -waarde is
de -waarde is
De cijfers in de A-groep liggen lager dan in de B-groep, want de boxplot van de A-groep ligt links van de boxplot van de B-groep.
Het gemiddelde eindcijfer voor alle vakken heeft een grote rol gespeeld in de keuze voor A of B. Zou het kunnen zijn dat de betere leerlingen relatief vaker voor een NG- of NT-profiel kiezen met wiskunde B, terwijl minder goede leerlingen relatief vaker kiezen voor een EM- of CM-profiel met wiskunde A?
De frequentieverdeling van het NT-profiel is vrij symmetrisch. Het CM-profiel is uniformer dan het NT-profiel.
De modus van het NT-profiel ligt meer naar rechts dan de modus van het CM-profiel: deze ligt erg links.
De verdeling van het CM-profiel loopt langer door naar rechts dan in het NT-profiel.
In het NT-profiel worden de meeste cijfers rondom de modus gescoord: weinig echt lage cijfers en weinig echt hoge cijfers.
In het CM-profiel komen alle cijfers ongeveer even vaak voor; er zijn echter extra veel lage cijfers (de modus) en de allerhoogste cijfers (het meest rechts) van beide groepen samen worden in het CM-profiel gescoord.
NT-profiel: gemiddelde is en mediaan is .
CM-profiel: gemiddelde is en mediaan is .
De mediaan en het gemiddelde van beide groepen verschillen weinig.
De box van de boxplot van het CM-profiel is veel langer dan de box van het NT-profiel, vooral aan de linkerkant; aan de linkerkant beginnen de boxplots tegelijk, de boxplot van het CM-profiel loopt langer door naar rechts; de medianen liggen ongeveer gelijk.
Zowel de spreidingsbreedte als de kwartielafstand van het NT-profiel zijn kleiner dan die van het CM-profiel. De laagste begint en eindigt bij beiden (ongeveer) bij dezelfde cijfers maar in het CM-profiel is de kleinste veel minder verspreid dan de daarboven, terwijl dat bij het NT-profiel net andersom is: in het CM-profiel worden meer echt lage cijfers gescoord. Al eerder is opgemerkt dat de echt hoge cijfers ook in het CM-profiel worden gescoord.
Het CM-profiel is gelijkmatiger (uniformer) dan het NT-profiel, op een sprong tussen de en de na. Het NT-profiel heeft opeens een sprong tussen de en . En is eerder bij de , al bij de (CM-profiel bij de ).
Je kunt ook in één oogopslag zien dat:
ongeveer van de leerlingen met een NT-profiel heeft een onvoldoende () tegenover ongeveer van de CM-leerlingen;
ongeveer van de leerlingen met een NT-profiel een of lager scoort tegenover ruim van de CM-leerlingen.
Een voorbeeld van een mogelijke beschrijving:
Het percentage onvoldoendes voor Engels is bij de leerlingen in het CM-profiel hoger dan bij de leerlingen in het NT-profiel. De verdeling over de cijfers is bij de leerlingen in het CM-profiel gelijkmatiger dan bij de leerlingen in het NT-profiel. Bij de laatste groep heeft een groot deel van de leerlingen een cijfer tussen de en . Bij de leerlingen in het CM-profiel zijn de verschillen in frequentie tussen de cijfers veel kleiner. Dit zie je terug in de boxplots: de kwartielafstand bij de leerlingen in het CM-profiel is groter dan de kwartielafstand bij leerlingen in het NT-profiel. Echt hoge cijfers - boven de - komen alleen voor bij leerlingen in het CM-profiel.
Kanttekening bij deze conclusies. We hebben hier alleen naar de variabele “cijfer voor Engels” gekeken. Eigenlijk zou je ook moeten kijken naar het algemene beeld van de leerlingen. Doen ze het op alle vakken ongeveer even goed, zijn er leerlingen die duidelijk uitvallen? Naar dat soort dingen kijken we in de volgende paragraaf.
De verdeling van 1995 heeft één top en die van 2005 heeft twee toppen. De linker top betreft de nieuwe instromers in het onderwijs
klassenmiddens:
po 1995: gemiddelde is ongeveer ; po 2005: gemiddelde is ongeveer
De verdeling in 1995 is redelijk symmetrisch terwijl die van 2005 gelijkmatiger/uniformer wordt.
De staven tussen en zijn ongeveer even hoog: er komt in die leeftijdsklassen niemand bij.
De staven tussen en zijn lager: er zijn minder mensen werkzaam in die leeftijdsklassen dan in 1995.
In totaliteit komt is er dus sprake van uitstroom.
Zie figuur. Teken de boxplots er zelf bij.
Het uniformer worden van de verdeling zie je terug in de rechtere polygoon van 2005. Aan de medianen (bij ) zie je dat er minder jongeren zijn in 2005 ( jonger dan jaar) dan in 1995 ( jonger dan jaar). De kwartielafstand is in 2005 groter geworden dan in 1995: de jongste is in 2005 wat jonger is dan in 1995 en de oudste is wat ouder dan in 1995.
De boxplot van type A ligt in zijn geheel rechts van de drie andere boxplots (de kleinste waarde van type A is groter dan de grootste waarden van type B, C en D).
Het zullen steekproeven zijn waarop deze boxplots zijn gebaseerd en natuurlijk nooit de voltallige populatie van lampen ooit gemaakt of nog te maken! En een steekproef kan door toeval afwijken van de totale populatie.
Het aantal branduren van de lamp van type B met de kortste brandtijd is even groot als het derde kwartiel van type C: van type C brandt langer dan de lamp van type B met de kortste brandtijd.
Wat je veilig kunt zeggen:
Het kortste aantal branduren is bij beiden gelijk: of je nu een lamp van type C of van type D hebt, ze branden minimaal uur.
De mediaan van type C is gelijk aan het derde kwartiel van type D: de kortste van type D gaat even kort mee als de kortste van type C.
Het eerste kwartiel van type C valt samen met de mediaan van type D: de kortste van type D gaat even kort mee als de kortste van type C.
Al met al lijk je met type C iets meer kans te hebben op meer branduren dan met type D.
In het algemeen - zeker als de steekproeven niet zo heel groot zijn - kun je bij dit soort geheel overlappende boxplots nauwelijks met zekerheid uitspraken doen.
-
-
-
Er vallen drie dingen op:
Bij de jongens is de spreidingsbreedte groter.
De jongens hebben een hoge modus en de meisjes geen modus.
Bij de meisjes scoort niemand lager dan een (maar ook niet hoger dan ).
Ook hier zie je het verschil in spreidingsbreedte terug en de ligging van de cijfers.
Verder valt op:
De mediaan van de jongens is lager dan de mediaan van de meisjes.
Maar liefst van de jongens heeft lager gescoord dan alle meisjes.
Eigen antwoord; vergeet niet dat het hier alleen om de jongens en meisjes in deze ene klas gaat: het betreft zeker geen representatieve steekproef van alle jongens en meisjes!
-
-
-
-
-