Sammenligne datasett
Å sammenligne datasett innebærer å undersøke både sentralmål (som gjennomsnitt og median) og spredningsmål (som variasjonsbredde) for å avgjøre hvilket datasett som er høyest eller mest konsistent. To datasett kan ha samme gjennomsnitt på 15, men det ene kan ha verdier fra 10 til 20 mens det andre varierer fra 5 til 25. Sammenligning krever analyse av både nivå og variasjon for å trekke meningsfulle konklusjoner.
Bakgrunn
Sammenligning av datasett er avgjørende for å fatte informerte beslutninger i dagliglivet og samfunnet. Når media presenterer at gjennomsnittslønna i to kommuner er henholdsvis 485 000 kr og 520 000 kr, må lesere også vurdere spredningen for å forstå det fulle bildet. En kommune med lønnsspredning på 150 000 kr kan være mindre forutsigbar enn en med spredning på 50 000 kr. Dette blir særlig viktig når elever på 9. trinn skal oppfylle LK20-kompetansemålet om å tolke og kritisk vurdere statistiske framstillinger. Bedrifter bruker slike sammenligninger for å velge leverandører, forskere sammenligner eksperimentresultater, og idrettslag analyserer spillerstatistikk. Evnen til å sammenligne datasett gjør det mulig å se gjennom misvisende statistikk og forstå hva tallene egentlig forteller.
Slik løser du sammenligne datasett
Sammenligne datasett
- Sammenlign gjennomsnitt (middel, median) for å se hvilket sett er 'høyere'.
- Sammenlign spredning (variasjonsbredde, IQR) for å se hva som er mest konsistent.
- Bruk samme type gjennomsnitt for rettferdig sammenligning.
- Støtt sammenligninger med konkrete verdier.
Example: Sett A: median 12, variasjonsbredde 8. Sett B: median 15, variasjonsbredde 3 → B er høyere og mer konsistent.
Eksempler
To fabrikker produserer deler. Fabrikk A produserer i snitt 13 per dag, Fabrikk B i snitt 21 per dag. Hvilken produserer mest?
Svar: Factory B
- Sammenlign gjennomsnittene → 21 > 13 — Fabrikk B sitt gjennomsnitt (21) er større enn Fabrikk A sitt (13).
Leveringstider (dager): Firma A = 5, 2, 9, 9, 10, Firma B = 7, 7, 7, 7, 7. Begge har gjennomsnitt 7 dager. Hvilket er mest forutsigbart?
Svar: Company B
- Sammenlign spredningen → The second set has no variation (all values equal) — Alle verdiene i det andre settet er like, noe som betyr null spredning.
- Konklusjon → Company B is more predictable — Firma B leverer på like mange dager hver gang.
Sammenlign variasjonsbredder: Sett A = {1, 10, 14, 19} variasjonsbredde=18, Sett B = {4, 5, 8, 11} variasjonsbredde=7. Hvilket har størst spredning?
Svar: Set A
- Sammenlign variasjonsbreddene → Range A = 18, Range B = 7 — Variasjonsbredde A (18) > Variasjonsbredde B (7).
- Konklusjon → Set A is more spread out — En større variasjonsbredde betyr mer spredning.
Vanlige feil
- Å sammenligne kun gjennomsnitt uten å vurdere spredning. To leverandører kan ha samme leveringstid på 8 dager i snitt, men den ene leverer konsekvent på 7-9 dager mens den andre varierer fra 3-13 dager.
- Å bruke ulike sentralmål for sammenligning. Å sammenligne gjennomsnitt fra ett datasett med median fra et annet gir ikke rettferdig sammenligning når verdiene er henholdsvis 12,5 og 11,0.
- Å konkludere basert på størst verdi i stedet for sentralmål. At ett datasett har maksimalverdi 25 mens et annet har 20, betyr ikke at det første har høyere gjennomsnitt enn det andre som kan være 15 versus 18.