fbpx Om ulike datatyper | Sykepleien Hopp til hovedinnhold

Om ulike datatyper

Et «datasett» er «observasjoner og målinger som samles inn under en vitenskapelig undersøkelse». Et datasett består av individuelle data.

 

 

 

 

Vi kan dele «verden» opp på ulike måter. En grunnleggende måte er å dele verden inn i grupper. Da kategoriserer vi. Vi sier «hva» noe er, uten å si noe mer: dette er «en fisk», dette er «en terrorist». Slike data - der vi bare navngir - kalles nominale.

I tillegg til å «gi navn», kan vi sammenligne: «fisk 1 er større enn fisk 2». Sammenligningen foretas ved hjelp av et kriterium. I eksempelet er lengde eller vekt benyttet som kriterium. Sammenligningen setter oss i stand til å rangordne fangsten: «Min er større enn din!»

 

To prinsipper

Når vi måler noe, benytter vi to prinsipper. Vi knytter et tall til en observasjon. Dette gjør vi systematisk og konsistent ved hjelp av en skala eller målestokk. Skalaen deler verden opp i standardiserte, like enheter. Skalaen kan (men trenger ikke) ha et naturlig nullpunkt. Foreligger et naturlig nullpunkt, kan vi for eksempel trygt si at 2 meter er fire ganger så langt som 0.5 m. Vi kan skape meningsfulle tallforhold mellom observasjonene.

Figur 1 Målenivå for data.

 

 

 

Forskjellig statistisk teknikk

Mens det gir god mening å regne ut gjennomsnittet for numeriske datasett, er dette meningsløst for kategoriske. Dersom førti kvinner er «gravide», så er de «gravide», verken mer eller mindre. Generelt er hver enkelt statistisk teknikk tilpasset og bare gyldig for en type data.

Det samme gjelder grafiske figurer. Skal vi grafisk beskrive nominale data, kan vi benytte et søylediagram. Vi ser umiddelbart at å beskrive slike data ved et boksdiagram ikke gir mening.

Hvilket nivå vi velger for datasettet, avgjøres av hva vi finner praktisk og teoretisk hensiktsmessig. Inndelingen kan også forandres. Et eksempel kan belyse dette.

Studerer vi sammenhengen mellom «bruk av alkohol» og «trafikkulykker» kan «bruk av alkohol» operasjonaliseres på følgende måter:

 

Vis i full størrelse

Mht. nivå 2: Her vet vi ikke sikkert om den som svarer «minst 1 g/uke» drikker mer enn den som svarer «minst 1 g/mnd.». Spørsmålet her er «hvor ofte». Dette forholdet kan rangordnes.

Mht. nivå 3: Her har vi «operasjonalisert» mengden til «alkoholenheter /uke». En alkoholenhet tilsvarer 12 g alkohol/10 ml3. «Folk flest» vil ikke kjenne dette begrepet, så vi må omsette det til noe praktisk, f eks 1 glass vin eller ei lita flaske pils.

Summerer vi alle som svarer at de drikker (uansett mengde) og de som ikke drikker, har vi «kodet om» dataene til nominalnivå. Omkoding skjer alltid fra «finere» til «grovere inndelinger». Omkodinga gjør at vi mister informasjon. Vi vet mer om de som har svart på skjema i gruppe 3, enn de som har svart på skjema i gruppe 1.

 

Å avgjøre kategori

Om noe tilhører en kategori, kan noen ganger være vanskelig å avgjøre. Ta dette med kjønn. Hva er ei «kvinne»? Til daglig benytter vi ytre (tilfeldige) kjennetegn som påkledning, oppførsel og lignende. Blir vi pressa litt, vil vi definere «kvinne» som en person som har «kvinnelige kjønnsorganer». Tja? Caster Semeyana - den unge afrikanske kvinnen som nylig satte verdensrekord på 800 m, ble jo anklaget for å være mann. Testkriteriene de ville benytte, var ikke de vanlige, men hormonprofilen hennes.

 

 

1 Everitt BS. The Cambridge Dictionary of Statistics. 2nd Ed. Cambridge: CUP, 2002.

2 Wright RLD Understanding Statistics. An informal Introduction. NY: Harcourt Brace Jovanich, 1976.

 

3 Alkoholenheter varierer internasjonalt: f eks fra 6 g/10 ml i Irland, til 20 g 10 ml i Japan.

0 Kommentarer

Innsendte kommentarer kvalitetssikres før publisering. Kvalitetssikringen skjer i vanlig arbeidstid.

Ledige stillinger

Alle ledige stillinger
Kjøp annonse
Annonse
Annonse