I en undersøkelse har man spurt lærere innenfor fem ulike fag om hva slags grunnlag de baserer sine standpunktkarakterer på og hva de legger vekt på når de skal sette karakteren. Resultatene blir lagt inn i en modell der man skiller mellom to tilnærminger til karaktersetting. Det viser seg at fagenes egenart spiller en overraskende stor rolle for hvordan standpunktkarakterer settes. Standpunktvurdering blir av lærerne sett på som et utfordrende tema, og mange etterspør tydeligere retningslinjer på feltet.

Medieoppmerksomheten i forbindelse med eksamenskarakterer er årviss og handler blant annet om gapet mellom standpunkt- og eksamenskarakterer. Oppmerksomheten er oftest knyttet til hva som er et naturlig avvik mellom standpunkt- og eksamenskarakter i et fag. Hva betyr det når avviket er stort? Er det lærerne som ikke kan jobben sin? Utover studier av karakterstatistikk fins det få studier i Norge av læreres karaktersetting som er basert på lærernes egne beskrivelser av karaktersetting til standpunkt. Dette er paradoksalt, siden standpunktkarakterene utgjør en stor del av den samlede karakterpoengsum på vitnemålet. Elever skal for eksempel etter fullført 10. trinn ha 13 standpunktkarakterer, men har som regel én til tre eksamenskarakterer på vitnemålet. Til tross for dette får eksamen og eksamenskarakterer størst oppmerksomhet i regelverket og i kvalitetsdebatter om vurdering.

I en ny rapport fra NIFU STEP har vi presentert resultatene av en undersøkelse av læreres praksis for standpunktvurdering. I løpet av våren 2010 snakket vi med 41 faglærere fra fem fag ved fire ungdomsskoler og to videregående skoler om deres egen praksis for standpunktvurdering. Lærernes fortellinger gir et litt annet bilde av arbeid med standpunktkaraktersetting enn tradisjonelle studier av karakterstatistikk gir1.

Fotnote: tradisjonelle studier av karakterstatistikk gir1

Forskningsprosjektet kom i gang etter initiativ og finansiering fra Utdanningsdirektoratet.

Studier av karaktersetting i andre land

Internasjonalt har det lenge vært påpekt at lærere i varierende grad setter karakterer i tråd med anbefalt praksis (). I stedet viser forskning at lærere setter karakter ut fra hva de mener er konsekvensene av karakterer, og at dette noen ganger skjer på bekostning av hva en karakter faktisk betyr. Forskjellen mellom anbefalt og faktisk karaktergivning blir dermed et problem for karakterenes gyldighet (). Det er også pekt på at lærere i karaktersettingsprosessen ideelt sett skal fungere som dommere, men forskning har vist at lærere også inntar rollen som advokat for egne elever når de skal sette karakter. Dommerrollen faller naturlig ved ekstern sensurering, mens advokatrollen i størst grad brukes ved vurdering av egne elever. Advokatrollen synes også å ha en dobbel standard når det gjelder rettferdig vurdering. Brookhart () viser til at gjennomsnittselever «får som fortjent», mens elever under gjennomsnittet «gis mer slakk» om det er noen måte å rettferdiggjøre det på.

Flere forskere har pekt på at det kan være et manglende teoretisk sammenfall mellom hva lærere er anbefalt å gjøre, og hva som gjøres i skolehverdagen (, , , , ). Det er spesielt vanskelig å skille mellom innsats og prestasjon i fag. Når karakterer skal gis, er anbefalt praksis fra skolemyndigheters side å vektlegge prestasjon, og ikke innsats. I norsk sammenheng finner vi dette i revidert forskrift til opplæringsloven, der det er fremhevet at vurdering i fag skal gjøres i forhold til de samlede kompetansemålene i læreplanene for fagene (§ 3-3). Mange lærere opplever imidlertid at det å skille innsats og prestasjon ikke er en relevant anbefaling for klasseromssituasjonen (, , ).

Lærere planlegger undervisning og gir elevene tilpassede læringsaktiviteter slik at vekst og oppnåelse av læringsmål kan skje gjennom veiledning. Innenfor denne logikken blir prestasjonen satt på spill dersom eleven ikke deltar i aktivitetene. På bakgrunn av dette hevder Ariasian og Jones () at læreres beslutninger knyttet til sluttvurdering er del av en større vurderingskontekst. Denne forskningen viser at uformelle vurderinger knyttet til det å rangere elever, planlegge opplegg og undervise i løpet av skoleåret, påvirker de mer formelle vurderingene lærere gjør.

En gjennomgang av 19 forskjellige internasjonale forskningsbidrag om karaktersetting viser at noen bestemte resultater stadig går igjen (). Resultatene er så robuste at Brookhart mener de har overføringsverdi til andre sammenhenger (). Brookhart oppsummerer funnene i fire punkter:

  • Lærere er opptatt av å være rettferdige overfor elever, blant annet ved å informere dem om hvilke krav som stilles for de enkelte karakterer.
  • Måling av prestasjoner, ved hjelp av tester/prøver, er en vesentlig komponent ved karaktersetting, men innsats og evne blir også ofte tatt i betraktning.
  • Det finnes en nivåeffekt i læreres karaktersetting – desto høyere opp i utdanningssystemet, jo mer formelt blir vurderingsgrunnlaget lærere bruker for å sette karakter.
  • Det finnes individuelle variasjoner mellom læreres praksiser for karaktersetting. Ulike lærere oppfatter meningen og formålet med karakterer ulikt, og de vurderer faktorer som kan si noe om prestasjoner ulikt.

Mye av denne forskningen er publisert på 1990-tallet. Forskning fra 2000-tallet synes på mange måter å følge opp problemstillingene fra den tidligere forskningen, men resultatene ses i sammenheng med større utviklingstrekk innenfor vurdering. Ifølge  er situasjonen på 2000-tallet preget av «the assessment reform», som kjennetegnes av spesielt to faktorer: 1) utviklingen av storskalaundersøkelser for testing av elevers kunnskaper og kompetanser og 2) endringer i læreres praksis for vurdering. Endringene omfatter et bredt utbud av nye og annerledes forventninger til læreres kompetanse og praksis på vurderingsfeltet. Fra norsk sammenheng kjenner vi igjen de samme elementene fra innføringen av utdanningsreformen Kunnskapsløftet og revisjonen av forskrift til opplæringsloven i 2009.

Evalueringsforskning på implementeringen av Kunnskapsløftet viser entusiasme på skoleeierog skolenivå rundt innføring av en ny læreplan (LK06), men at innføringen av et nytt «vurderingsregime» skaper en del frustrasjon (). Vårt bidrag i denne sammenheng er å belyse hvordan dette viser seg i praksis for standpunktvurderingen.

Karaktersetting i fem fag i ungdomsskole og videregående opplæring

I våre samtaler med 41 faglærere i fem fag (norsk, matematikk, naturfag, kunst og håndverk/design og håndverk og kroppsøving) har vi søkt informasjon om hva slags grunnlag lærere baserer sine standpunktvurderinger på, og hva som vektlegges når karakteren settes. Vi har også bedt dem om å beskrive hvordan de går frem, og hvilke hjelpemidler eller systemer de bruker når de skal sette endelig standpunktkarakter.

Som utgangspunkt for samtalene med lærere, og som verktøy for analysen av det innsamlede datamaterialet, utviklet vi en modell inspirert av internasjonal forskning. I modellen skiller vi mellom to tilnærminger til karaktersetting, basert på to ulike rettferdighetsprinsipper, den universelle: alle elever behandles likt, og den differensielle: elever behandles ulikt på bakgrunn av om de oppfattes som svake eller sterke. Videre har vi delt inn i tre hovedelementer som lærere kan tenkes å vektlegge når standpunktvurdering gjøres; prestasjon, kunnskap og deltakelse.

Fagene å være mer styrt av læreplanens innhold, samt den enkelte lærers og kollegiets oppfatninger om faget på den enkelte skole.

Tabell 1 Kilde: 2 , basert på og

Universell karaktersetting

Differensiell karaktersetting

Prestasjon

Ferdigheter og mestring; absolutt mål, grad av eller endelig prestasjon definert av læreplandokumenter

Kunnskap

Regler, strategier, konsepter og prinsipper

Deltakelse

Innsats, holdning, oppmøte

I tillegg til modellen har vi tatt i betraktning strukturerende og organiserende rammer for de fem fagene slik de er nedfelt i læreplanverket (LK06) og Grep (https://www.udir.no/om-udir/data/kl06-grep/). Gjennom læreplanens beskrivelser av timefordelingen mellom fagene og de formelle formene for sluttvurdering som er fastsatt, legges det premisser for skolers og læreres arbeid i fag og med vurdering. Gjennomgangen viser at de fem fagene er underlagt ulike premisser når det gjelder timetall, antall hovedområder, tidspunkt for når i løpet faget avsluttes og standpunktkarakter settes, samt tilstedeværelse av eksamen og hva slags eksamen det er snakk om, og hvorvidt eksamen er lokalt eller sentralt gitt og sensurert. 

Fagenes egenart

Våre møter med lærere og skoler vitner om at vurdering står høyt på dagsorden og at utfordringene oppleves som mange og komplekse. I hovedtrekk oppgir våre faglærere en praksis som samsvarer med hva  i fire punkter har oppsummert at lærere i andre land gjør.

Når vi ser alle intervjuene under ett, spiller imidlertid fagenes egenart en overraskende stor rolle. Standpunktkaraktersettingen i fagene norsk og matematikk er sterkt orientert mot tentamen, og eksempler på eksamensoppgaver synes å ha stor innflytelse på vurderingsgrunnlaget til standpunkt. Faglærere i norsk og matematikk bruker Utdanningsdirektoratets eksempeloppgaver for eksamen med sensorveiledninger som utgangspunkt for tentamen på slutten av året. Variasjonene er større i naturfag, kroppsøving og kunst og håndverk/ design og håndverk, som er fag uten sentralt gitt skriftlig eksamen. Ut fra datamaterialet synes disse

Rettferdighet

Lærerne oppfatter noen fag som enklere enn andre når det gjelder rettferdig vurdering. Graden av tolkningsrom ser ut til å være vesentlig i denne sammenhengen. Det oppfattes som lettest å sette rettferdig standpunktkarakter i matematikk og naturfag. I disse fagene oppgir faglærere at de er «poengslaver». Poeng sikrer rettferdig vurdering og gir lite rom for skjønn. Faglærere forteller om en praksis basert på poengberegning og prøveresultater gjennom året, men der en bredere avsluttende prøve avgjør standpunktkarakteren. Faglærere oppgir at det på grunn av fagenes emneinndeling er nødvendig med flere sluttvurderingstidspunkter, og ofte beregnes et «slags» gjennomsnitt av disse når standpunkt skal settes. Faglærerne i begge fagene påpeker at ifølge regelverket skal grunnlaget for standpunkt være kompetanse ved avslutningen av opplæringen (forskrift til opplæringsloven § 3-18), men at dette ikke er like enkelt å gjennomføre i praksis.

Faglærerne i norsk, og kunst og håndverk / design og håndverk bruker ikke poeng, men holder elevenes prestasjoner eller kunnskaper opp mot kompetansemål og vurderer grad av måloppnåelse deretter.

Norskfaget oppfattes som vanskelig å sette rettferdig karakter i. Disse faglærerne håper at de setter så rettferdig karakter som mulig. Både i norsk og kunst og håndverk / design og håndverk er tolkningsfellesskap viktig. Å vurdere sammen med andre lærere i faget sikrer rettferdig vurdering, likevel er faglærerne i norskfaget mindre sikre på at de vurderer rettferdig enn i andre fag.

Faglærere i kroppsøving synes å basere seg på en blanding av vurderinger; testresultater av prestasjoner, dokumentasjon av egentreningsperiode, teoriprøver, deltakelse/oppmøte, innsats i timene, samt holdninger.
Samlet sett viser intervjuene at rettferdighet er viktig, men at det oppfattes som ulike ting. Rettferdig vurdering handler om likebehandling av elever i en gruppe (klassen), på et trinn (mellom grupper/klasser), historisk fra år til år og ikke minst mellom skoler. På grunnlag av dette skiller vi mellom oppfatninger om intern og ekstern rettferdighet i vurdering.

Modell over grunnlag for standpunktvurdering i fem fag

I vår undersøkelse har vi fått interessante beskrivelser av ulike grunnlag for standpunktvurdering, og verktøy for hvordan standpunktkarakterer settes i de fem fagene vi har undersøkt. Blant annet har vi stadfestet at det brukes ulike verktøy i fagene. En tilnærming er å bruke poeng på prøver, noe som avgir et bestemt karakternivå. Tolkningsrommet med denne tilnærmingen oppfattes som lite, hele karakterskalaen brukes og karakterer settes kriteriebasert. Denne tilnærmingen synes i stor grad å ha faste standarder for karaktersettingen. En annen tilnærming synes å være bruk av flere ulike verktøy, basert på definerte kjennetegn på måloppnåelse, vurderingsmatriser eller nedbrutte målformuleringer. Innenfor denne tilnærmingen beskrives tolkningsrommet som større og åpent for stadig forhandling.

Figur 2 En forskningsbasert hypotese om grunnlag og vekting ved standpunktvurdering i fem fag. Kilde: Prøitz og Borgen (2010:116)Disse to tilnærmingene til vurdering av standpunktkarakter kan ses på som ytterpunkter på en akse som definerer grunnlag for standpunktkaraktersetting. Vi har i informantenes fortellinger om egen praksis kunnet identifisere to tilnærminger til rettferdighet kjent fra internasjonal litteratur. Universell karaktergiving handler om å behandle alle elever likt, mens differensiell karaktergiving handler om å behandle elever ulikt etter hvorvidt de er oppfattet som svake eller sterke elever. De to aspektene ved karaktergiving kan betraktes som ytterpunktene på en akse som beskriver grad av universell eller differensiell vektlegging ved standpunktvurdering. Nedenfor presenterer vi en modell der disse to aksene kombineres. Vi har plassert fagene inn i modellen basert på generelle trekk ved standpunktkaraktersettingen slik faglærere har beskrevet dette.

  1. Kunst og håndverk og design og håndverk er i hovedsak preget av en vurderingspraksis basert på et grunnlag for forhandling mellom lærere, kombinert med universell vekting for standpunktkaraktersetting. Samarbeid og utvikling av tolkningsfellesskap står sentralt i standpunktkaraktersettingen. I faget gis det karakter primært for prestasjon, informanter oppgir at «det gjør vondt» å ikke gi elever noe for innsats.

  2. Naturfag er sammen med matematikk i hovedsak preget av et standardisert grunnlag med universell vekting for standpunktkaraktersetting. Naturfag og matematikk har det til felles at de bruker poengsystemer. Poengsystemene gjør at lærerne i stor grad oppgir å gi standpunktkarakterer universelt. Naturfaglærerne synes å være litt mer differensielle i standpunktkaraktersettingen på grunn av bruk av flere kilder som grunnlag, samt at det er mer rom for skjønn. Matematikklærerne er sammen med lærerne i kunst og håndverk og design og håndverk de mest universelt orienterte av informantene vi har snakket med.

  3. Norskfaget er i hovedsak preget av et grunnlag for forhandling kombinert med differensiell vekting for standpunktvurdering. Norskfagets informanter oppgir at karaktersetting i faget er basert på en del skjønn. Likevel, norsklærerne oppgir at de arbeider etter vurderingsmatriser, kriterier og nedbrutte målformuleringer, mens kompetanseoppnåelse er et stadig tema for forhandling mellom lærere i faget. Faget har sentralt gitt skriftlig eksamen, noe som synes å ha en betydningsfull rolle i forhandlingen om hva en god prestasjon er. Informantene i norskfaget oppgir at de sjelden eller aldri gir karakteren 1, og at de jakter på 2-erkandidater fordi alle kan noe i norskfaget.

  4. Kroppsøvingsfaget er i hovedsak preget av forhandlet grunnlag med standardisert vekting for standpunktvurdering. Informantene i faget oppgir å sette standpunktkarakter etter målbare standarder for hva en god prestasjon er, eksempelvis ved tester av ferdigheter, som ved løping på tid. Samtidig åpner informanter i faget for bruk av skjønn i dialog med eleven. Lærerne i dette faget er de som i størst grad oppgir å legge vekt på elementer som innsats, deltakelse og oppmøte for alle elever når de setter standpunktkarakter.

Modellen viser at faglærere vi har snakket med, har det til felles at de benytter seg av ulike verktøy når de setter standpunktkarakter for sine elever. Når vi spør faglærere om hva slags grunnlag de har for standpunktkaraktersetting i ulike fag, tyder svarene på at det varierer. Samtidig er det tydelig at det med hvert fag følger noen overordnede oppfatninger om hva som er god vurderingspraksis i faget. Vi anser modellen som en forskningsbasert hypotese for videre undersøkelser om vurdering i opplæringen.

Lærere ønsker sentrale retningslinjer

Fagenes egenart har betydning, men det er også likheter mellom de fem fagene. Når vi spør lærerne om det er noe de ønsker seg av støtte eller hjelp i arbeidet med standpunktvurdering, etterspørres tydeligere retningslinjer. Faglærerne oppgir at de stort sett er sikre på egen vurderingspraksis, men de er bekymret for at læreren i naborommet, på et annet trinn eller på en annen skole setter standpunkt på et annet grunnlag. Bekymringen handler om hvorvidt elever får rettferdige karakterer til standpunkt i regionen og i landet. Blant annet er ungdomsskolelærere opptatt av at elever i en region kan ha ulike konkurransevilkår når de søker seg til samme videregående skole.

Lærerne mener at retningslinjer bør komme fra sentralt eller regionalt hold. Uansett er faglærerne opptatt av at etablering av et tolkningsfellesskap som skal fremme lik og rettferdig standpunktvurdering må strekke seg utover egen skole, helst være innenfor fagenes rammer og gjerne på tvers av skolenivå. Materialet i denne undersøkelsen tyder på at sentrale og regionale myndigheter har en jobb å gjøre i samarbeid med faglærere for å fremme arbeidet for god standpunktvurdering.

Litteraturhenvisninger

Arasian, P. W. & A.M. Jones (1993). The teacher as applied measurer: Realities of classroom measurement and assessment. Applied Measurement in Education, 6 pp 241–254

Brookhart, S.M. (1991). Letter: Grading practices and validity. Educational Measurement: Issues and Practice, 10(1), pp. 35–36

Brookhart, S.M. (1994). Teachers` Grading Practices: Meanings and Values. Journal of Educational Measurement. Vol. 30, No. 2, pp 123–142  

Brookhart, S.M. (2005). Developing Measurement Theory for Classroom Assessment Purpose and Uses. Educational Measurement: Issues and Practice. Vol 22 Issue 4 pp 5–12

Duncan, C.R. & Noonan, B. (2005). Factors Affecting Teachers’ Grading and Assessment Practices. The Alberta Journal of Educational Research Vol. 53, No. 1, Spring 2007, 1–21

Guskey, T.R. (2006). “It Wasn`t Fair!» Educators` Recollection of Their Experiences as Students with Grading. Paper presented at the Annual Meeting of the American Educational Research Association, San Francisco, CA 

Melograno, V.J. (2007). Grading and Report Cards for Standards-Based Physical Education. Journal of physical education, recreation and dance. Vol 78, No 6 pp. 45–53

Møller, J., Prøitz, T.S. og Aasen, P. (red.) (2009). Kunnskapsløftet – tung bør å bære? NIFU STEP 42/2009

Prøitz, T.S. & Borgen, J.S. (2010) Rettferdig standpunktvurdering – det (u) muliges kunst? NIFU STEP rapport 16/2010

Resh, N.  (2009). Justice in grades allocation: teachers’ perspective. Social Psychology of Education. Vol 12, No 3 pp 315–325

Stiggins, R.J., & Conclin, N.F. (1992). In teachers` hands: Investigating the practices of classroom assessment. Albany: SUNY Press