Fagartikkel

Ulike sider ved elevvurdering - Noen prinsipielle betraktninger

Å utvikle bindende nasjonale kjennetegn på måloppnåelse er vanskelig. Samtidig kan skoler som arbeider systematisk med å utvikle prinsipper for vurdering, rapportere om økt bevissthet og faglige løft. Elevvurdering har mange aktører og interesser, og det er derfor viktig at vi nå legger motsetninger til side og ﬁnner gode grep for å håndtere dette feltet.

Forfatter

Publisert 22.02.2010

Klassekampen trykket 6. desember 2007 en kronikk av Peder Haug: «Kva gjekk gale i skulen?» Ifølge ingressen sier Haug at «venstresidas pedagogikk har gjort skulen kunnskapsfiendtleg.» Det er kanskje ikke en helt korrekt gjengivelse av det Haug sier, men han er utvetydig i det at fremveksten av «ein bestemt reformpedagogisk retning» var «eit giganteksperiment» der «ideologien ikkje heldt det han lova». Sterk kost fra den kanten.

Bakgrunnen for kronikken er at Peder Haug hadde en sentral rolle i det store evalueringsprosjektet der Reform 97 skulle evalueres, blant annet sammenfattet han en hovedrapport bygget på en lang rekke delrapporter. Kronikken bygger på dem. Evalueringen av R-97 er det første større evalueringsprosjektet av norsk skole. Prosjektet hadde både sterke og svake sider. Jeg var involvert i planleggingen av R-97 og jaktet på evalueringer av M-87. Det var vanskelig å finne. Det nærmeste jeg kom var en vurdering gjort av Karl Jan Solstad, men der var ideen å se på skolepraksis i lys av noen av de ideologiske grunnprinsippene i reformen – ikke å foreta en vurdering av effektene.

Dette faller inn i en tradisjon i norsk skoleutvikling og skolevurdering der det er måter å organisere skolen og undervisningen på som har vært i fokus – og der en har vurdert prosjektene uavhengig av de læringsresultater elevene har oppnådd. Da skjønner en at det blir spesielt alvorlig når «ideologien ikkje heldt det han lova». Og en skjønner at det kunne bli vanskelig for skolesjefen i Hå som bombastisk kastet tavlene ut av klasserommene, men seinere måtte stå til ansvar for svake resultater i nasjonale prøver.

God planlegging – dårlig oppfølging

Allerede i OECD-rapporten fra 1988 ble det pekt på at norsk skolepolitikk bygget på en gjennomtenkt filosofi og hadde grundige plandokumenter, men at det var overraskende å konstatere hvor lite kunnskap politikere og offentlighet hadde om oppfølgingen. Kirke-, utdannings- og forskningsdepartementet satte i gang EMIL-prosjektet med den hensikt å utvikle et nasjonalt vurderingssystem. Resultatet ble bare en artikkelsamling: Utdanningskvalitet – styrbar eller ustyrlig. Interessant nok – men symptomatisk for det som skulle bli den norske «virkeligheten»: en uendelighet av forsøk og debatter om hvorfor, hva og hvordan. Stadier på veien er St.meld. nr. 47 (1995-96), innstillingen fra det såkalte Moe-utvalget som ble oppnevnt fordi Stortinget var misfornøyd med St.meld. 47, St.meld. nr. 28 (1997-98) Mot rikare mål (Lilletuns melding), Kvalitetsutvalgets to utredninger, osv. I internasjonal sammenheng er den norske debatten nokså spesiell – ikke minst fordi den har en tendens til å gå i sirkler. Seinest 5. september 2009 siteres Ragnvald Thilesen ved Høgskolen i Oslo slik: «Jeg er helt sikker på at norske skoleledere er utmerket i stand til å summere opp hva de er sterke på og hva de trenger å forbedre seg på og lage en plan for disse forbedringene» (NRK nyheter). Mange forskningsrapporter og andre undersøkelser tyder nå etter hvert på det stikk motsatte. Blant annet har fylkesmennenes tilsynsrapporter pekt på store mangler i skoleledelsen.

Men hvorfor så mye om et nasjonalt vurderingssystem i en artikkel som først og fremst skal drøfte elevvurdering? Elevvurdering vil alltid måtte være en viktig integrert del av et nasjonalt vurderingssystem. Debatten om et nasjonalt vurderingssystem har derfor også preget synspunktene på elevvurdering isolert sett, jf. debatten om PISA, TIMSS og nasjonale prøver. Det har derfor vært vanskelig å komme i gang med en god debatt om arbeidet med elevvurdering. Det er også et særtrekk ved norske læreplaner at de ikke sier noe om evalueringen. Med unntak av Stortingets utmerkete behandling av den delen av St.meld. 47 som omhandlet elevvurdering, er Utdanningsdirektoratets prosjekt «Bedre vurderingspraksis» det første praktiske skritt i riktig retning. Sluttrapporten viser samtidig at det gjenstår mye både debatt og arbeid. Den kommer jeg tilbake til. Siden elevvurdering inngår som en del av både lokale, nasjonale og internasjonale systemvurderingskonsept, viser det klart at bruk av elev vurdering må sees i ulike perspektiv. Det er det jeg skal prøve å si noe mer om nedenfor.

Jeg skal konsentrere meg om to innfallsvinkler som henger sammen: For det første skal jeg se på elevvurdering i det en kan kalle et interessent- eller aktørperspektiv («stakeholders»). For det andre skal jeg ta utgangspunkt i noen definisjoner av kvalitet. Det spennende er når en kombinerer de to innfallsvinklene.

Mange behov for vurdering

Enhver vurdering må planlegges ut fra svar på disse spørsmålene:

Hvem skal vurdere?
Hvorfor skal det vurderes?
Hva skal vurderes?
Hvordan skal det vurderes? Hvilke metoder og kriterier skal vi bruke?
Hvilke vurderingsuttrykk skal vi bruke?
Hvordan skal vurderingsresultatene brukes?

Svaret på det første spørsmålet styrer svarene på de fem siste. Staten eller skoleeiere har behov for styringsdata og legger opp vurderingen etter det. Lærere har også behov for «styringsdata» i sin klasseledelse, men de må være av en annen karakter. Det er derfor meningsløst med en debatt der en setter nasjonale prøver opp mot for eksempel «mappevurdering».

Skolen befinner seg i et spenningsfelt som vi kan illustrere som vist på figuren. Jeg prøver å skille mellom legitime aktører med formelle posisjoner i systemet og mer uformelle.

Skolen er underlagt politisk styring og har et oppdrag fra offentlige myndigheter. Det må være åpenbart at det medfører en overordnet rett til å fastsette rammer, prinsipper og hovedmål, og behov for innsikt i og kunnskap om det som foregår i skolen, særlig sett i lys av overordnede prinsipper og mål.

Elevene har særlig siden iverksettelsen av opplæringsloven i 1998–99 fått styrket sine juridiske retter. De formelle rettighetene kommer i tillegg til metodiske betraktninger som peker på at læringen bedres når eleven er aktiv deltaker i læringsprosessene.

Lærerne har en vanskelig rolle. De har et profesjonelt ansvar for å arbeide etter det oppdrag offentlige myndigheter gir og dessuten tilpasse det ut fra den enkelte elevs rettigheter. Det vanskelige består i å definere rammene for det profesjonelle ansvaret. I det offentlige rom opererer dessuten organisasjoner, institusjoner, media, næringsliv osv. Dette er parter som også har synspunkter på skolen, rimelig nok. Jeg har sterk sans for Kristin Clemets demokratiargument: Skolen er i høyeste grad et offentlig anliggende, og den demokratiske deltakelse i drøfting av skolespørsmål forutsetter at offentligheten har et minimum av innsikt i det som foregår.

Lærerens profesjonelle ansvar

Tilbake til lærerne. Sannsynligvis er det helt umulig å gi en entydig definisjon av hva det profesjonelle ansvaret omfatter. Problemene oppstår når en skal se på forholdet mellom politisk styring og profesjonell oppfølging. Mange lærere har sterke synspunkter på hva som gagner barn og hva som er en god skole. Alle debatter om læreplaner og vurdering viser det. Det er en selvfølge at lærere forsøker å ivareta barns beste i skolen. Men hva er «barns beste»?

Det som er «barns beste», henger i siste instans sammen med syn på samfunnet og samfunnets utvikling, med syn på grunnleggende livssynsmessige og etiske verdier. Synet på hva som er «barns beste» kan derfor egentlig bare avgjøres innenfor en ideologisk-politisk kontekst. På mange måter er det blitt lettere for oss å se dette etter at de flerkulturelle dimensjonene i Norge er blitt mer synlige.

Figur 1

Lærerens nesten umulige oppgave er dermed å holde orden på når hun opptrer profesjonelt og når hun opptrer politisk. Begge deler er relevant, og landet er avhengig av at ikke minst lærere deltar i debatten om hva som er barns beste. Men disse to debattene må inngå i atskilte prosesser. Som en skolesjef en gang sa til meg i et møte: «Du mener altså at vi må prøve å skille mellom diskusjoner om hvordan vi skal prøve å følge opp Kunnskapsløftet på den ene side, og hvorvidt Kunnskapsløftet er bra for barn, på den annen?» Og det er akkurat det jeg mener! Det kan bli slitsomt dersom enhver debatt på lærerværelset ender opp i en heftig runde om hvorvidt Kunnskapsløftet er bra for barn. Et stykke på vei må en derfor arbeide med den forutsetning at skolepolitikk er, ja nettopp, politikk. Grunnskolen er obligatorisk og innbyggerne har i vårt demokratiske system inngått en samfunnspakt der Stortinget på våre vegne får legge de grunnleggende premisser og mål. Men det betyr ikke at lærerne skal opptre som robotliknende «funksjonærer», som noen fryktet, spesielt i Hernes' statsrådsperiode. Tvert imot burde kanskje lærerne vært enda mer synlige i den langsiktige politiske debatten om skolen.

Definisjonen på kvalitet

Det er sterke underliggende spenninger i dette aktør- eller interessentperspektivet. Skolen er som andre deler av samfunnet preget av strid om makt og hegemoni. Å styre vurderingspraksis kan være et viktig strategisk maktmiddel, noe ikke minst Dahler-Larsen har pekt på.

Disse dilemmaene blir enda tydeligere når vi begynner å lete etter en definisjon av begrepet kvalitet. All vurdering må ha et vurderingsgrunnlag – noe å sammenligne med, noen kriterier eller indikatorer som er knyttet til det syn vi har på kvalitet. De fleste definisjonene vi finner er klart normative og trekker fram substansielle forhold ved opplæringen. Både det såkalte Mjøs-utvalget (NOU 2000: 14, kapittel 7) og Kvalitetsutvalget (NOU 2002: 10, kapittel 3) hadde spennende kapitler om begrepet kvalitet.

Kvalitetsutvalget etablerte en analytisk begrepsgruppe som i utgangspunktet er verdimessig nøytral: Ressurskvalitet, prosesskvalitet og resultatkvalitet. Jeg skal trekke fram en annen definisjon som også har den fordel at den er nøytral. Den er hentet fra ISO 9000 – den internasjonale standardiseringsorganisasjonen: «Egenskapene hos et objekt eller en foreteelse som er egnet til å tilfredsstille uttalte eller underforståtte behov.» (Her gjengitt fra Skolverkets rapport 150, Kvalitetssäkring i skolan.) Poenget med denne definisjonen er at den gjør kvalitet til et relativt begrep. Det er bakgrunnen for at kvalitetssikringssystemer i dag gjerne har med brukerundersøkelser 1.

Figur 2

Nasjonens problem eller elevens problem?

Aktørperspektivet i vurderingsarbeid er viktig, fordi kvalitetsoppfatningen varierer med aktørene. Slik sett er det logisk at staten legger sine mål inn i vurderingene, mens andre aktører har andre. Skolen er dessuten så mangfoldig i sin virksomhet at den til en viss grad kan romme ulike prioriteringer uten å sprenges. I et analytisk perspektiv er det vesentlig å få dette fram – til tider kan det ha liten hensikt å krangle om «hva kvalitet er». La oss illustrere dette gjennom elevperspektivet.

I den norske presentasjonen av resultatene fra PISA 2003 finner vi den velkjente figuren nedenfor om nordiske elevers prestasjoner. Den viser blant annet at norske elever presterer svakest i matematikk. Så kan vi spørre: Hvem er dette et problem for? Det er opplagt et problem for nasjonen fordi vi er avhengig av kompetanse i mange sammenhenger.

Det offentlige har derfor satt i gang mange tiltak for å styrke resultatene i matematikk. For den enkelte elev som skårer svakt, fortoner det seg kanskje annerledes. Jeg har spurt mange elever med svake matematikkresultater hva de mener. Ofte svarer de at de ikke bryr seg fordi de skal gjøre som John Arne Riise, Tone Damli Aaberge eller Lene Alexandra og slå igjennom i idrett-, pop- eller moteverdenen.

I en fysikktime på Katedralskolen i Trondheim utbrøt i sin tid fysikklæreren min til en av mine medelever etter en middelmådig opptreden ved tavla: «Du kan ikke få M i fysikk på denne måten!» Så svarer eleven: «Kanskje er det noen som ikke synes det er så viktig med M i fysikk?» Det ble krevende for fysikklærerens forestillingsverden. Skal lærerne kunne gjøre noe med dette, må de arbeide med motivasjon og holdninger – da hjelper verken PISA eller nasjonale prøver. Om en prøver å sammenfatte det som er sagt ovenfor, må det bli at elevvurdering inngår i ulike sammenhenger og må ses på ut fra det. Vi må leve med at ulike aktører har ulike roller og til en viss grad ulikt syn på hva som er viktig, men at dette må forenes på best mulig måte innenfor de rammer lov og læreplan setter. Slik sett fins ikke et arkimedisk punkt for vurdering av skolens «kvalitet».

Litt forenklet kan en si at elevvurderingen kan klassifiseres i tre bokser. Oppstillingen i figur 3 tar utgangspunkt i en presentasjon av professor Kari Smith for Det nasjonale evalueringsutvalget (NELVU).

Figur 3

Nasjonalt (internasjonalt)	Kontekstorientert "Lokal læreplan"	Individorientert Tilpasset opplæring
Målorientert, komparativt summativt, sertifisering	Målorientert, lokalt komparativt, formativt	Basert på individuelle mål: «diagnostiserende», formativ, kriteriene orientert mot det faglig formative og motivasjon selvoppfatning læringsstrategier
Standardisert, objektivt, kontrollerbart, rett ferdig	Prosessorientert, gruppesensitivt, lærerbasert og delvis elevbasert	Elevsensitiv Hensyn til elevens forutsetninger
Eksamener/kartlegginger	Eksempel: mappevurdering Lokal bruk av nasjonale prøver mv.	Testmateriell, mappevurdering

En kan i og for seg bruke ulike evalueringsmetoder innenfor alle de tre perspektivene. Nasjonale prøver kan ha en funksjon i alle de tre sammenhengene om de er faglig egnet til det. Det vesentlige er at det er tolkingen og oppfølgingen som vil variere. Lærernes utfordring i dag er først og fremst å bli mer profesjonelle i sitt løpende vurderingsarbeid. Nedenfor er listet opp noen synspunkter fra delrapportene i vurderingen av Reform-97, PISA og TIMSS-rapportene og fra noen av artiklene i Elevvurdering i skolen, redigert av Sverre Tveit (Universitetsforlaget 2007):

Vurderingen i barneskolen er for upresis og usystematisk – ikke forankret i tydelige læringsmål (Klette)
Standpunktkarakterene er lærer- og skoleavhengige, gir en urettferdig fordeling. Dominerer for mye – tar oppmerksomheten vekk fra den løpende, formative vurdering. Gjør elevene kortsiktig prestasjonsorientert – virker negativt på den langsiktige læring (Lauvås og Sverre Tveit)
Misforstått målorientering uten perspektivet «tilpasset opplæring» (Dale og Wærness)
Norsk skole mangler kompetanse i å lage hensiktsmessig vurderingsmateriell (problemer både med validitet og reliabilitet – Svein Lie)

Samtidig sier forskriften til opplæringslova § 3-2:

Formålet med vurdering i fag er å fremje læring undervegs og uttrykkje kompetansen til eleven, lærlingen og lærekandidaten undervegs og ved avslutninga av opplæringa i faget. Vurderinga skal gi god tilbakemelding og rettleiing til elevane, lærlingane og lærekandidatane. Undervegsvurdering skal brukast som ein reiskap i læreprosessen, som grunnlag for tilpassa opplæring og bidra til at eleven, lærlingen eller lærekandidaten aukar kompetansen sin i fag. Sluttvurderinga skal gi informasjon om kompetansen til eleven, lærlingen og lærekandidaten ved avslutninga av opplæringa i faget.

Og i paragraf 3–1 sies det at «det skal vere kjent for eleven, lærlingen og lærekandidaten kva som er måla for opplæringa og kva som blir vektlagt i vurderinga av hennar eller hans kompetanse og åtferd.»

Det som er nytt og spesielt utfordrende, er at vurderinga skal bidra til at eleven øker fagkompetansen sin. Det skilles også klart mellom det å gi vurdering i fag og i orden og oppførsel. Dermed er det, i det minste formelt, satt en foreløpig sluttstrek for den forskjellsbehandling som har foregått med bakgrunn i elevenes ulike forutsetninger og som til en viss grad har ført til at såkalte «svake elever» under dekke av en misforstått forståelse av begrepet tilpasset opplæring, er blitt møtt med for uklare faglige krav (jf. bl.a. Dale og Wærness i Vurdering og læring i en elevaktiv skole, Universitetsforlaget 2006).

Prosjektet «Bedre vurderingspraksis» har tatt tak i noe av dette. Sluttrapporten er interessant. Den konstaterer for det første det en kunne vente på forhånd: Å utvikle bindende nasjonale kjennetegn på måloppnåelse er vanskelig. Det kan komme til å bli omfattende. Samtidig oppstår det vansker i den løpende vurderingen: Kan kjennetegn som er myntet på sluttvurdering uten videre også anvendes underveis? Må ikke kjennetegnene tilpasses den kontekstuelle læringssituasjonen?

Om å ta kompleksiteten på alvor

Samtidig er deltakerskolenes rapporter nesten entydige i det at arbeidet har løftet dem faglig. Gjennom arbeidet med kjennetegn har de måttet analysere faget mye grundigere enn tidligere. De har lett etter sammenhenger mellom faglige elementer og drøftet hvordan disse elementene skal komme til uttrykk gjennom læringsprosessen. Med andre ord er det tydelig at lærerne har fått et fagdidaktisk løft som helt sikkert vil komme elevene til gode.

De samme erfaringene gjør mange lærere som har deltatt i kursing om hvordan en skal vurdere nasjonale prøver. Elevvurdering som tema har på mange måter vært pedagogenes felt. Gjennom prosjektet er faglærerne kommet på banen. Selv innenfor lærerutdanningen ved HIST, der jeg har undervist i pedagogikk noen år, har lærere i andre fag uttrykt usikkerhet når en skulle drøfte «vurdering». Lærere vurderer elever (og studenter) hele tida, men for mange er dette «taus kunnskap» som ikke er formulert og brakt ut i lyset.

Prosjektet viser at lærere kan. Her dreier det seg mye om selvtillit. Skal en oppnå forskriftens mål om at vurdering skal bidra til økt fagkunnskap, er denne linja nå kanskje den viktigste. Samtidig kjenner alle som har gjennomgått lærerutdanning og undervist til at motivasjon, selvfølelse og holdning til fag er avgjørende for læring. Jeg innledet med å trekke fram Peder Haugs artikkel i Klassekampen. Den dreide seg egentlig lite om elevvurdering. Den pekte på andre svake sider ved skolen, som misbruk av tidsressurser, uro og uheldig oppløsning av klassefellesskapet. Altså forhold som Kvalitetsutvalget ville katalogisert under «ressurskvalitet» og «prosesskvalitet».

Dette understreker at vurdering er en sammensatt affære. Det jeg vil slå et slag for, er at vi nå med friske øyne ser på kompleksiteten i vurderingsarbeidet, legger bort noe av polemikken og fordyper oss mer i få bedre grep på de ulike sidene ved den.