Lærervurdering – en krevende øvelse

Lærervurdering har blitt et aktuelt tema i norsk utdanningspolitikk. Spørsmålet er hvordan en ordning med lærervurdering skal innrettes for at ordningen skal ha gunstige virkninger for norsk skole.

Mange land (for eksempel Portugal, USA, Chile, Flandern i Belgia) har iverksatt nasjonale ordninger med lærervurdering i den hensikt å forbedre undervisningen. Norge er ett av få OECD-land som i dag ikke har nasjonale reguleringer for lærervurdering (Isoré, 2009; Nusche mfl., 2011). Derfor har OECD anbefalt norske utdanningsmyndigheter å inkludere lærervurdering som en av komponentene i det nasjonale systemet for kvalitetsvurdering. (Nusche mfl., 2011). OECD tilrår å styrke lærervurderingen som «developmental appraisal». Arbeidet med å utrede nasjonale retningslinjer for en ordning med lærervurdering er nå igangsatt. En arbeidsgruppe der både representanter fra interesseorganisasjoner for elever, pedagogikkstudenter, lærere, skoleledere og kommunene er med, har kommet fram til forutsetninger for å innføre en nasjonal ordning med lærervurdering.

Utdanningsmyndighetene har tatt initiativ til en forskningskartlegging av hva slags former for lærervurdering som kan ha positiv innvirkning på skolens kvalitet. Denne kartleggingen konkluderer med at «medvirkning er nødvendig for at lærervurdering skal lykkes» (Lillejord mfl., 2014). Det betyr at arbeidet med lærervurdering må ha en lokal forankring. Videre sier denne rapporten at «De skoler eller kommuner som klarer å vektlegge læreres profesjonsutvikling i arbeidet med vurderingen, får bedre resultater enn de som lar arbeidet bli for dominert av skjema, kontroll og byråkrati». Formålet med denne artikkelen er å drøfte hva lærervurdering er, hva formålene kan være, hva nyere forskning sier om lærervurderingens effekter og hva som bør være forutsetninger for at lærervurdering kan fungere på en konstruktiv måte.

Hva er lærervurdering?

Dagens ordning med undervisningsevaluering (Utdanningsdirektoratet, 2013) innebærer blant annet at elevers tilbakemelding om lærerens undervisning og elevens eget læringsarbeid vil være sentrale komponenter. Undervisningsevaluering er ment å brukes på regulær basis. Lærervurdering er imidlertid noe mer enn undervisningsevaluering.

Lærervurdering innebærer at en annen part – en kyndig veileder som kan være en skoleleder eller en kollega eller en ekstern ekspert – vurderer lærerens arbeid og gir tilbakemelding som har en forbedringshensikt. Det vil bety at flere informasjonskilder – for eksempel undervisningsvurdering, kollegaobservasjon, observasjoner gjennom skolevandring – kan tas med i en samlet vurdering og eventuelt gi grunnlag for å støtte opp under læreres profesjonelle utvikling gjennom veiledning. Omfanget av dette arbeidet tilsier at lærervurdering ikke kan gjennomføres ofte. I for eksempel Flandern gjennomføres ordningen med lærervurdering hvert fjerde år. Dersom tilbakemeldingen er god, kan vurderingen ha positiv betydning for lærerens videre arbeid med sin undervisning og profesjonelle utvikling. Men tilbakemeldinger kan også ha utilsiktede virkninger. Frykten for andres dom over egen undervisning kan føre til en defensiv innstilling til lærerarbeidet, for eksempel at man blir forsiktig med å prøve ut nye ideer (Firestone, 2014). Det er med andre ord slett ikke opplagt at lærervurdering fører til forbedring. Ikke minst avhenger dette av hensiktene med lærervurdering.

Hvorfor lærervurdering?

I en av klassikerne fra 1970-tallets lærerforskning brukes ordet eggekartongstruktur som betegnelse på læreres arbeidssituasjon (Lortie, 1975). Det betyr at den enkelte lærer typisk har sitt virke alene med sine elever.


Det er slett ikke opplagt at lærervurdering fører til forbedring.

 

Situasjonsbetingelsene tilsier begrenset profesjonell interaksjon i undervisningssituasjoner med andre lærerkollegaer. I dagens Skole-Norge vil det nok være mer hyppig profesjonell kontakt mellom lærere enn det Dan Lortie kunne observere i amerikanske skoler, for eksempel gjennom samarbeid om undervisningsplanlegging og etterarbeid. TALIS-undersøkelsen fra 2013 viser at de fleste lærere i de landene som er med i undersøkelsen, fortsatt arbeider hovedsakelig i isolasjon og sjelden i team med andre lærere. Derfor trenger også lærere tilbakemelding fra kompetente veiledere for at den enkelte lærer skal kunne utvikle seg. En slik ordning kan også omfatte samarbeid mellom lærere.

Norge ligger omtrent på det internasjonale TALIS-gjennomsnittet når det gjelder andel av lærere som ikke har mottatt tilbakemelding på det arbeidet de utfører. 16 % av et representativt utvalg av norske lærere sa i 2013 at de aldri har mottatt tilbakemelding om sin profesjonelle jobb. 57 % har fått tilbakemelding fra kollegaer, mens 45 % har fått tilbakemelding fra rektor, 44 % har fått tilbakemelding fra eksempelvis avdelingsledere, og 10 % har fått tilbakemelding fra eksterne eksperter (Carlsten mfl., 2014). Ut fra disse tallene vil det være en overdrivelse å si at det mangler en tilbakemeldingskultur i norsk skole. Men alt kan bli bedre, og gode ordninger for veiledning og utviklingsarbeid kan nettopp bidra til å forbedre tilbakemeldingskulturen. Oppleves tilbakemeldingen som nyttig av læreren, vil potensialet for profesjonell vekst være til stede.

Lærervurderingens hensikter

Lærervurdering er i seg selv ingen trylleformel for skoleforbedring. Måten lærervurdering er innordnet på, vil kunne influere hvordan de som i første omgang skal lære, lærerne, forholder seg til vurderingens tilbakemelding. I neste runde kan lærervurderingen ha betydning for lærerens arbeid og således også elevenes læringsprosess. Alle kan ha nytte av god veiledning, men lærernes behov for tilbakemelding fra en kompetent veileder vil være forskjellig. Erfaringer fra Flandern viser at lærere i de første praksisårene har større nytte av vurdering med tilbakemelding enn det mer erfarne lærere har (Delvaux mfl., 2013). Syklusen i læreres profesjonelle utvikling er i samsvar med denne forskjellen: med årelang erfaring fester det seg handlingsmønstre som over tid blir etablerte vaner (Huberman, 1989). Lærere er således mer formbare i de første årene i sin yrkeskarrière enn lærere med mange års erfaring. Derfor er det i de første årene av yrkeskarrièren at tilbakemeldinger har størst potensial for å kunne ha en gunstig støttende virkning for den enkelte lærers profesjonelle vekst. Men alle mennesker kan ha nytte av konstruktive tilbakemeldinger og utviklende samtaler (Clutterbuck, 2004). Det gjelder erfarne lærere så vel som nyutdannede lærere. Delvaux mfl., 2013 viser at kvaliteten på tilbakemeldingen (altså veilederens profesjonalitet i praksis) samt veilederens innstillinger til vurderingsordningen er to viktige vilkår for at en ordning med systematisk lærervurdering skal kunne fungere godt. Annen forskning legger vekt på at utviklingsorientert veiledning har mer positiv innvirkning på innstillingene til den som blir veiledet enn såkalt bedømmende tilbakemelding (Hobson & Maldivez, 2013).

Det finnes også en kontrollerende og insentivbasert variant av lærervurdering som baserer seg på prestasjonsmålinger, hovedsakelig av elevers læringsframgang («value added») eller elevtilfredshet (ev. foreldretilfredshet). Målingene av læringsframgang vil forutsette pålitelige og holdbare målinger av elevprestasjoner før og etter et skoleår (Koretz, 2008). (Å sammenligne skoleklasser gjennomsnittskarakterer er i derimot ikke måleteknisk tilfredsstillende for å kunne trekke slutninger om undervisningskvalitet, Christophersen mfl., 2010).


Skal læreren stå til ansvar for hva elevene lærer, må læreren også ha et maktgrunnlag som samsvarer med ansvaret.


Målinger av læringsframgang krever et forholdsvis stort antall målinger som vi ikke har tradisjon for i norsk skole (men målinger av for eksempel læringsframgang på nasjonale prøver på 8. og 9. årstrinn kunne i prinsippet brukes på denne måten). Dersom slike målinger på skoleklassenivå og/eller lærernivå foreligger som en lærerbidragsindikator, vil noen kunne si at lærere kan potensielt ansvarliggjøres for sin profesjonelle jobb som lærer. «Lærerne skal få et klart ansvar for hva elevene lærer i skolen» sa tidligere statsminister Jens Stoltenberg i nyttårstalen for 2008. Spørsmålet er hva som skal være rekkevidden for lærerens ansvar. Skal læreren stå til ansvar for hva elevene lærer, må læreren også ha et maktgrunnlag som samsvarer med ansvaret. Det hefter for øvrig store faglige kontroverser til spørsmålet om «value-added» målinger kan brukes som verktøy for «teacher accountability» (Lillejord mfl., 2014).

I en helt fersk metastudie av lærervurdering i USA som baserer seg på å ansvarliggjøre lærere på grunnlag av målinger av elevers læringsframgang, konkluderer forskerne med at de ikke finner noe klart evidensgrunnlag for at lærervurdering som har til hensikt å ansvarliggjøre lærere for læringsresultater har effekt (Hallinger mfl., 2014). Derimot argumenterer disse forskerne for at skoleledere kan lykkes bedre dersom deres innsats heller rettes mot undervisningsledelse og skoleinterne prosesser som drives nedenfra og opp i stedet for et lærervurderingssystem som ikke har dokumenterbar effekt. Andre lærervurderingssystemer legger vekt på å kombinere formålet med å ansvarliggjøre lærere og utviklingsorientert støtte for å bidra til profesjonell vekst (Delvaux mfl., 2013). Målinger har imidlertid en iboende sprengkraft ved at de kan brukes til noe langt mer enn det de opprinnelig var ment til. Faktisk kan «accountability»-hensikten helt fortrenge den utviklingsorienterte hensikten med lærervurdering. Kunnskapssenterets rapport hevder at «problemene ser ut til å oppstå når nasjonale intensjoner skal iverksettes lokalt» (Lillejord mfl., 2014).

Vurderingens egenart

Det som vurderes, kan være selve undervisningen (lærerens undervisningsfaglighet, klasseledelse m.v.), undervisningens forarbeid og etterarbeid (for eksempel den enkeltes bidrag til fagseksjonens arbeid: undervisningsplanlegging, elevvurdering). Noen velger å innarbeide et nøye utvalgt eksempelmateriale i en såkalt portefølje eller mappe som kan romme både tekster (for eksempel undervisningsplaner) og videoopptak av undervisning. I en omfattende satsning på lærerevaluering i Chile ble lærermapper brukt som informasjonsgrunnlag for evaluering.

Det kan i prinsippet også inngå tilfredshetsmålinger i lærervurderinger. Hensynet til elevtilfredshet og foreldretilfredshet er på ingen måte uvedkommende for norske lærere og skoleledere, men tilfredshet kan nøre opp under læreratferd som «loser» elevene gjennom skolehverdagen. Tilfredshetsmålinger kjenner vi også fra forbrukerundersøkelser. God læring i en «skolsk» kontekst vil kreve at den lærende strekker seg i læringsprosessen, noe som innebærer noe annet enn tilfredshet med lærerens «performance». Det er et uavklart spørsmål om hvorvidt konsumenttilfredshetsdimensjonen kan bidra til å fordreie læringsmodus fra ytelsesorientering til konsumenttilfredshet (Garmannslund mfl., 2009). Det finnes i dag tilfredshetsbarometre som er fremskaffet på initiativ fra elever (for eksempel minlarer.no i Norge, spickmich.de i Tyskland og Epuls.pl i Polen). Felles for disse websidene er at alle kan på anonymt grunnlag sende inn «karakter» og bedømmelse av lærere og at disse omtalene eller karakterene kan leses av alle. Fenomenet omfatter også mange andre yrkesgrupper, for eksempel leger og tannleger. Forskning viser at lærere er mer reservert mot denne typen målinger og omtaler enn for eksempel elever og lærerstudenter. Videre er eldre lærere mer reservert enn yngre lærere, og kvinner er mer reservert enn menn (Hinz, 2011). I den politiske plattformen for en regjering utgått av Høyre og Fremskrittspartiet heter det at «Regjeringen vil la elevene i den videregående opplæringen evaluere undervisningen». Foreløpig vet vi ikke hvordan det tenkte statlige initiativet med at elever i videregående skole skal evaluere undervisningen vil kunne virke inn på lærernes persepsjoner, oppfatninger og undervisning samt elevenes innstillinger.

Noen forskere vil si at man bør kombinere datakilder fra flere vurderingsordninger for å sikre en viss pålitelighet og holdbarhet i vurderingene av læreres undervisningsarbeid (MET Project, 2013). Det er en forskningsmessig utfordring at det er lavt samsvar mellom ulike instrumenter som er blitt brukt i forbindelse med lærervurdering (Harris, Ingle & Rutledge, 2014; Hill & Grossman, 2013). I dag har vi neppe et målbart vitensgrunnlag som gir en pålitelig og holdbar evidens til å rangere læreres undervisningsdyktighet. Men flere datakilder – observasjoner av undervisning, faglig vurdering av undervisningsdesign, elevers tilbakemeldinger, prestasjonsutvikling – vil kunne gi visse indikasjoner som igjen kan danne grunnlag for tilbakemeldinger til lærere. Brukes et slikt datamateriale med klokskap og anvendes det viten om elevgrunnlaget som læreren skal forholde seg til, er det et potensial for at en profesjonell veileder kan gi konstruktive tilbakemeldinger.


I dag har vi neppe et målbart vitensgrunnlag som gir en pålitelig og holdbar evidens til å rangere læreres undervisningsdyktighet.


Forutsetninger for å innføre en nasjonal ordning med lærervurdering

Vurderingens hensikt kan være ganske så forskjellig i de ulike variantene av lærervurdering som er nevnt ovenfor: Skal vurderingsordningen tjene en hensikt som støtte til den enkelte lærers profesjonelle utvikling? Skal en vurderingsordning være en kontrollordning? Eller skal den være en offentlig gapestokk for mindre populære lærere? Menneskers potensielle sårbarhet åpenbares i lærervurderingssituasjoner (Garmannslund mfl., 2009). Det betyr at relasjonell tillit til de som gir tilbakemelding vil være en grunnleggende forutsetning for at lærervurdering skal kunne fungere konstruktivt og utviklende.

Tilbakemeldinger på utført arbeid er tatt i bruk som verktøy på mange arbeidsplasser, også skoler. Alvorsgraden stiger betraktelig når vurderinger skal ha konsekvenser. Vurderingens hensikt reiser prinsipielle spørsmål. Lærervurdering som ordning innebærer som nevnt at lærerens arbeid blir evaluert på en systematisk måte. Dermed berøres interessene til både arbeidstakergrupper, arbeidsgivere, nasjonale myndigheter og elever. Med andre ord må forutsetningene for å innføre en nasjonal ordning med lærervurdering avklares med dem som berøres. GNIST-partnerskapet opprettet derfor en arbeidsgruppe som fikk i oppgave å utrede forutsetninger for en ordning med lærervurdering (GNIST-arbeidsgruppen, 2014). Mandatet til gruppen (som ble ledet av denne artikkelens forfatter) var «å identifisere og vurdere viktige forutsetninger for at lærervurdering skal kunne bidra til å utvikle skolene som lærende organisasjoner, bidra til lærernes profesjonsutvikling, og virke positivt inn på elevenes læring og utvikling». GNIST-gruppen vektlegger følgende forutsetninger:

• Partssamarbeid må være bygd på gjensidig tillit mellom de partene som lærervurderingen omfatter
• En vurderingsordning må være systematisk, forutsigbar og praktisk gjennomførbar
• Konkret umiddelbar tilbakemelding erbedre enn generell og tidsutsatt tilbakemelding
• Vurdering skal prinsipielt føre til forbedring

Dessuten legger arbeidsgruppen vekt på at vurdering av læreres arbeid bør bygge på et forskningsfundament. Parallelt med arbeidsgruppens prosess ble det nyopprettede Kunnskapssenter for utdanning gitt i oppgave å utarbeide en systematisk kunnskapsoversikt. Kunnskapssenteret har foretatt en sammenfatning og vurdering av relevant forskning på området (Lillejord mfl., 2014).

Til sammen danner GNIST-arbeidsgruppens og Kunnskapssenterets rapporter et vitensgrunnlag som både er erfaringsbasert og forskningsbasert. Det er betydelig overlapp i anbefalingene i de to rapportene. Resultatene fra Kunnskapssenterets systematiske kunnskapsoversikt legger vekt på følgende fire forutsetninger for at lærervurdering skal kunne bidra til god kvalitet i skolen:

• Metodekompetanse
• Medvirkning, ansvar og tillit
• Tydelighet og enkelthet
• Ansvarsplassering, dialog og oppfølging

Kunnskapssenterets rapport viser også hvilke fallgruver andre land har erfart. De finner for eksempel at selv om lærervurdering kan ha et eksplisitt utviklingsorientert formål i tillegg til et kontrollerende formål, er det en tendens til at støttende eller utviklingsorientert tilbakemelding blir nedprioritert og kontrollfunksjonene overtar (Lillejord mfl., 2014, s. 3).

Konklusjoner

Mange land har iverksatt lærervurderingsordninger, og mye tyder på at det vil bli etablert nasjonale retningslinjer for lærervurdering i norske skoler. Det vil være en utfordring å iverksette slike intensjoner på en måte som fører til forbedring. Nyutdannede lærere har et spesielt behov for veiledning i sine første praksisår. Alle lærere kan dra nytte av tilbakemeldinger når tilbakemeldingene er gode og når den som gir tilbakemelding framstår som profesjonell. Dette stiller krav til veiledningens kvalitet. Kunnskapssenterets rapport vektlegger medvirkning som nødvendig for at lærervurdering skal lykkes. Videre anses skoleeiere og skoleledere som «nøkkelaktører». Dette betinger samarbeidsinnstillinger hos alle parter som omfattes av ordningen. Men det er en rekke fallgruver i spørsmålet om hvordan lærervurdering best skal iverksettes som ordning. Framtidig forskning vil kunne si noe om hvordan skoleeiere og skoler vil være i stand til å navigere i et krevende farvann.

 

Forfatterbilde

Eyvind Elstad

Eyvind Elstad er professor ved Institutt for lærerutdanning og skoleforskning,  Universitetet i Oslo. Han leder en forskergruppe ved navn TEPEC og er involvert i forskning om læreres profesjonelle utvikling og styringsformer i utdanningssektoren. Mer informasjon finnes her:

http://www.uv.uio.no/ils/personer/vit/eyvindel/index.html

Litteraturhenvisninger

Carlsten, T.C., Caspersen, J., Vibe, N. & Aamodt, P.O. (2014). Resultater fra TALIS 2013. Norske funn fra ungdomstrinnet i internasjonalt lys. Oslo: NIFU.

Christophersen, K.A. Elstad, E. & Turmo, A. (2010). Is teacher accountability possible? The Case of Norwegian High School Science, Scandinavian Journal of Educational Research. 54 (5): 413–429.

Clutterbuck, D. (2004). Everyone needs a mentor: Fostering talent in your organization. CIPD Publishing.

Delvaux, E., Vanhoof, J., Tuytens, M., Vekeman, E., Devos, G. & Van Petegem, P. (2013). How may teacher evaluation have an impact on professional development? A multilevel analysis, Teaching and teacher education, 36: 1–11

Firestone, W. (2014). Teacher Evaluation Policy and Conflicting Theories of Motivation. Educational Researcher, published online 27 January 2014

Garmannslund, P.E., Elstad, E. & Langfeldt, G. (2008). Lærernes opplevelse av måling og rangering av kvalitetsaspekter ved undervisning og læringsprosesser. I: Ansvarlighet i skolen, Oslo: Cappelen Forlag.

GNIST-arbeidsgruppen (2014). Rapport til drøfting i GNIST-partnerskapet fra arbeidsgruppen som har utredet forutsetninger for en ordning med lærervurdering. Oslo: GNIST. <http://www.gnistweb.no/aktuelt/271/nye- rapporter-med-laerervurdering-som-tema.html>

Hallinger, P., Heck, R.H. & Murphy, J. (2014). Teacher evaluation and school improvement: An analysis of the evidence, Educational Assessment, Evaluation and Accountability, 26, 5–28.

Harris, D.N., Ingle, W.K. & Rutledge, S.A. (2014). How Teacher Evaluation Methods Matter for Accountability: A comparative Analysis of Teacher Effectiveness ratings by Principals and Teacher Value-Added Measures. American Educational Research Journal, online 3 January 2014.

Hill, H.C. & Grossman, P. (2013). Learning from teacher Observations: Challenges and Opportunities Posed by New Teacher Evaluation Systems, Harvard Educational Review, 83 (2): 371–401.

Hinz, A. (2011). Attitudes of German Teachers and Students towards Public Online Ratings of Teaching Quality. Electronic Journal of Research in Educational psychology, 9(2), 745–764.

Huberman, M. (1989). On teachers’ careers: once over lightly, with a broad brush. International Journal of Educational Research, 13(4), 314e466.

Isoré, M. (2009) Teacher Evaluation: Current Practices in OECD Countries and a Literature Review. OECD Education Working Papers No. 23. OECD Publishing. http:dx. doi.org/10.1787/223283631428

Kunnskapsdepartementet  (2013).  Strategi for ungdomstrinnet. Motivasjon og mestring for bedre læring. Felles satsing på klasseledelse, regning, lesing og skriving: http://www.regjeringen.no/upload/KD/Vedlegg/Grunnskole/Strategiplaner/F_4276B_strategi_for_ungdomstrinnet.pdf.  Lastet  ned mars 2013.

Lillejord, S., Børte, K., Ruud, E., Hauge T.E., Hopfenbeck, T.N., Tolo, A., Fisher-Griffiths, P. & Smeby, J.-C. (2014). Former for lærervurdering som kan ha positiv innvirkning på skolens kvalitet. Oslo: Kunnskapssenter for utdanning, (www.kunnskapssenter.no)

Lortie, D.C. (1975). Schoolteacher. A sociological Study. Chicago: University of Chicago Press.

Master, B. (2014). Staffing for Success: Linking teacher Evaluation and School personnel Management in Practice, Educational Evaluation and Policy Analysis, 36 (2), 207–227.

MET Project (2013). Ensuring fair and reliable measures of effective teaching: culminating findings from the MET project’s three-year study. Seattle: Bill & Melinda Gates Foundation.

Murphy, J.F., Hallinger, P., & Heck, R.H. (2013). Leading via Teacher Evaluation: The Case of the Missing Clothes? Educational Researcher, 42(6), 349-354.

Nusche, D., Earl, L. Maxwell, W. and Shewbridge, C. (2011) OECD Reviews of Evaluation and Assessment in Education: Norway country review http://www.oecdilibrary.org/docserver/download/9111271e.pdf?expires=1356104025&id=id&accname=ocid57003439&checksum=4B92853145C5AF90C396D69A ED7604B7

OECD (2013a). PISA 2012 Assessment and Analytical Framework: Mathematics, Reading, Science, Problem Solving and Financial Literacy, OECD Publishing.

OECD (2014). TALIS 2013 Results: An International Perspective on Teaching and Learning. Paris: OECD.

Tuytens, M. & Devos, G. (2014). The problematic implementation of teacher evaluation policy: School failure or governmental pitfall? Educational Management Administration & Leadership July 2014 42: 155–174.