Forsøk i Asker kommune viser at undervisningsopplegg som tar i bruk samtaleroboter tilpasset grunnskoleelever, er krevende for de fleste elevene, både når det gjelder innhold og dialog. De aller fleste elevene vil derfor ha behov for lærerens eksplisitte modellering og tett oppfølging når det gjelder bruken av slike verktøy.

Asker kommune og forskere fra Det utdanningsvitenskapelige fakultet ved Universitetet i Oslo er partnere i innovasjonsprosjektet «Læring i algoritmenes tidsalder» (LAT). Prosjektet startet opp i oktober 2023, og har planlagt varighet til høsten 2026. Innovasjonsprosjektets mål er blant annet å utvikle læreres kompetanse i didaktisk bruk av og kritisk tilnærming til verktøy som bygger på kunstig intelligens (KI).

Denne fagartikkelen bygger videre på et utvidet abstrakt innsendt til EARLI SIG-konferansen i Berlin høsten 2024. På bakgrunn av den raske utviklingen i praksisfeltet ser vi et behov for å rapportere observerte mønstre i utprøving av pilotcasene allerede før LAT-prosjektets planlagte hovedutprøving fra høsten 2024.

Mange har argumentert for at KI-verktøy vil kunne brukes som støttestillas og assisterende verktøy for elever og lærere (eksempelvis ; ; ). Men det fins få studier som har undersøkt om KI-verktøy faktisk egner seg til dette. Planlegging av oppgaver med KI er fortsatt i en tidlig fase, der deler av undervisningsopplegg kan være godt gjennomarbeidet, mens andre deler prøves ut for første gang. Det er krevende å forutsi hvordan elevene vil arbeide med KI-verktøy i en så kompleks setting som den vi gjerne finner i klasserom ().

Store språkmodeller er en nyere type generativ kunstig intelligens (GKI) og dermed også en ny mulighet innenfor skolen. Store mengder tekstdata er blitt brukt til å trene disse språkmodellene, som blant annet har evnen til å skape tekstlig innhold, svare på spørsmål og utføre ulike språkrelaterte oppgaver (). Da OpenAIs ChatGPT ble introdusert i november 2022, ble det fremmet en rekke påstander og oppfatninger om at GKI ville kunne brukes innenfor undervisning og læring. hevdet for eksempel at store språkmodeller kunne assistere grunnskoleelever i utviklingen av deres lese- og skriveferdigheter, i tillegg til at de kunne bistå ved ulike former for kritisk tenkning.

Etter at språkmodellen ChatGPT ble tilgjengelig for alle, har Asker kommune tilpasset chatbots (eller samtaleroboter) som bygger på ChatGPT 3.5 gjennom såkalt pre-prompting. Med utgangspunkt i skolens fag og lærernes undervisningspraksiser har man prøvd ut slike tilpassede versjoner ved flere skoler, og dette arbeidet er under kontinuerlig utvikling. I utprøvingen legges det vekt på at undervisningsoppleggene skal inneholde flere ulike former for interaksjon med samtalerobotene, det kan være: elev ⇔ KI, elev ⇔ elev ⇔ KI eller lærer ⇔ elever ⇔ KI (se for utdypende forklaring).

«Pre-prompting» vil i denne sammenheng innebære at man tilpasser ledetekst som samtaleroboten må forholde seg til etter skolefag og elevenes alder.

Teoretisk rammeverk

Når (G)KI-verktøy skal tas i bruk i skolen, er det avgjørende at et teoretisk perspektiv og analytiske begrep setter premissene for analysen. Sagt med andre ord vil vi bruke et utvalg teoretiske begreper som kan klargjøre hva som skjer i elevenes interaksjon med samtaleroboter. Vi tar her et sosiokulturelt utgangspunkt siden det gir oss analytiske begrep til å forstå sosiale, kognitive og teknologiske aspekter ved undervisning og læring i et klasserom. Vi mener dette perspektivet er godt egnet for å forstå bruk av GKI i klasserommet. Dette kommer av at samtaleroboter utgjør noe nytt i etablert klasseromspraksis, og kan skape nye forutsetninger for dialog, undervisning og læring.

Ifølge Olga Dysthe innebærer det sosiokulturelle perspektivet å legge vekt på at «kunnskap blir konstruert gjennom samhandling og i ein kontekst» (). Sosiokulturelle tilnærminger ser dessuten på utdanning som en dialogisk prosess hvor elever og lærere samhandler innenfor rammebetingelsene som skolens mandat, verdier og sosiale praksiser utgjør.

understreker hvorfor språk er av avgjørende betydning i denne sammenheng: Alle typer menneskelig virksomhet har en tilknytning til språkbruk. Denne bruken av språk manifesterer seg i spesifikke, individuelle utsagn fra deltakerne innenfor et bestemt anvendelsesområde. Videre hevder Bakhtin at selv om ytringer kan sies å være individuelle, må våre ytringer likevel bære preg av det forfatteren betegner som dialogiske overtoner, eller flerstemmighet (). Det vil derfor være interessant å undersøke om eventuell dialogisk interaksjon mellom elever, lærere og samtaleroboter. De responser en samtalerobot vil gi, vil være preget av flerstemmighet basert på en underliggende språkmodell som beregner stavelser og dermed ord og setninger basert på tekstlig treningsdata. Samtalerobotene har altså ikke en overordnet tekst- eller kunnskapsforståelse.

I tillegg til menneskers språk, kan en ifølge også undersøke rollen tegn og redskaper (eller verktøy) har i menneskelige handlinger, ettersom også disse gjør mennesker i stand til å konstruere mening og betydning. Et særpreg ved såkalte artefakter er at de er utformet av mennesker for en bestemt hensikt (), men at de over tid kan brukes til flere formål. De konstituerer læringsbetingelser for elevene ().

Samtaleroboter kan være justert og tilrettelagt for en tenkt mottaker (elev på barne- eller ungdomstrinn) før de tas i bruk. Men ettersom GKI genererer innhold basert på beregninger, kan man ikke uten videre si at disse samtalerobotene er designet utelukkende for undervisning og læring. De er mer å betrakte som åpne digitale ressurser. Et sentralt spørsmål er dermed på hvilke måter samtaleroboter som GKI-teknologi kan fungere som verktøy i undervisning og elevers læring.

Basert på den sosiokulturelle tilnærmingen til deltagelse og læring, kan en videre velge å se på elevers interaksjon med GKI-teknologi fra et sosiolingvistisk ståsted. fremhever at det å ta stilling er en av de mest fundamentale handlingene vi utfører med språk. Du Bois omtaler det forfatteren kaller «The stance triangle» (stillingstriangel): «Å ta stilling er en offentlig handling utført av en sosial aktør, oppnådd dialogisk gjennom kommunikative midler, der man samtidig evaluerer objekter, posisjonerer subjekt(er) (seg selv og andre) og justerer seg etter andre subjekter» [vår oversettelse] (). I figur 1 er Du Bois’ generelle rammeverk for stillingstaking oversatt til norsk:

Sitat fra Du Bois: «Stance is a public act by a social actor, achieved dialogically through over communicative means, of simultaneously evaluating objects, positioning subjects (self and others), and aligning with other subjects, with respect to any salient dimension of the sociocultural field» (2007, s. 163).

Videre kan stillingstaking ha trekk som Du Bois kaller epistemiske eller affektive. Et eksempel på epistemisk stillingstaking kan være at et subjekt presenterer seg selv som kunnskapsrik eller ignorant. Affektiv stillingstaking består gjerne av ytringer som rommer adjektiv eller verb som beskriver subjektets følelser knyttet til noe eller noen (). Et eksempel på sistnevnte kan være: «Jeg [subjekt] liker [affektivt verb] samtaleroboten [objekt].»

Figur 1: Oversettelse av «The stance triangle». Det å ta stilling er ifølge forfatteren en samtidig prosess der man evaluerer objekter, posisjonerer subjekt(er) (seg selv og andre) og justerer seg etter andre subjekter (Du Bois, 2007, s. 163; Tjønn, 2023, s. 10).

En mulig tilnærming til utprøvingen kan være å undersøke hvordan elevene sammen og hver for seg (subjektene) evaluerer det fagspesifikke innholdet (objektet) samtalerobotene genererer, og dermed posisjonerer seg selv og eventuelt justerer seg etter medelever eller faglærer i bestemte læringsaktiviteter.

Litteraturgjennomgang

Foreløpige litteratursøk viser et behov for mer empirisk kunnskap om bruk av GKI i en norsk grunnskolekontekst. Vi har identifisert noen få kvalitative undersøkelser knyttet til bruk av GKI i grunnopplæringen (). har utforsket bruk av GKI for å støtte læringsarbeidet til ti elever i videregående opplæring. Gjennom intervjuer fortalte elevene at ChatGPT var et praktisk verktøy når de søkte etter informasjon, og når de arbeidet med monotone læringsoppgaver. Forskerne fant imidlertid at elevenes grad av kritisk tilnærming til ChatGPT varierte stort ().

undersøkte hvordan barneskoleelever arbeidet med digital historieskriving (DSW). Forfatterne fant at DSW kunne øve elevene i å anvende kunnskap om KI for å løse problemer i det virkelige liv – og at DSW dermed kan fungere som stillas for å styrke særlig de yngre elevenes forståelse av både etiske og tekniske aspekter ved KI ().

undersøkte hvordan et utvalg studenter på bachelornivå ved Det utdanningsvitenskapelige fakultet (UiO) interagerte med ChatGPT. Forfatterne fant blant annet at GKI kan bli brukt i studieprogram, men identifiserte samtidig utfordringer: Ettersom GKI ikke gir innsyn i produksjonen av kunnskapen som ligger i samtalerobotens tekster, blir betydningen av selvregulering, kryssjekk mot sikre kilder og studentenes forkunnskaper enda viktigere enn før. Det samme gjelder for utvikling av underviseres ekspertise.

Alle de tre studiene viser at GKI kan være produktivt for elever og studenter. Dette forutsetter imidlertid muligheter for tilpasning i teknologisk design, undervisningsopplegg og tett oppfølging av lærere og undervisere.

Om utprøving og metode

Utprøvingen av Asker kommunes samtaleroboter fant sted i flere ulike klasserom i Asker kommune. Tidlig 2024 besøkte forskere fra LAT-prosjektet fem grunnskoler. Utprøvingen involverte seks lærere og i underkant av 200 elever i 7 ulike klasser. Skolene varierte både når det gjaldt størrelse og sine sosioøkonomiske nærområder.

I forkant av besøkene hadde lærerne forberedt undervisningsopplegg og enkeltøkter som rommet bruk av samtaleroboter. Forskerteamet tok notater mens de observerte undervisningsøktene, og gjorde i noen få tilfeller video- og lydopptak av konkret interaksjon mellom elever, lærere og samtalerobot. Selv om de observerte øktene først og fremst kan betegnes som undervisning i norskeller samfunnsfag, støtteundervisning eller en kombinasjon av disse, observerte vi også en time i naturfag. I etterkant av undervisningsøktene gjennomførte vi uformelle samtaler med de aktuelle lærerne. Under disse samtalene fikk lærerne anledning til å legge frem egne perspektiver på de observerte undervisningsøktene.

To ulike mønstre i elevenes arbeid

Basert på feltnotater og skriftlige elevarbeid i utprøvingen vil vi fremheve to mønstre som utkrystalliserer seg i den observerte undervisningen:

Det ene mønsteret er at flere elever demonstrerte lovende bruk av Askers ulike samtaleroboter. Disse elevene beskrev at samtalerobotene fungerte som en støtte i idémyldringsfaser, språklig bearbeiding og korrekturlesing i form av dialogisk interaksjon. Noen få elever ga uttrykk for at Askers samtaleroboter allerede er en integrert del av deres læringsarbeid både i og utenfor skoletiden. Våre observasjoner bekrefter elevenes utsagn. Disse elevene arbeidet som regel konsentrert med oppgaver og mestret overganger mellom ulike digitale verktøy i bruk. De gjorde dette både i individuelt arbeid og sammen med en mindre gruppe eller en læringspartner. Samtalerobotene var i disse undervisningsoppleggene et verktøy som var i bruk der også andre verktøy ble brukt, eksempelvis bildeprogrammer og skriveverktøy som Word, Google eller Docs.

Betydningen av utdypning gjennom dialog kommer klart til syne i en sekvens der to elever på ungdomstrinnet bruker en samtalerobot rettet mot ernæringsfeltet. Denne interaksjonen er tatt opp på lydbånd. Elevene er kritiske til svaret de fikk på den innledende ledeteksten «Hvor mye mat trenger en elev i løpet av en skoledag?».

Elev 1: «Generelt anbefales det en elev å få et variert kosthold som inkluderer alle de viktige… » Men … det var jo liksom ikke det jeg spurte om.

Elev 2: Spør en gang til. Jeg vet ikke.

Elev 1: Hvilken … hvilken … mengde.

Elev 2: Hva hvis vi prøver å formulere spørsmålet en gang til, mye enklere?

Elevene i utdraget viser gjennom sine ytringer at de tar stilling til introduksjonen i samtalerobotens tekstlige output, og justerer egen ledetekst i forsøket på å få et mer konkret svar i retur. Mot slutten av sekvensen konkluderer elevene med at samtalerobotens nye output (frukt og grønt i tillegg til vann og et sunt måltid) er mer anvendelig i utformingen av argumenter i kampanjen elevene skulle lage.

Den innledende utprøvingen antydet imidlertid behov for flere justeringer, både i utformingen av undervisningsopplegg og i form av videre justeringer av involverte samtaleroboter. Vi vil i analysen som følger, få frem de dilemmaer som undervisningsopplegg med GKI-verktøy som regel vil innebære. Basert på det nevnte stillingstriangelet, kan vi beskrive og konseptualisere utfordringer som høyst sannsynlig vil ha gyldighet i de fleste klasserom.

I tillegg til mønsteret beskrevet over observerte vi hos en del elever et helt annet mønster. Det var kjennetegnet ved at elevene gjorde seg få kognitive anstrengelser. Disse elevene verken festet seg ved eller bearbeidet informasjonen fra samtaleroboten til egen tekst. Noen elever posisjonerte seg på utsiden av den fagspesifikke stillingstakingen ved å la være å evaluere det faglige innholdet (objektet) i det samtalerobotene produserte av tekst. Disse elevene så istedenfor ut til å ta stilling til tekstens form som noe de ikke behøvde å forholde seg nærmere til. Eksempelvis ble ytringer som dette notert i observasjoner på barnetrinnet:

− Han [samtaleroboten] skriver en bok!

− Det er godt å ikke måtte drive og tenke halve økta.

Tilsvarende ytringer ble også observert på ungdomstrinnet:

− Den skriver for langt.

De aktuelle elevene skrollet raskt forbi eller byttet nettleservindu istedenfor å lese samtalerobotens svar grundig. Flere av elevene gikk heller ikke inn i dialog med samtalerobotene gjennom å skrive ny ledetekst der de kunne ha bedt om kortere eller lettere svar i retur.

I en av de observerte klassene ba læreren elevene om å begrunne hvorfor de «likte» å jobbe med samtaleroboten i den aktuelle timen, som en del av oppsummeringen. Felles for samtlige svar i denne oppsummeringen var at samtalerobotene bidro til å redusere den kognitive belastningen til elevene. En slik bruk vil altså innebære en automatisering av elevenes arbeid.

Samtidig forekom det også andre former for affektiv stillingstaking i tråd med første mulige mønster. En del elever ga som nevnt uttrykk for at de likte samtalerobotens funksjon som sparringpartner og korrekturleser, samtidig som elevene selv bemerket både muligheter og begrensninger som ligger i interaksjonen med samtaleroboter.

I enkelte tilfeller kan en hevde at samtaleroboten ser ut til å utgjøre subjekter i elevenes epistemiske stillingstaking, nærmere bestemt når elever justerer seg mot samtalerobotens tekstproduksjon. Vi observerte eksempler på både barne- og ungdomstrinnet:

− Jeg skjønner ikke hva han [samtaleroboten som subjekt] sier [spesifikt innhold som objekt].

− Men han [samtaleroboten] påstår det!

Elevene kan altså sies å ytre seg som om samtaleroboten fungerte som sosial aktør. En analyse av lærerens skriftlige plan for timen tilsier at en slik funksjon neppe var tilsiktet. Bruken av samtalerobot var snarere planlagt som del av elevenes arbeid med å utvikle et faglig innhold.

Empirisk oppsummering

Våre observasjoner tyder på at det er krevende for elevene å engasjere seg i det som kan klassifiseres som en dialog med samtaleroboten. I undervisningsøktenes introduksjon viste flere av lærerne til et tidligere punkt der de skal ha introdusert elevene for de ulike samtalerobotene i forkant av forskerteamets besøk. Hvor mye eksponering, trening eller opplæring elevene hadde fått i bruk av disse, varierte mellom lærere som deltar i prosjektet.

En mulig hypotese er at elevene ennå ikke har utviklet et repertoar for å kunne skille mellom tradisjonelle Internettsøk og bruk av samtaleroboter, men at de ville klart dette bedre hvis de hadde mottatt lærerens eksplisitte modellering over et lengre tidsrom.

Konklusjoner fra første utprøving

Basert på våre observasjoner og samtaler med lærere og elever så langt, vil vi fremheve noen forhold som kan bidra til å utvikle produktive faglig forløp for elevene med GKI i klasserommet. Lærerne kan eksplisitt modellere hvordan elever kan gå inn i dialog med samtaleroboter. Her kan de eksperimentere med undervisningsopplegg der elevene jobber mer systematisk og parvis med én samtalerobot. En slik tilnærming vil kunne legge til rette for at elevene sammen tar stilling til det samtaleroboten produserer av tekst, gjennom å evaluere både form og innhold. Samtidig som de evaluerer, vil elevene kunne posisjonere seg selv og på samme tid justere seg etter læringspartner i arbeidet med teksten (objektet). En slik prosess er illustrert i vårt modifiserte rammeverk basert på en oversettelse av Du Bois’ stillingstriangel i figur 2:

Figur 2: Du Bois’ rammeverk for stillingstaking, tilpasset elevers bruk av samtalerobot. Rammeverket er her tilpasset at samtalerobotens tekstproduksjon utgjør objektet i elevenes par- og gruppevise stillingstaking.

Aktører i forsknings- og praksisfeltet kan stille flere spørsmål på bakgrunn av figur 2: Hva kjennetegner dialogene mellom elever og samtalerobot når elevene jobber sammen i par? Hvordan kan vi utvikle elevenes kritiske stillingstaking i omgangen med samtaleroboter? Hvordan kan vi planlegge for bruk av samtaleroboter i undervisning og oppgaver uten at elevene kan overlate den kognitive anstrengelsen til GKI-teknologien?

Oppsummert samsvarer utprøvingen med funn i andre undersøkelser av klasserom der flere digitale verktøy brukes (eksempelvis ; ; ). I planleggingen av undervisningsopplegg vil man i stadig større grad ta høyde for faglig og sosial kontinuitet i læringsforløpene – altså å unngå brudd og for hyppige aktivitetsskifter. Utformingen av undervisningsopplegg vil dessuten måtte romme oppgaver og digitale verktøy (også GKI-baserte) som kan bidra til å utvikle elevers sosiale og metakognitive funksjoner og krav til kognitive anstrengelser.

Veien videre

I den neste fasen i LAT-prosjektet skal vi undersøke hvorvidt (G)KI-baserte verktøy, slik som samtaleroboter og andre digitale verktøy, kan være en styrke i arbeidet med undervisning og elevers læring. I så fall blir et viktig formål å bidra med didaktiske modeller som kan beskrive hvordan lærere kan benytte disse verktøyene i klasserommet.

Litteraturhenvisninger

Bakhtin, M.M. (1998). Spørsmålet om talegenrane. Bergen: Ariadne forlag.

Casal-Otero, L., Catala, A., Fernández-Morante, C., Taboada, M., Cebreiro, B. & Barro, S. (2023). AI literacy in K-12: a systematic literature review. International Journal of STEM Education, 10(1), 17–29. https://doi.org/10.1186/s40594-023-00418-7

Chen, B., Zhu, X. & Diaz del Castillo, H.F. (2023). Integrating generative AI in knowledge building. Computers and Education. Artificial Intelligence, 5, 100184. https://doi.org/10.1016/j.caeai.2023.100184

Du Bois, J.W. (2007). The stance triangle. I: R. Englebretson (red.), Stancetaking in Discourse (s. 139–182). Amsterdam/Philadelphia: John Benjamins Publishing Company.

Dysthe, O. (2001). Sosiokulturelle teoriperspektiv på kunnskap og læring. I: O. Dysthe (red.), Dialog, samspel og læring (s. 33−72). Oslo: Abstrakt forlag.

Hwang, G.-J., Xie, H., Wah, B.W. & Gašević, D. (2020). Vision, challenges, roles and research issues of Artificial Intelligence in Education. Computers and Education. Artificial Intelligence, 1, 100001. https://doi.org/10.1016/j.caeai.2020.100001

Kasneci, E., Sessler, K., Küchemann, S., Bannert, M., Dementieva, D., Fischer, F., Gasser, U., Groh, G., Günnemann, S., Hüllermeier, E., Krusche, S., Kutyniok, G., Michaeli, T., Nerdel, C., Pfeffer, J., Poquet, O., Sailer, M., Schmidt, A., Seidel, T. & Kasneci, G. (2023). ChatGPT for good? On opportunities and challenges of large language models for education. Learning and Individual Differences, 103, 102274. https://doi. org/10.1016/j.lindif.2023.102274

Ludvigsen, S., Mørch, A.I. & Wagstaffe, R.B. (2023). Lett å bruke – vanskelig å forstå. Institutt for pedagogikk. Det utdanningsvitenskapelige fakultet, UiO. Arbeidsnotat.

Ludvigsen, S. mfl. (2024) Kunstig intelligens i skolen: Konseptualisering og litteraturoversikt. Manuskript innsendt for publisering.

Mercer, N. (2004). Sociocultural Discourse Analysis: Analysing Classroom Talk as a Social Mode of Thinking. Journal of Applied Linguistics, 1(2), 137–168.

Mørch, A.I., Engeness, I., Cheng, V.C., Cheung, W.K. & Wong, K.C. (2017). EssayCritic: Writing to Learn with a Knowledge-Based Design Critiquing System. Educational Technology & Society, 20(2), 216–226.

Ng, D.T.K. mfl. (2022). Using digital story writing as pedagogy to develop AI literacy among primary students. Computer and Education: Artificial Intelligence (3).

Rasmussen, I. & Ludvigsen, S. (2010). Learning with Computer Tools and Environments: A sociocultural perspective. I: K. Littleton, C. Wood & J.K. Staarman (red.), International Handbook of Psychology in Education (s. 399−433). Emerald Group Publishing Limited.

Säljö, R. (2006). Læring og kulturelle redskaper: om læreprosesser og den kollektive hukommelsen (S. Moen, Overs.). Oslo: Cappelen Akademisk Forlag.

Tjønn, H. (2023). Design for kritisk refleksjon g jennom en applikasjon. En kvalitativ studie av tidlige brukerperspektiver på tilbakemeldingsverktøy [Masteroppgave, Universitetet i Oslo]. DUO vitenarkiv. Hentet april 2024 fra https://www.duo.uio.no/ handle/10852/103078