KI kan være en bedre faglig veileder enn mennesker
LUKK

Kronikk:

KI kan være en bedre faglig veileder enn mennesker

Av Rune Johan Krumsvik, professor i pedagogikk og leder for Digital Learning Communities Artificial Intelligence Centre ved Universitetet i Bergen

Publisert 11. februar 2025 kl. 13:13

Kunstig intelligens kan, i visse sammenhenger, fungere bedre som faglig veileder enn mennesker kan, skriver Rune Johan Krumsvik.

Den overordnede forståelsen og diskursen rundt kunstig intelligens (KI) i samfunnet skaper et behov for en mer solid, vitenskapelig fundert innsikt i hvordan KI påvirker utdanningssektoren. En gjennomgang av teknologiske paradigmeskifter i min bok fra 2023 viser at vendepunktet språkmodeller som ChatGPT og GPT-4 representerer, også har viktige historiske røtter innenfor utdanningsfeltet.

Denne KI-historikken er essensiell av flere grunner da KI i 2025 ikke bare handler om et teknologisk paradigmeskifte, men også om at vi har gitt KI nøkkelen til hele vår språklige kulturarv. Dette utfordrer hele vårt utdanningsøkosystem og en rekke tverrsektorielle forhold. Det blir derfor stadig viktigere å styrke sektorkunnskapen, kunnskapsberedskapen og kunnskapsgrunnlaget i det tverrsektorielle utdanningsfeltet knyttet til kunstig intelligens og dens inntreden.

Rune Johan Krumsvik er professor i pedagogikk og leder senter for Digital Learning Communities Artificial Intelligence Centre ved Universitetet i Bergen. Foto: UiB

KI som sparringpartner

Spesielt er det viktig å adressere hvorvidt KIs kapabilitet kan sementere og forsterke sosial ulikhet, om KI har et innebygd stereotypiserende og diskriminerende potensial, samt den generelle mangelen på transparens rundt bruken av de store språkmodellene. Kunstig intelligens kan dermed være et «etisk minefelt», samtidig som det er viktig å adressere hvilken kapabilitet KI har i utdanningsfeltet.

Dette undersøkte vi allerede i mars 2023, da vi ønsket å se på hvor kapabel og pålitelig den største språkmodellen, GPT-4, egentlig er til å håndtere krevende norskspråklige skoleeksamener i medisin, sykepleie, samt som sparringpartner og veileder for akademisk skriving på doktorgradsnivå. Ved bruk av stringente ledetekster scoret GPT-4 høyt på en krevende medisineksamen og en nasjonal sykepleieeksamen. På den sistnevnte stryker tre av ti studenter.

Vi trente også GPT-4 til å bli mer fagspesifikk, piloterte den og testet hvor kapabel den var innen doktorgradsutdanning. (Her kan du teste den selv)

Funnene våre viser at GPT-4 kan være en god sparringpartner for både studenter og stipendiater, og kan bidra til å støtte både formative og summative vurderingspraksiser i høyere utdanning, som denne KI-kyndige medisinstudenten illustrerer ved å simulere kliniske pasientcaser.

Våre funn er i tråd med en fersk metaanalyse i utdanningssektoren som avdekker at generiske språkmodeller har en ganske stor effekt på læringsprestasjoner (g= 0.712).  Noe forenklet kan man si at hvis et læremiddel eller pedagogisk tiltak har en effekt på over g= 0.7, er det ikke bare en statistisk størrelse, – studenter vil faktisk merke det i praksis.

En annen fersk metaanalyse viser en vesentlig større effektstørrelse (g= 1.31) for generiske språkmodeller og store effektstørrelser innen fagspesifikk KI: Intelligent Tutoring Systems (ITS) (g=1.07). Selv om antall primærstudier er begrenset og metaanalysen har enkelte kunnskapshull, er funnene til de kinesiske og palestinske forfatterne spesielt interessante for utdanningsfeltet i et tverrsektorielt perspektiv.

Modnet teknologi

ITS ble utviklet allerede rundt 1970 med doktorgradsavhandlingen til Jamie R. Carbonell, samt hans far, den kjente maskinlæringsforskeren Jamie G. Carbonell (som stod bak språkmodellen XLNet, som i 2019 presterte vesentlig bedre enn den anerkjente språkmodellen BERT).

Vår samarbeidspartner i sentersøknaden DLCAIC, dr. Etienne Wenger var en del av dette forskningsmiljøet på 1980-tallet og publiserte en bok om Intelligent Tutoring Systems i 1987 da KI-teknologien fortsatt var temmelig umoden og lite kapabel. Det ble med andre ord mange «KI-vintrer» for Wenger og de mest toneangivende KI/ITS-forskere, som Lauren Resnick, Allan Collins, James Greeno, Herbert Simon, John Seely Brown, Seymour Papert, Richard Mayer og Kurt VanLehn på denne tiden. Likevel utgjør deres KI- og utdanningsteknologiske forskning en viktig del av den KI-historiske kunnskapen innen utdanningsfeltet.

Med kunstig intelligens har vi fått en ny «spiller» på laget – en som tidvis har en fremskutt spissposisjon, tidvis er en støttespiller, og tidvis må sitte på reservebenken.

For nå, når Intelligent Tutoring Systems gjør et vesentlig byks innen læringseffekt i den ovennevnte metaanalysen (samt vesentlig bedre enn to tidligere metaanalyser fra 2014 og 2016), skyldes dette trolig at KI-teknologien har modnet de siste årene og blitt langt mer kapabel. Det betyr i praksis at den kraftige GPT-4o nærmest har ervervet en innebygd, generisk ITS-funksjonalitet, ved videre trening blir den enda mer kapabel, samtidig som fagspesifikke Intelligent Tutoring Systems har blitt enda mer skarpskodde enn for få år siden. RAG (Retrieval-Augmented Generation) som bruker sanntidsdata fra databaser eller nettsider, vil også kunne forbedre både de generiske språkmodellene og Intelligent Tutoring Systems.

Sosial reproduksjon

Det er liten tvil om at dette har gitt Blooms 2 Sigma Problem «ny vind i seilene» og kan bidra til en brytningstid for hvordan man tenker veiledning, læring, inkludering og sosial mobilitet innen utdanningsfeltet.

Likevel, for å unngå nok en teknologieuforisk tilstand rundt digitalisering, tyder mye på at «Ein må rygga eit steg attende og prøva få perspektiv på føresetnadane for det ein gjer» (Skjervheim 1972, s. 57). Slike ITS-forskningsfunn gjør at man må gå til kjernen av det som ligger under disse tilsynelatende kontraintuitive resultatene: at KI tidvis kan være en bedre faglig veileder enn mennesker kan.

Intelligent Tutoring Systems og KI illustrerer at vår dikotomiske holdning om menneske versus maskin for ofte fokuserer på en utskiftning av veiledere i stedet for en gjennomtenkt pedagogisk KI-integrering. KI kan ikke konkurrere med veiledere og lærere når det gjelder det situerte og relasjonelle («stemtheten») i undervisningen, og en rekke andre områder. Men på nasjonalt nivå bør man utforske hvorvidt slike ITS-funn og KI generelt kan bidra til å endre noe av den sosiale reproduksjonen skolesystemet vårt fortsatt sliter med, slik vi dokumenterer i vår bok om skoleprestasjoner.

Hvordan kan KI utfylle menneskelig intelligens?

Både vår tentative pilotering, pretesting og forskningsfunn i DLCAIC viser at KI bidrar med en ny form for pedagogisk resonnering, basert på egen mønstergjenkjenning, for å kunne analysere og veilede rundt faglige spørsmål.

Utfordringen blir å utvikle en pedagogisk kyndighet i når man skal velge mellom menneskelig og kunstig intelligens, hvordan de kan utfylle hverandre, og hvordan vi kan samhandle på en gjennomtenkt måte. Dette gjøres best ved å se på KI/ITS som et valideringsfellesskap som er komplementært til menneskelige valideringsfellesskap (undervisere, veiledere, medstudenter, fagfeller m.fl.). Både våre funn og metaanalysene viser at vi rett og slett har fått en ny «spiller» på laget – en som tidvis har en fremskutt spissposisjon, tidvis er en støttespiller, og tidvis må sitte på reservebenken.

Derfor er det viktig at de kommende nasjonale KI-sentrene adresserer slike tverrsektorielle forskningsfunn for å øke sektorkunnskapen og kunnskapsberedskapen innen utdanningsfeltet.

For eksempel vil vi i DLCAIC posisjonere oss inn mot de overnevnte kunnskapshullene i metaanalysene ved hjelp av kunnskapsoppsummeringer, RCT-studier og MMR-studier. På denne måten vil man utvikle en bedre sektorkunnskap om hvorvidt ITS og KI kan nedskalere, sementere eller forsterke sosiale skiller, hvorvidt inkludering og sosial mobilitet får nye vilkår, og om dette hemmer eller fremmer læring for elever, studenter og stipendiater her til lands.

  • Les også: