To sensorer på eksamen vil være et skuffende tilbakeslag for høyere utdanning i Norge

Kronikken ble først publisert på forskersonen.no/forskning.no.

Som fersk innvandrer til Norge fra USA kan jeg bekrefte at konseptet «Scandinavian Envy» er reelt. I mange år har venner og kollegaer snakket med ærefrykt om landet på topp av verdens lykkeskala, med sosialt sikkerhetsnett og allmenn og gratis tilgang til helsetjenester og høyere utdanning.

Jeg føler jeg vant i det store lotteriet da jeg fikk muligheten til å flytte til Norge. Som ekspert på undervisning og læring i høyere utdanning er jeg imidlertid forundret over noen av de endringene som Aune-utvalget nå foreslår som del av den nye Universitets- og høyskoleloven (UH-loven) (NOU 2020: 3). Spesielt gjelder dette en ytterligere styrking av studentenes rettigheter til å påklage karakterer, og forslaget om å gå tilbake til to sensorer for alle vurderinger på karakterskalaen A-F. Jeg har satt meg litt inn i historien til dette forslaget, lest ulike perspektiv, og vurdert argumentene bak endringsforslagene. Min konklusjon er at fra et vitenskapelig perspektiv (dvs. kunnskapsbasert undervisning og læring) bør disse forslagene forkastes.

En god og en dårlig nyhet

Jeg jobber innen et relativt nytt rammeverk ofte referert til som ‘Scientific Teaching’, et begrep kjent under andre navn, men forankret i ideen om at vi forskere skal forholde oss til undervisningen på samme måte som vi forholder oss til forskningen vår, nemlig med en vitenskapelig tilnærming (Handelsman, Miller og Pfund 2007; Miller et al. 2008; Pfund et al. 2009). Kjernen i dette rammeverket er at underviserne må tilstrebe å ta i bruk undervisnings- og læringsformer som i forskningen viser at gir god læring hos studentene. Det innebærer at vi særlig bør ta i bruk studentaktive læringsmetoder, konsekvent bruke formative vurderingsformer, og legge til rette for et inkluderende og støttende læringsmiljø. Dette perspektivet på undervisning representerer en reell reformbevegelse i høyere utdanning – det både legger til rette for og krever kunnskapsbaserte endringer i undervisning, studiemiljø, og vurderingsformer.

Den gode nyheten er at stadig flere universiteter, høyskoler, og undervisere i norsk høyere utdanning tar disse metodene i bruk, til studentenes, læringens, og samfunnets beste. Den dårlige nyheten er at flere aspekter ved den foreslåtte nye UH-loven, spesielt det som gjelder vurdering og sensorer, rett og slett bryter fundamentalt med disse premissene. Dette utgjør dermed et skuffende tilbakeslag for høyere utdanning i Norge.

De to sensorenes lokkesang

Det nye kravet om to sensorer for alle tellende vurderinger høres jo i utgangspunktet fornuftig ut. Men selv om formålet for så vidt er godt, nemlig å styrke studentenes rettigheter til en rettferdig vurdering, garanterer jo forslaget bare at eksamensoppgavene skal vurderes av to sensorer. Men garanterer det bedre og, kritisk, mer rettferdig karaktersetting?

Her gir forskningen et helt tydelig svar: Nei, dessverre. Nylige studier, også her i Norge (Bjølseth, Havnes og Lauvås 2011), viser at det er voldsomt stor variasjon i karaktersetting mellom sensorer. Videre viser forskningen at dersom underviserne bruker kunnskapsbaserte undervisningsformer og vurderingsformer som legger vekt på dybdelæring og ikke bare direkte pugging, så er det direkte usannsynlig at hverken en eller to eksterne sensorer vil gi bedre kvalitet i vurderingene. Dette gjelder særlig på høyere faglig nivå, der sensorer må være spesialister innenfor den smale underdisiplinen til faget for å kunne være en rettferdig sensor.

For å sette det på spissen: Som biolog kan jeg absolutt evaluere en flervalgseksamen som tester studentens faktakunnskaper om for eksempel norsk miljøhistorie, men det ville være mye vanskeligere for meg å vurdere studentens kritiske vurderinger av den underliggende miljødiskursen bak Alta-konflikten. Å forberede meg til å sensurere slike mer krevende oppgaver ville kreve mye innsats fra min side. Legg til usikkerhet i vurderingene mellom sensorer i denne miksen, så er det ikke sånn at det å satse mye mer ressurser på selve sensuren, slik Aune-utvalgets forslag legger opp til, er i studentenes interesse. Med andre ord, selv i et best-case-scenario, om vi hadde hatt ubegrensede ressurser tilgjengelig for undervisning og sensur i høyere utdanning, ville dette fortsatt ikke vært bra for studentene. For å oppsummere, Aune-utvalgets forslag gir altså ikke studentene noen reelle rettigheter til bedre vurdering, samtidig som forslaget faktisk er til skade for studentenes rettighet til utdanning av høy kvalitet. Mer om det nedenfor.

Den høye verdien av lav innsats

Studentaktiv læring innebærer, enkelt sagt, å utvikle undervisnings- og vurderingsformer som fokuserer på og støtter studenten, og studentens utvikling av sin egen kunnskap og ansvar for egen læring, heller enn å fokusere på underviserens overlevering av kunnskap. Forskningen viser at det å ansvarliggjøre studentene, og det å vise at underviseren ser og verdsetter studentenes innsats, er avgjørende for å engasjere studentene i studentaktive undervisningsformer som samarbeidslæring, teambasert læring, omvendt klasserom, casestudier, og strukturert faglig diskusjon (Freeman et al 2007, Haak et al 2011).

En åpenbar, effektiv måte å oppnå dette på er å la studentenes deltagelse i disse viktige læringsaktivitetene telle opp mot sluttkarakteren. Forskningen viser at det å kunne samle slike små tellende poenger, uansett hvor liten selve poengverdien er, som er en del av den tellende karakteren i emnet hjelper på kommunikasjonen mellom student og underviser av hva som er viktig, hva som faktisk teller [sic] i dette faget. Slike systemer kan kritiseres for å gi ‘ytre motivasjon’ men det er viktig å ta med seg at også i arbeidslivet får vi betalt for den jobben vi gjør, det kunder eller arbeidsgiver ønsker at vi produserer, uten at dette nødvendigvis går ut over den indre motivasjonen.

Regnestykket går ikke opp

Det er ikke enten eller, dette. Problemet er at anbefalingene fra Aune-komiteen vil hindre slike dokumentert effektive praksiser. Det er urealistisk og urimelig å forvente at undervisere, eller institusjonene de jobber for, vil kunne lage mange små vurderingspunkter underveis i fagene dersom hvert enkelt av disse vurderingspunktene må vurderes av to uavhengige sensorer. Det blir for dyrt, for arbeidskrevende. Undervisere vil slite under den ekstra arbeidsbyrden det vil være å lage sensorveiledninger for alle disse små vurderingspunktene, samtidig som de vet at flere sensorer ikke gir vurdering av høyere kvalitet, og samtidig som underviserne selv vil måtte tjene som sensorer i andre fag.

Dette regnestykket går ikke opp, vi vil rett og slett at sektoren vil forlate en praksis som vi vet tjener studentenes læring – meningsfulle (dvs. tellende) formative vurderinger med lav innsats. Forslaget om to sensorer kommer med andre ord rett og slett i direkte konflikt med en vitenskapelig dokumentert effektiv komponent i god studentaktiv undervisning.

Et trygt og inkluderende læringsmiljø

Inkluderende undervisning innebærer å fremme sosial utjevning i våre klasserom og fagområder. Forskning viser at vurderingsformer og vurderingspraksiser er svært viktig for å oppnå sosial utjevning i høyere utdanning. Flere studier viser at kvinner og førstegenerasjonsstudenter underpresterer på eksamen i forhold til sine medstudenter, et fenomen som delvis forklares av måten studentene blir vurdert på (Matz et al 2017, Koester, Grom, and McKay 2016, Salehi et al 2019, Salehi, Cotner, and Ballen 2020, Ballen, Salehi, and Cotner 2017). For eksempel gjør kvinner det dårligere enn menn i store grunnkurs i naturvitenskaplige fag, og særlig når selve eksamenssituasjonen oppleves som truende – såkalte high-stakes eksamener. En fersk studie (Cotner et al 2020) basert i Norge har på samme måte vist at eksamensangst, som i snitt er betydelig høyere hos kvinner enn hos menn, i seg selv fører til dårligere prestasjon på eksamen. Dersom vurderingen skjer på måter som oppleves som mindre truende, for eksempel gjennom mange små tellende formative vurderinger underveis i faget heller enn som en stor slutteksamen, er det enten ingen forskjell, eller kvinnelige studenter overpresterer.

I en studie (Cotner and Ballen 2017) i biologi, der underviserne justerte vurderingsformen i faget fra en stor slutteksamen til mange små underveisvurderinger (det vil si at de senket innsatsen for studentene), forsvant kjønnsforskjeller i eksamensresultatene. Enkelt sagt, hvordan vi vurderer realfagsstudentene våre kan påvirke økonomiske og samfunnsmessige forhold, som for eksempel underrepresentasjon av kvinner i realfag og tekniske yrker. På samme måte er vurderingsformer som innebærer en viss fleksibilitet (f.eks. lengre tid, muligheter for å ta prøven på nytt, muligheten til å slette det dårligste resultatet fra en serie av flere prøver) mer inkluderende for studenter med funksjonshemninger, deltidsjobber og familieforpliktelser. Men også for studenter som prøver å hente seg inn fra ensomhet og depresjon forårsaket av pandemien, slik tilfellet er for nesten halvparten av norske studenter i høyere utdanning akkurat nå.

Flere direkte skadelige endringer

Til slutt er det en logisk brist her som ikke kan ignoreres. Ved å tilsynelatende styrke studentenes rettigheter til en rettferdig vurdering, på bekostning av deres rettigheter til god og rettferdig undervisning, slik jeg viser ovenfor, blir underviserens rolle undervurdert. For vi vet jo faktisk bedre enn studentene våre hva som skal læres og hva som gir god læring?

Når vi beskriver læringsutbyttet i kursene våre, velger pedagogikk, og utvikler studentoppgaver og arbeidsformer, er det jo nettopp under forutsetning av at vi vet hva som er best for studentene. Den antagelsen faller fra hverandre når vi som samfunn ikke klarer å ta kunnskapsbaserte beslutninger om hvordan høyere utdanning skal reguleres, til beste for utdanningskvaliteten. Den foreslåtte nye UH-loven vil trolig føre til dårligere mulighet for underviserne til å ta i bruk gode studentaktive læringsformer, og den vil redusere kvaliteten på undervisning og læring både fra studenten og lærerens perspektiv. I stedet for et lovforslag som støtter, til og med forventer, at høyere utdanning bruker de beste kunnskapsbaserte lærings- og vurderingsmetodene, foreslår Aune-komiteen nå flere direkte skadelige endringer. Lovforslaget evner heller ikke å følge opp andre gode forslag fra en samlet høyere utdanningssektor.

I sum finner jeg det problematisk at dette nye lovforslaget ikke gir meningsfylte nye rettigheter som vil gjøre ting bedre for studentene våre, men tvert om vil sende oss tilbake til en tid med regressiv undervisningspraksis som vil gjøre ting verre, og spesielt for de svakeste studentene. Studentene våre fortjener bedre enn dette – så kjære Storting, gi oss en UH-lov som lar oss få lov til å utvikle undervisning og læring i høyere utdanning i tråd med det vi vet studentene er og samfunnet tjent med.

Referanser:

Ballen, C. J., Salehi, S., & Cotner, S. (2017). Exams disadvantage women in introductory biology. PLoS ONE, 1–14.

Bjølseth, G., Havnes, A., & Lauvås, P. (2011). Low sensor compliance – can it be improved? Uniped , 34 (04), 4-16.

Cotner, S., & Ballen, C. J. (2017). Can mixed assessment methods make biology classes more equitable ? PLoS ONE, 1–11.

Cotner, S., Jeno, L. M., Walker, J. D., Jørgensen, C., & Vandvik, V. (2020). Gender gaps in the performance of Norwegian biology students : the roles of test anxiety and science confidence. 1, 1–10.

Freeman, S., O’Connor, E., Parks, J. W., Cunningham, M., Hurley, D., Haak, D., … & Wenderoth, M. P. (2007). Prescribed active learning increases performance in introductory biology. CBE—Life Sciences Education, 6(2), 132-139.

Haak, D. C., HilleRisLambers, J., Pitre, E., & Freeman, S. (2011). Increased structure and active learning reduce the achievement gap in introductory biology. Science, 332(6034), 1213-1216.

Handelsman, J., Miller, S., & Pfund, C. (2007). Scientific Teaching. W. H. Freeman and Company.

Koester, B. P., Grom, G., & McKay, T. A. (2016). Patterns of Gendered Performance Difference in Introductory STEM Courses. 1–9. https://arxiv.org/abs/1608.07565

Matz, R. L., Koester, B. P., Fiorini, S., Grom, G., Shepard, L., Stangor, C. G., Weiner, B., & McKay, T. A. (2017). Patterns of Gendered Performance Differences in Large Introductory Courses at Five Research Universities. AERA Open. https://doi.org/10.1177/2332858417743754

Miller, S., Pfund, C., Pribbenow, C. M., & Handelsman, J. (2008). Scientific teaching in practice. Science, 322(November), 1329–1330. https://doi.org/10.1126/science.1166032

Pfund, C., Miller, S., Brenner, K., Bruns, P., Chang, a., Ebert-May, D., Fagen, a. P., Gentile, J., Gossens, S., Khan, I. M., Labov, J. B., Pribbenow, C. M., Susman, M., Tong, L., Wright, R., Yuan, R. T., Wood, W. B., & Handelsman, J. (2009). Summer Institute to Improve University Science Teaching. Science, 324(5926), 470–471. https://doi.org/10.1126/science.1170015

Salehi, S., Cotner, S., Azarin, S. M., Carlson, E. E., Driessen, M., Ferry, V. E., Harcombe, W., McGaugh, S., Wassenberg, D., Yonas, A., & Ballen, C. J. (2019). Gender Performance Gaps Across Different Assessment Methods and the Underlying Mechanisms: The Case of Incoming Preparation and Test Anxiety. Frontiers in Education, 4. https://doi.org/10.3389/feduc.2019.00107

Salehi, S., Cotner, S., & Ballen, C. J. (2020). Variation in Incoming Academic Preparation: Consequences for Minority and First-Generation Students. Frontiers in Education, 5. https://doi.org/10.3389/feduc.2020.552364

Les også:

Rektor Rice: – Krav om to sensorer er mistillit til vitenskapelig ansatte

To sensorer på eksamen vil være et skuffende tilbakeslag for høyere utdanning i Norge

To sensorer på eksamen vil være et skuffende tilbakeslag for høyere utdanning i Norge

Fra et vitenskapelig perspektiv bør disse forslagene til den nye universitets- og høyskoleloven forkastes, mener Sehoya Cotner.

En god og en dårlig nyhet

De to sensorenes lokkesang

Den høye verdien av lav innsats

Regnestykket går ikke opp

Et trygt og inkluderende læringsmiljø

Flere direkte skadelige endringer

Referanser:

Les også:

Staten handler for 734 milliarder kroner i året, og skal bruke mer av dette til innovasjon

Ytterligere kutt ved Nord universitet

Fryser støtten til fransk eliteuniversitet etter Gaza-protester

Unio om brudd i lønnsforhandlingene: – Staten har vært mest opptatt av én tariffavtale, i stedet for å løse reelle problemstillinger

Det er et betydelig spenningsforhold i tilnærmingen til fuskesaker

For Osman Ürper ble det vanskelig å forsørge familien på postdoktorlønn