Hatad i livet – glömd i döden! Gustaf och snillevalet

 

Hatad i livet – glömd i döden! Vad har man gjort för att förtjäna ett sådant omnämnde i minnesböcker? Beskrivningen gäller privatläraren och skoldebattören Gustaf Ruder som på 1730-talet blev den första i Sverige att på allvar tala för det vi ser som självklart idag – att urval till högre utbildning baseras på meriter. De mest lämpade skulle väljas, i stället för barn till välbärgade föräldrar. Idag är det ju betyg och resultat på högskoleprovet som avgör.

Gustaf Ruder förordade alltså att meriter skulle vara grunden för urval till universitet, det som då benämndes snilleval. Men hur kunde detta vara så kontroversiellt att det väckte sådant hat mot Ruder som person? 

Under Frihetstiden i Sverige på 1700-talet hade en ny generation politiker, färgade av upplysningens idéer, kommit till makten. Undervisning och uppfostran debatterades och en ny syn på begåvning och urval trädde fram. Utbildning kostade staten mycket och det fanns en risk att de ”tärande yrkena” – Gustaf Ruder använde just de orden – som exempelvis tjänstemän i staten inte gavs till de mest lämpade. 

Genom snilleprövning skulle det gå att sätta rätt man på rätt position menade Ruder. Därmed blev han indirekt en företrädare för ståndscirkulation, vilket väckte en del ont blod. Skulle nu plötsligt vem som helst få utbilda sig? 

Ett sätt att förstå Gustaf Ruders resonemang är att låna sociologen Zygmunt Baumans (1925–2017) åtskillnad mellan skogvaktarstaten och trädgårdsmästarstaten. 

Snilleväljaren, som Gustaf Ruder också kallar för trädgårdsmästare, är klart pro-aktiv. Han låter inte trädgården växa vilt, utan han sår, ansar och gallrar. Han vill få ut mer av trädgården än vad den kan ge utan vård. 

Samhällets praxis speglade snarare då skogvaktarstatens hållning om en naturlig sållning. Biskopen i Västerås skriver:

Man kan omöjligen veta, hvilkens snillegåfvor med tiden torde blifva förvärrade eller förbättrade, så lärer man ock i förtid ej med någon särdeles visshet kunna säga, hvad var och en yngling i mandomsåren skall blifva mest fallen och skicklig till. 

Det handlar alltså om att barn utvecklas på olika vis och i olika takt. Lärarens roll är att följa detta med ro, likt en skogvaktare som ger träden tid att växa och bli vad de är förutbestämda att bli. Lektorerna vid Växjö gymnasium anförde:

Alla dagar ser man väl det att den ene lärjungen är qvickare än den andre, har bättre minne och kan nu fortare göra reda för sin lexa än dess kamrat, som fast trögare, dummare, långsammare, ofta med full börd seglar den förre förbi, då dess judicium [omdöme] kommer till större mognad.

Rent praktiskt tänkte sig Ruder att snilleväljaren har tillgång till ett antal gossar  och att man bland annat studerar deras läsförmåga, skrivkunnighet, minne, kristendomskunskap samt inbillnings- och föreställningskraft. Dessutom granskas gossarnas omdömet, och deras ”affekter och sinnesböjelser”. Resultaten stämdes sedan av mot deras ”kropp och utvärtes skapnad”. 

Gustaf Ruder knyter här an till den så kallade temperamentsläran grundad av den antika läkaren Hippokrates och som delar in människan i fyra temperament formade av kroppsvätskornas sammansättning. Det är sangviniker (blod), flegmatiker (slem), koleriker (gul galla), melankoliker (svart galla). Han gör sedan en uppdelning av olika typer av yrkesgrupper och länkar varje temperament till olika uppgifter inom respektive yrkesgrupp. I staten kan koleriker till exempel bli ministrar, medan flegmatiker mer lämpar sig som betjänter. I handel kan koleriker och melankoliker bli ”rika storhandlare” medan sangviniker och flegmatiker blir ”fattiga småhandlare”. 

Den dåvarande riksdagen är enhälligt skeptiskt till dessa tankar. Förutom rent praktiska argument mot snillevalet, som att det skulle bli dyrt, framfördes teoretiska argument som tvivlade på temperamentsläran över huvud taget. Dessutom härskade den praxis som biskopen Västerås gav uttryck för ovan. 

Ruders tankar föll i glömska och ett meritokratiskt skolväsende skulle låta vänta på sig långt in på 1900-talet. 

Även om vi idag tar meritokrati för självklart när det gäller utbildning finns en ständigt närvarande diskussion om när, hur och vem som har rätten och kompetens att bedöma barns kunskaper och potential. I Sverige har de betyg lärarna sätter stor betydelse för elevernas fortsatta möjligheter – men vi litar inte helt på dem. 

Mer objektiva och externa bedömningar som de nationella proven ska beaktas vid betygssättningen. Det finns också flera förespråkare för att dessa ska få mycket större betydelse och rättas centralt av staten inte minst för att öka likvärdigheten. Det är då viktigt att komma ihåg att lärarnas betyg vilar på observationer av elevernas lärande och utveckling, ofta över flera år. Ett enskilt prov vid ett provtillfälle kan aldrig ersätta detta.

Denna text är en återpublicering av en tidigare vetenskapskrönika i NA 221209

Se vidare om Ruder här

Tidiga betyg missgynnar just de elever som politiker vill stödja

I år ska 51 skolor införa betyg i årskurs 4. De flesta är friskolor och 26 är enheter inom Internationella Engelska Skolan (se hela listan här). Efter ett regeringsbeslut 2021 fick skolorna möjlighet att införa betyg i årskurs 4. Vilka bevekelsegrunder skolorna har för sitt beslut kan säkert variera. Det man kan fråga sig är vilken vetenskaplig grund det finns för betyg i åk 4 och varför staten alls öppnade för denna möjlighet. Till saken hör att den försöksverksamhet som införts för att vägleda i frågan avbröts i förtid. 

Vi tar det från början. Tidiga betyg hade funnits i skolan sedan folkskolans tillblivelse på 1800-talet men i och med införandet av grundskolan 1969 blev det möjligt för skolor att ersätta betygen från årskurs 3 med samtal där föräldrarna informerades om hur det gick. I den nya läroplanen 1982 slopades betygen helt i låg- och mellanstadiet. Eleverna fick nu bara betyg i årskurs 8 och 9.

I samband med 1994 års läroplan och ett nytt betygssystem föreslog Moderaterna betyg från årskurs 7. Socialdemokraterna, som återtog makten 1994, bestämde att vi skulle fortsätta som det var. Sverigedemokraterna var 2010 först med att föreslå a betyg i årskurs 4, medan Folkpartiets Jan Björklund drev på för betyg från årskurs 6 – vilket också infördes läsåret 2012/13. 

Några av argumenten som användes var: 

*Länder med tidiga betyg lyckas bättre i PISA. 

*Eleverna tar skolan på större allvar om de får betyg. 

*Det är enklare för läraren att sätta in rätt stöd för elever som inte når en godkänd kunskapsnivå. 

*Betygen kan användas för att utvärdera skolornas resultat. 

Elever i länder utanför Norden får oftast betyg tidigare än vad man fått i Sverige och våra grannländer. Ett huvudskäl är att de nordiska grundskolorna är en sammanhållen skola i upp till 10 år. Många andra länder har en uppdelning mellan primär och sekundär skola, där eleverna lämnar primärskolan efter årskurs 5 eller 6. 

Tidiga betyg i dessa länder motiveras alltså av att de är avgångsbetyg från primärskolan. I länder där betyg ges ännu längre ner i åldrarna handlar det egentligen inte så mycket om betyg utan snarare om det vi i Sverige kallar för skriftliga omdömen. I Finland, där det alltid varit upp till skolorna att bestämma om betyg före årskurs 8, får skolorna också bestämma hur betygen i lägre åldrar ska utformas. Det är inte ovanligt att betygen snarare är kvalitativa omdömen.  Dessa omdömen ges sällan i alla ämnen i de lägre åldrarna. Om lärarna sätter betyg för yngre skolbarn så använder de heller inte alltid alla betygssteg. I Sverige ska betygsskalan utnyttjas fullt ut för alla ämnen redan från årskurs 4.

Vad säger då forskningen? Faktum är att frågan om tidig eller sen betygssättning inte är något som forskare ägnat sig jättemycket åt. Det finns en gedigen studie från Göteborgs universitet där forskaren Alli Klapp tittade på om det blev skillnader mellan elever födda 1967 som gått i kommuner där tidiga betyg avskaffats – och elever i kommuner där man behöll tidiga betyg. 

Alli Klapp kunde konstatera att elever som fått tidiga betyg, som grupp lyckades sämre i den fortsatta skolan. Det fanns dock skillnader eleverna emellan. Flickor och högpresterande elever påverkades inte lika negativt som pojkar och lågpresterande elever.  

Det finns en teori om motivation som kallas COR-teorin (Conservation of Resources Stress Theory). Enligt denna är det lågpresterande elever och elever som överskattar sin förmåga i skolarbete – vilket pojkar tenderar att göra – som förlorar mest på negativ feedback, alltså låga betyg. Högpresterande elever och de elever som underskattar sin förmåga påverkas inte i samma utsträckning. Detta förklarar varför tidiga betyg verkar missgynna just den gruppen elever som politikerna vill stödja mest med tidiga betyg.

I PISA-mätningarna gick det heller inte att se något samband mellan tidig betygssättning och kunskapsresultat. Studier av elever som fått betyg från årskurs 6 har däremot visat att stress och psykosocial ohälsa har ökat i denna grupp. 

Vissa forskare hävdar att betyg är en form av feedback som väcker oerhört mycket känslor. Just detta kunde den forskargrupp jag ingick i med uppdrag att utvärdera försöksverksamheten med betyg i årskurs 4 bekräfta. Vi kunde också se betygen i sig blev viktigare än andra värden – som att det är roligt eller intressant att lära sig. 

 Det vetenskapliga stödet för betyg i lägre åldrar är alltså ganska svagt. Ändå fattade den socialdemokratiska regeringen beslut om att tillåta betyg från årskurs 4, som en del av Januariavtalet. Försöksverksamheten vi skulle utvärdera och som då pågick för fullt, lades ned. Vi kunde ändå färdigställa en slutrapport som publicerade en dryg termin efter att utbildningsutskottet beslutat om de nya betygens införande. 

Det där med att all utbildning i Sverige ska vila på vetenskaplig grund, som det står i skollagen, gäller uppenbarligen inte alltid de utbildningspolitiska reformerna. Bra då att skolorna just kring tidiga betyg kan göra egna kloka val. 

Denna text är tidigare publicerad som en veteskapskrönika i NA 220930

Källor:

Alli Klapp (2015). Does grading affect educational attainment? A longitudinal study, Assessment in Education: Principles, Policy & Practice, 22:3, 302-323, DOI: 10.1080/0969594X.2014.988121

Håkan Löfgren m.fl. (2021). Betyg i årskurs 4 – Fördjupad studie av bedömningspraktikerna

Christian Lundahl m.fl. (2017). Betygssystem i internationell belysning

Vilket är elevens rätta resultat?

Det finns de som påstår att det är lätt att mäta kunskaper. Allt som oftast står det i tidningarna att elever får för höga betyg eller fel betyg med utgångspunkt i jämförelser mellan de betyg lärare har satt på elevernas kunskaper och elevers resultat på de nationella proven. Redan här förstår man kanske att det inte är helt lätt, för vem har egentligen mätt rätt? I dagsläget och på goda grunder som jag ska visa, ska emellertid inte de nationella proven styra lärares betyg. De ska vara ett stöd i betygssättningen. Anledningen är att det inte helt objektivt går att mäta den typ av kunskaper våra läroplaner anger att eleverna ska lära sig, och att mätandet i sig påverkar vad och hur eleverna lär sig. Detta brukar diskuteras i termer av validitet och reliabilitet. Validitet, giltighet, handlar ytterst om hur säkert vi kan uttala oss om ett resultat utifrån hur säkra vi är på vad vi har mätt, eller som Samuel Messick uttrycker det i sin klassiska artikel Validity:

Validity is an integrative evaluative judgment of the degree to which empirical evidence and theoretical rationales support the adequacy and appropriateness of inferences and actions based on test scores or other modes of assessment. (Messick 1989:13)

Messick diskuterar två hot mot möjligheten att göra valida tolkningar av ett testresultat, dels construct under representation, dels construct irrelevant variance. Det första handlar om att ett prov inte tillräckligt förmår fånga skillnaden mellan elever kring det vi ville mäta. Om vi t.ex. har ett flervalsprov i historia så fångar det elevernas skilda kunskaper kring historiska fakta men inte huruvida eleverna kan konstruera ett historiskt argument, eller för att ta något uppenbart, att muntlig förmåga inte mäts på ett skriftligt prov. Alltså, construct under representation handlar om att viktiga aspekter av ett kunnande är underrepresenterade i ett prov.

Construct irrelevant variance handlar om motsatsen, uppgiften mäter något som den inte borde mäta. I ett test i matematik kan frågorna vara formulerade med ett så pass svårt språk att vi inte vet om skillnaden mellan eleverna beror på läsfärdighet eller matematisk färdighet. Reliabilitet, trovärdighet, handlar om i vilken grad resultaten på ett test kan bero på slumpmässiga faktorer, eller faktorer utom testarens kontroll. Paul Black och Dylan Wiliam (2011) menar därför att reliabilitet ytterst är en fråga om construct irrelevant variance, alltså om validitet. Har ett test låg reliabilitet går det inte att göra valida tolkningar av resultatet eftersom man inte vet vad resultatet beror på.

En vanlig metafor för reliabilitet och validitet är nedanstående bild (se t.ex. Koretz 2008):

validitet och reliabilitet

Den fjärde bilden ses som både reliabel och valid. Men säg nu att kursplanen definierar hela tavlan som mål för undervisningen. Då får du en påtaglig construct under representation i det fjärde fallet. Snarast är det då den andra bilden som ger bäst construct representation, men mot en betydligt lägre inre konsistens. Man får alltså i praktiken i viss utsträckning bestämma sig för om man ska betona reliabilitet eller validitet, eller hitta någon lämplig kompromiss – vilket inte är det lättaste.

Det finns tre övergripande hot mot reliabiliteten:
1) Olika bedömare gör olika tolkningar av elevernas svar
2) Elevernas dagsform påverkar hur de svarar och om de kan eller inte
3) Olika uppgifter men som mäter samma kunskaper uppfattas på olika sätt av olika elever.

Ett sätt att öka reliabiliteten är genom att införa fler frågor på varje mätområde. Vi vill kanske ge eleverna tre olika möjligheter att visa att de förstår ett specifikt moment. Om vi på detta sätt vill öka den så kallad interbedömarreliabiliteten från ett läge där oberoende bedömare kommer till samma slutsatser i 64 procent av fallen till 81 procent av fallen, behövs en uppgiftsmängd som förlänger provtiden 5 till 6 gånger menar Black och Wiliam (2011), dvs. upp mot 25-30 timmar om vi tar ett Nationellt prov som exempel. Skulle vi göra det får vi dock ett annat problem – eleverna blir så trötta att de underpresterar. Alternativet är att vi gör ett test som täcker in färre områden, men då får vi alltså underrepresenterade kunskapsområden. Det hela handlar om klassisk testteori. Vanligtvis brukar man beräkna hur många uppgifter som behöver adderas till ett prov för att uppnå en viss reliabilitet. Det gör man med hjälp av Spearman-Browns formel. De flesta provkonstruktörer väljer en balans mellan dessa poler med den uppenbara konsekvensen att det finns mätfel även i de allra mest ambitiöst konstruerade proven. Ska man göra vettiga tolkningar av ett prov måste man därför ha en aning om mätfelets storlek. Black och Wiliam (2011) har ett resonemang om hur man kan tänka om det genom att ha en hypotes om elevernas rätta resultat. Det finns inget meningsfullt prov där elever skulle få samma resultat varje gång. Elever gör olika fel vid varje mättillfälle och bedömare gör olika rättningar vid olika tillfällen. Men om man lade ihop en elevs resultat på fem till sex liknande prov under en begränsad tid skulle man få fram ett genomsnittligt resultat som kallas the true score – det rätta resultatet. Ett sätt att åstadkomma detta i praktiken är att arbeta med split half-metoden som innebär att man gör ett prov som kan delas i två delar. Sedan jämför man utfallet på de två delarna. Är det hög överensstämmelse har uppgifterna en hög inre konsistens avseende vad de mäter. Överensstämmelsen är dock också beroende av hur man delar upp testet och därför måste man korrelera alla tänkbara rimliga sätt att dela testet på med varandra. Då får man ett värde som kallas Cronbachs alpha och som uttrycks mellan 0 och 1, där 0 betyder att proven ger slumpmässiga utfall och 1 att provet är helt reliabelt – varje gång vi gör det får vi samma resultat. En vanlig uppfattning är att Cronbach alpha bör ligga på 0.7 och uppåt om testet ska vara användbart, men det beror givetvis på vad det faktiskt är man mäter. För att förstå vilken effekt olika grader av reliabilitet faktiskt kan få t.ex. för vilket provbetyg en elev får behöver vi kombinera Cronbach alpha med ett mått på elevens sanna resultat (the true score).

För att undersöka hur provets inre konsistens påverkar resultatet för en elev kan Cronbach alpha sättas i relation till standardavvikelsen, dvs. den genomsnittliga avvikelsen från medelvärdet. En bra illustration till hur man kan räkna finns i Black och Wiliam (2011). På en normalfördelningskurva faller 68 procent av resultaten inom en standardavvikelse och 96 procent inom två standardavvikelser. Genom att kombinera dessa mått går det att få fram ett förväntat standardfel, SEM. Standardfelet anger för varje reliabilitetsnivå den förväntade spridningen av felprocent inom en och samma faktiska kunskapsmängd.

Formeln för SEM är X √(1-r)

Om r är reliabilitet så betyder detta att SEM på ett prov med en reliabilitet på 0.85, där man kan få 50 poäng och där standardavvikelsen (X) är 7,5 poäng blir 2,9 poäng (SEM=7,5√(1-0,85)=2,9). Det innebär att den ”sanna poängen” för en elev med 35 provpoäng till 68 procents sannolikhet ligger mellan 32 och 38 poäng. Vill man ha 95 procents säkerhet kan man säga att den ligger mellan 29 och 41. Detta är i själva verket en approximation, men används allmänt i professionell provanalys. Detta innebär hursomhelst att i en klass på 30 elever så är det minst en elev, vi vet aldrig vem, som avviker mer en 12 procent i positiv eller negativ riktning, det kan vi heller inte veta, från sitt riktiga resultat. Minst tio elever avviker 6 procent från sitt sanna resultat relaterat till provens bristande inre konsistens (som i det här exemplet trots allt inte var så farligt hög). Effekten för den enskilda individen kan dock bli stor varför professionella testkonstruktörer gärna är extra försiktiga med vilka slutsatser de drar från ett prov. Black och Wiliam skriver:

even the best tests can be widly inaccurate for a few individual students /…/ This is why testing experts invariably say that high-stakes decisions should never be based solely on the results of a single test. (Black & Wiliam 2011, s. 252)

Det är också av detta och likande skäl som nationella prov inte ska styra elevernas betyg. Om de gör det kommer vissa elever ändå att få fel betyg. Staten har därför valt att lita också på lärarnas omdömen. Frågan som uppstår är emellertid om lärares betyg hamnar ännu mer fel. Det kan vi inte veta med mindre än att vi forskar mer om hur lärare tänker när de ger eleverna deras betyg. Vi vet alltså inte vilken bedömning det är som är mest construct relevant, provbetyget eller lärarnas betyg. Men om vi bara håller oss till reliabiliteten i bedömningarna av proven går den att förbättra med olika medel. Ett sätt har varit att erbjuda elevexempel för olika betygsnivåer så att lärarna vet vad de ska titta efter. Det kvarstår dock fortfarande en stor del bristande bedömaröverensstämmelse, särskilt i uppsatsdelarna. Ett rimligt nästa steg är att låta lärare rätta proven tillsammans i grupp. Man rättar alltså sina egna elevers resultat och de andra lärarnas gemensamt. Det skulle göra att lärarna ”skrapar av” varandras extremer och därigenom, om gruppen är någorlunda heterogen, men inte nödvändigtvis större än 4-5 lärare, når en norm som skulle likna den liknande grupper skulle komma fram till (för en bra beskrivning av hur det praktiskt kan gå till se här och här). Det krävs alltså inte en särskilt stor kritisk massa för att enas om den mest rimliga tolkningen. I en sådan process skulle lärarna också utveckla sin ämneskompetens i det att de lära av varandra vad som är viktigt att fästa uppmärksamhet vid i olika moment av ämnet. Att låta lärare kontrollrätta varandras elevers anonymiserade prov menar jag däremot är en sämre väg att gå. Det förstärker misstroendet till lärarna och det blir inte nödvändigtvis rättvisare för eleven. Framförallt tar det bort ett tillfälle för lärare att lära av varandra. Bedömning av elevers kunskaper kan aldrig ske helt objektivt – däremot kan det utföras med en tillräckligt hög grad av intersubjektivitet för att tillfredsställa både individens och samhällets krav på likvärdighet!

Referenser

Black, Paul and Wiliam, Dylan (2011). The reliability of assessments. In John Gardner (ed.). Assessment and Learning. 2nd edition Los Angeles and London: Sage Publications, p. 243–263.

Koretz, Daniel M. (2008). Measuring up: what educational testing really tells us. Cambridge, Mass.: Harvard University Press

Messick, Samuel (1989). Validity. In Robert L. Linn (ed.): Educational Measurement. 3d edition 1993. Phoenix: The Oryx Press, p. 13–103.

Betygsmotståndet som raderade ut sig själv

I would … propose, as a very first definition of critique, this general characterization: the art of not being governed quite so much (Foucault 1978/1997, s. 29)

I slutet av 1990-talet föreläste jag på Elevorganisationen. Organisationens ordförande berättade då om ett möte han haft med Ylva Johansson innan hon slutade som skolminister 1998. När Ylva kom till socialdemokraterna från VPK var hon betygsmotståndare. Hon reserverade sig i ett särskilt yttrande mot betyg i grundskolan i 1992 års betygsberedning. Helst ville hon inte alls se betyg i grundskolan, men det kunde finnas en poäng med att eleverna vande sig (SOU 1992:86). Några år senare drev hon inte längre något betygsmotstånd. Till elevorganisationens ordförande hade hon sagt att Statsminister Göran Persson tydligt markerat att betygsmotstånd – det var inget annat än ett politiskt självmord.

Förmodligen hade betygsmotståndarna redan i sak påbörjat sitt självmord innan Ylva Johansson blev skolminister. Det klassiska betygsmotståndet i svensk utbildningsdebatt utgick från två marxistiska föreställningar.

Den ena är idén om att kapitalet ska fördelas rättvist. Betyg kan utifrån marxistisk teori ses som ett symboliskt kapital, och som likt alla typer av kapital skapar bättre möjligheter för den som har mer av varan jämfört med de som inte har. Eftersom skolan hade det innehåll den hade kom arbetarbarn att få sämre betyg än de från medel- och överklassen, vilket innebar att de senare genom betyg gavs en ökad förmåga att skaffa sig ett materiellt välstånd. Skolan bidrog med betygen till klassamhällets reproduktion, hette det.

Den andra är att de som arbetar primärt för kapitalet kommer att alienera sig med sitt arbete och på sikt också från sin egen inre mening. Betyg bidrog till att barnen tidigt vande sig vid klassamhällets struktur, de högre betygen och de lägre betygen motsvarade de framtida klasserna eleverna skulle socialiseras in i. Om betygen upplevdes bekräfta en klasstillhörighet blir det svårt att känna mening med studier. Betygen skulle ge en samhällsposition i konkurrens med andra. Höga resultat kunde ge bättre möjligheter senare i livet men hade inget egenvärde som bildning.

Även om betygsmotståndarna såg pedagogiska fördelar med att avskaffa betygen, såsom att det utan betyg skulle vara lättare att involvera eleverna i undervisningen, så gjordes betygskampen huvudsakligen till en klasskamp (Lundahl 2006). Det var inte främst skolan som skulle ändras utan samhället, men med skolan som medel. Att bli av med betygen var bara det första steget i kampen mot en produktionsordning som skapade ojämlikhet. Den orättvisa produktionsordningen skulle kännas värre när man började arbeta om man inte som elev hade vant sig vid dess logik redan via betygen. I ett redaktionellt förord till den pedagogiska vänstertidskriften KRUT varnar man för att betyg gör oss avtrubbade inför samhällets orättvisor:

Kanske behövs inte betygen längre. Men att ta bort dem skulle inte upphäva sorteringen. Det sker inte förrän den nuvarande produktionsordningen byts ut. Om betygen tas bort kan den sortering som sker i arbetslivet bli mer tydlig och kännas mer brutal. Förhoppningsvis kommer den därför att väcka större motstånd, när eleverna ställs direkt inför den. (Krut 1978 nr 5, s. 7)

Hade eleverna inte vant sig vid orättvisor genom skolans betyg skulle chocken bli större när de kom ut i arbetslivet, och revolutionsivern skulle därmed näras. Genom att relativt ensidigt under 1970 – 1990 talet fokusera på betygens klassorterande bieffekter försvann ett av betygsmotståndarnas huvudargument när gymnasieskolan i praktiken blev tillgänglig för alla. Betygsmotståndarna var nog förvisso också nöjda med att ha bidragit till att tidiga betyg avskaffades och att det relativa betygssystemet försvann. Man hade likt många marxister vid tiden gått i fällan att stirra sig blind på den ojämlika distributionen utan att reflektera över de mekanismer som låg bakom denna ojämlikhet, och de mer djupgående konsekvenserna av dessa mekanismer. Man hade man glömt vad ”kapitalet” (betygen) gjorde med de som satte vinsten först. Marx efterlyste inte bara jämlik resursfördelning utan varnade även för hur kapitalet i sig kunde korrumpera; hur bytesrelationer ersätter tillfredställandet av ömsesidiga och grundläggande behov. När kapitalet frikopplas från arbete förlorar arbetaren sitt egenvärde. Hade betygsmotståndarna i större utsträckning hållit fast vid betygens (kunskaps)alienerande effekter snarare än dess sorterande effekter, då hade grunden för motståndet inte lika enkelt kunnat avfärdas, eller som det kanske snarare blev – upplösas.

Bild 1. Vykort från provbojkotten. ur Krut 1983 nr 27/28, s. 67.

Under 20 år har det rått relativ borgfred mellan betygsvänner och betygsmotståndare. Sena betyg i få steg och egentligen utan egentligen urvalsfunktion har inte varit så mycket att bråka om. Det som är intressant, är därför att betygsmotståndet inte kommer tillbaka nu när det blir betyg i fler steg, i lägre åldrar och då meritmedelvärden fått en förstärkt betydelse. Elevorganisationen som av hävd och gammal vana varit motståndare mot betyg valde att inte avge något yttrande till utredningarna och propositionerna för betyg i 6 steg respektive betyg från årskurs 6. Däremot har de kämpat för rätten att överklaga betyg (här). Socialdemokraterna gick aktivt ut och stödde propositionen både om betyg i 6 steg och från årskurs 6. Miljöpartiet och Vänsterpartiet teg still, åtminstone i den offentliga debatten. Lärarförbundet som förut varit kritisk mot i alla fall tidig betygssättning, verkar ha kohandlat bort alla innehållsfrågor i skoldebatten för att (tro sig få) lärarlegitimationer.

Om vi återvänder till citat från tidningen KRUT kan vi nog säga att en viss avtrubbning skett, både så att vi vant oss vid betyg och vid marknadsbaserade fördelningsprinciper. Till och med hos RKU – Revolutionär Kommunistisk Ungdom – har betygen vunnit acceptans. Däremot är de oroade, som de flesta andra, för betygsinflationen och vad den gör med rättvisan (här). Ett annat sätt att säga detta är att det skett en acceptans av systemet som sådant. Detta sker i en tid när tecknen är mycket tydligare än de var på 70- och 80-talet på att betyg kan ha negativa effekter på motivation och lärande (Dweck & Elliot 2005, Lundahl, Riis & Román 2010, Klapp-Lekholm kommande). Att många betraktar betyg som oproblematiska kan ses som ett uttryck för det som inom marxistisk ideologi kallas falskt medvetande.

Betygsmotståndet i Sverige har varit för ensidigt inställt på betygskamp som likställd klasskamp. Detta har skymt annan och, har det visat sig, viktigare kritik av betygen. Om vi i svensk utbildningsdebatt inte kan föra en kritisk diskussion om betygen, där dessa får ifrågasättas, så går vi miste om en viktig debatt om människosyn och kunskapssyn i skolan. Dessutom är betygen idag mycket mera också betyg på lärare och skolor. I en konkurrensutsatt verksamhet som styrs med mål och resultat blir det också viktigt att resa frågor om mätbarhet och likvärdighet. Internationellt sätt är Sverige unikt i att betygsfrågan hanteras med en lekmannaterminologi. Utomlands förs snarare dessa diskussioner i termer av validitet och reliabilitet, och utifrån dessa begrepp kan man inte tycka hur och vad som helst. Framstående psykometriker som Daniel Koretz (2008) och Royce Sadler (2005) menar t.ex. att kriteriebaserade betyg kan vara direkt olämpliga som mått på likvärdighet. En kritisk analys av betygen som resultatmått och marknadsvärdering är ett välkommet inslag i dagens skoldebatt, men vad har hänt med den pedagogiska kritiken? Betyg har inget egenvärde utan har sitt berättigande i sina funktioner och konsekvenser. Låt oss därför titta sakligt på dessa och väga olika fördelar mot nackdelar utifrån försöksverksamhet och utvärdering. Låt oss också ta nya infallsvinklar och diskutera exempelvis: frivillig betygssättning, olika betygsskalor i olika ämnen, tydliga mål men med kvalitativ återkoppling för yngre barn, barns rätt till värderingsfria zoner, den sammantagna dokumentationsbördan för lärarna, vad föräldrar egentligen vill veta, skolors bedömningspolicy. Ingenting är mer förödande för ett kunskapsområde, än frånvaron av kritik.

Referenser

Foucault, M. (1978/1997). Whats is Critique? S. Lotringer (Red.): The politics of thruth, 23–82. US: Semitext(e).