Store språkmodeller, også kalt LLMer, er utviklet gjennom maskinlæring på store mengder data. Disse modellene danner grunnlaget for samtaleroboter og andre KI-baserte tjenester. Munin gjør store språkmodeller tilgjengelig i et brukergrensesnitt, slik at brukeren kan sende instrukser til en språkmodell og få en beregnet respons tilbake.
Munin skal understøtte ulike utviklingsprosjekt i organisasjonen der det overordnede formålet er å forbedre vår forståelse av mulighetene og implikasjonene ved bruk av KI-teknologi og KI-støttet praksis, i opplæring og utdanning, samt fylkesadministrasjonen. Utviklingen omfatter både tekniske løsninger og forvaltningsprosesser, samt praksisutvikling og brukermedvirkning.
Munin tilgjengeliggjør språkteknologi fra blant annet NORA, Nasjonalbibliotekets AI-lab, Mistral AI, med flere. Tjenesten er tilgjengelig for alle elever, lærlinger, studenter og ansatte, i Vestfold fylkeskommune.
Språkteknologi i Munin
Gjennom Munin har alle brukere tilgang til tre ulike språkmodeller: Mistral Large 2, GPT-4o, og Nora. Mistral Large 2 og Nora er modeller med åpne vekter, og er tilgjengelig for nedlastning fra de respektive modellkortene på HuggingFace.
Enkelte brukere har også tilgang til Nasjonalbibliotekets Whisper-modell, for tale-til-tekst (transkripsjon).
I tillegg har alle brukere tilgang til kildekallene i matematikk og geofag. Dette er eksperimentelle systemer basert på ulike teknikker for å kalle autoritative kildedata, som er eksterne til modellen.
- Matematikk: Læremiddelet OpenMathBooks, etter tillatelse gitt Vestfold fylkeskommune og Telemark fylkeskommune.
- Geofag: Utvalgte datasett fra NVE (Norges vassdrags- og energidirektorat) og NGU (Norges geologiske undersøkelse), som er utgitt på nlod-lisens.
Sannsynlighetsberegning i svar fra Munin
Munin har to ulike metoder for å skape responser for brukeren.
- Ved bruk av språkmodellene Mistral Large 2, GPT-4o eller Nora, er Munin begrenset til skape respons basert på modellenes "parametriske minne". Dette er avgrenset av datasett som de underliggende språkmodellene er trent på, og det modellen har lært av parametre gjennom trening (maskinlæring).
- Ved bruk av "kildekall", så kan Munin trekke på autoritative datakilder som er eksterne til språkmodellen. Disse kildene brukes til å berike responsen og kan ettergås gjennom ulike kildekritiske tilnærminger.
Uavhengig av måte inndata brukes i å skape ulike responser, så er all respons skapt i Munin basert på at en maskinlæringsmodell (f.eks. Mistral Large 2 eller Nora) er trent til å predikere/forutsi som det mest sannsynlige neste ord, gitt de foregående ordene. Dette tolkes ut ifra konteksten som er gitt i instruksen fra brukeren eller andre data som definerer kontekst. Kontekst er ordene i spørringen som avgrenser/vekte hva språkmodellen anser som mest plausibelt svar. Presisering av kontekst kan hjelpe språkmodellen til å bli mer presis, og å skape en respons i tråd med brukerens intensjon. Dette kan lærere og elever også bevisst nyttiggjøre seg av i læringsarbeidet. F.eks. "fortell en morsom historie om pingviner". "Fortell", "historie" og "morsom" vil gi språkmodellen instruks om formen på svaret, og "pingvin" vil gi den instrukser om blant annet sted, type dyr, klima, med mer, alt basert på å aktivere deler av modellen med ord og deler av ord som er klassifisert som nær hverandre.
En språkmodell reproduserer ikke i seg selv kunnskapen den er trent på (da ville den vært overtrent til å passe treningsdataene), men skal kunne generalisere til nye oppgaver, basert på eksemplene – etter en induktiv tilnærming. Dette kan på ulike måter brukes til å skape tekstlig innhold som er mer eller mindre korrekt. Som et forsøk på å øke validiteten (at modellen responderer på det vi tror den gjør) og reliabiliteten (at vi med høy grad av stabilitet kan gjenskape det vi har skapt tidligere). Responsen til språkmodeller kan manipuleres på ulike måter, blant annet gjennom kontekstsetting (avgrensning som endrer vekting) og temperaturvariasjon (høyere eller lavere variasjon). Gjennom slike teknikker kan brukeren eksperimentere med aktiveringen av parametere i modellen.
Hva Munin kan brukes til
Store språkmodeller og KI-assistentene som baserer seg på disse, er spesielt egnet til å sortere store mengder informasjon og å gi ulike responser til brukeren basert på disse. Store språkmodeller kan være særlig godt egnet til språklige oppgaver, men er ikke godt egnet til å utføre beregninger (med mindre disse er del av treningsdata og -prosess).
De ulike modellene i Munin har noe ulik funksjon. Mistral Large 2, GPT-4o og Nora er alle modeller med et generelt formål. Disse modellene er trent til å generalisere, basert på eksemplene de er gitt under trening. Det betyr at de f.eks. kan gi et bredt utvalg av faglige eksempler ved liste og sammenstille informasjon fra mange ulike kilder, men at det de skaper kan ha ulik grad av nøyaktighet eller riktighet. Dette er en grunnleggende funksjon ved teknologien og noe som må være en faktor i hva Munin brukes til.
Kildekallene i Munin kan brukes til å skape ulik nivåtilpasset respons basert på læremidler og læringsressurser. F.eks. så kan Geofag-modellen brukes til å skape respons basert på data hentet fra NVE og NGU, og så lagt til grunn i en database som modellen henter dataene fra, til bruk i prosessen med å skape tekst (inferens).
Munin kan brukes til å analysere, tekst, lyd og bilde (inndata), men kan kun skape tekst i responsen (utdata) til brukeren.
Hva Munin ikke kan brukes til
Munin er basert på en fremvoksende teknologi, som har både kjente og ukjente begrensninger. Teknologien er relativt uprøvd i undervisning og det eksisterer lite forskning på anvendelse av teknologien i pedagogisk og fagdidaktisk praksis. Samtaleroboten har ingen funksjon for å vurdere om svaret den gir er godt eller ta hensyn til ting utenfor en gitt kontekst – det er utelukkende en vekting av ord og deler av ord, i forhold til hverandre. Responsen representerer ikke noen form for fagkompetanse, men er utelukkende en metode for å generalisere (induktiv tilnærming), basert på eksempler modellen er trent på.
Tekst og annen respons skapt av språkmodeller er i prinsippet ikke-deterministisk, noe som vil si at variasjon i det som skapes er en grunnleggende del av systemet. Språkmodeller lager derfor tekst som kan inneholde feil eller være upresist. Vurder alltid om bruken av språkteknologi passer med formålet ditt. Dersom du forventer en presis eller "riktig" respons, så er det særlig viktig å kontrollere opp mot andre kilder.
På bakgrunn av kjente begrensninger i teknologien og lovmessige rammer i forvaltning og opplæring, skal Munin ikke brukes som:
- plagiatkontroll eller KI-deteksjon, for å få indikasjoner på om elevens tekst er plagiert (kopi) eller skapt av en samtalerobot.
- beslutningsstøttesystem, der anbefalinger i respons fra språkmodellen kan få vesentlig betydning for elevens opplæring eller sluttvurdering — slik som "karaktersetting".
- beslutningsstøttesystem der respons utgjør vesentlig del av en saksutredning som er nødvendig for å utføre en oppgave jf. forvaltningslova §2 bokstav b.
Ikke send inn data som inneholder opplysninger om deg selv eller andre personer. Eksempler på dette kan være navn, bosted, kontaktopplysninger, eller opplysninger om din eller andres religion eller politiske oppfatning, m.m.
Munin skal ikke brukes i noen sammenheng der det utarbeides grunnlag for enkeltvedtak, og som kan medføre brudd på god forvaltningsskikk.
Les mer om personopplysninger på Datatilsynets nettsider.
Viktig informasjon om data som behandles i Munin
Munin kan i enkelte tilfeller gi svar i form av personopplysninger – både som kan være til dels riktige eller direkte feilaktig. Disse opplysningene må ikke kopieres videre til f.eks. et Word-dokument eller annet sted. Samtaleroboten gir ikke nødvendigvis noen indikasjon på hvor nøyaktig eller riktig svaret er. Lærer må derfor alltid kunne gjøre seg kjent med resultatene samtaleroboten har gitt, slik at det er mulig å veilede eleven eller å diskutere resultatene i fellesskap.
Det skal kun lastes opp dokumenter og andre filer for analyse, inkl. transkribering av lyd og video, der du selv eller Vestfold fylkeskommune er å anse som opphaver, jf. lov om opphavsrett til åndsverk §2.
Instrukser som ikke skal utføres i Munin
Tjenesten har innebygget moderasjon som regulerer instrukser som inkluderer hatefulle ytringer, trusler, selvskading, vold og seksuelt innhold. Til tross, så skal det ikke sendes instrukser om:
- ulovlig aktivitet knyttet til terrorisme.
- datakriminalitet og annen cyberaktivitet, som kan tolkes som ulovlig.
- tilvirkning og spredning av våpen og narkotika, som kan tolkes som ulovlig.
Dette er informasjonskategorier som er omfattet av både nasjonalt og ekstraterritorielt lovverk og jurisdiksjon, og som kan få implikasjoner for den enkelte, utover Vestfold fylkeskommunes regelverk. Ellers gjelder Vestfold fylkeskommunes retningslinjer for bruk av IKT, for elever og ansatte.
Les mer om filtrering av nettrafikk og nettinnhold.
Behandling av personopplysninger i Munin
Formål
Tjenestens formål er å tilby et samlet brukergrensenitt for interaksjon med én eller flere store språkmodeller (LLM), til bruk i opplæring og utdanning. Interaksjon med Munin muliggjør en praktisk tilnærming for elevers læringsprosesser og mål, slik de defineres i læreplanverket. Munin kan også være en muliggjørende faktor som teknologistøtte for elevens læringsprosess. Lærere kan bruke Munin til å genererer grunnlag for planlegging av undervisning og utforming av undervisningsressurser.
Andre formål inkluderer utvikling, drift og sikkerhet, inkl. innholdsfiltrering.
Behandlingsgrunnlag
Hovedrettsgrunnlaget er artikkel 6 nr.1 bokstav e: behandlingen er nødvendig for å utføre en oppgave i allmennhetens interesse.
For elever: supplerende grunnlag i opplæringsloven §§1-3, 3-4, 15-10, og læreplanverket som forskrift.
For studenter: supplerende grunnlag i fagskoleforskriften §4 1.ledd.
Dette behandlingsgrunnlaget gir den registrerte rett til å protestere på en lovlig behandling, med grunnlag i at deres særlige situasjon går foran behandlingsansvarliges tvingende berettige interesser. Det kan protesteres på midlene som er benyttet til å oppfylle formålet, men ikke på formålet i seg selv.
Les mer om behandling av personopplysninger i digitale læringsressurser og pedagogiske fagsystem.
Kategorier av personopplysninger, databehandlere og sletterutiner
Opplysningene nedenfor behandles av Vestfold fylkeskommune, som er behandlingsansvarlig.
Databehandlere:
- Amazon Web Services, Inc. (Irland)
- Microsoft Norge AS
- Mistral AI. (Frankrike)
- OpenAI Ireland Ltd.
- Organisasjonstilhørighet (Vestfold fylkeskommune)
- Instrukser utført i Munin, som behandles via språkmodellen normistral-7b-warm-instruct (Nora), via HuggingFace/AmazonWebServices.
- Personopplysninger i svar generert av språkmodell på bakgrunn av modellens parametere (minne).
- Navn
- Epost (brukeridentifikator)
- Fylkes- og skoletilhørighet
Personopplysninger behandlet av Microsoft Norge AS er knyttet til eleven eller den ansattes skole- eller jobbkonto.
- Organisasjonstilhørighet (Vestfold fylkeskommune)
- Instrukser utført i Munin, som behandles via språkmodellen Mistral Large 2, via Mistral La Platforme.
- Personopplysninger i svar generert av språkmodell på bakgrunn av språkmodellens parametere (minne).
- Organisasjonstilhørighet (Vestfold fylkeskommune)
- Instrukser utført i Munin, som behandles i språkmodellen GPT-4o, via OpenAI.
- Personopplysninger i svar generert av GTP-4o/språkmodell på bakgrunn av språkmodellens parametere (minne).
Opplysninger behandlet av OpenAI Ireland Ltd. lagres i 30 dager før sletting. Opplysninger viderebehandles ikke til andre formål og utleveres kun for å imøtekomme rettslig kjennelse.
Data lagt til grunn i kildekall inneholder ikke personopplysninger.
Personopplysninger behandlet separat av databehandlerne og sammenstilles ikke av Vestfold fylkeskommune som behandlingsansvarlig.
Spørsmål om behandling av dine personopplysninger, samt eventuell protest, sendes personvernombud@vestfoldfylke.no.
Teknisk dokumentasjon
Relevant teknisk dokumentasjon med endringer publiseres fortløpende av Vestfold fylkeskommune på github.com/vestfoldfylke