Som vanlig litt på etterskudd: Men her kommer oppdateringer i regnværet. Tirsdag fikk vi først kortversjonen av de Smedts forelesning om korpus og lingvistikk. Korpus er en samling språkmaterialer (tekst eller tale) som er spesielt tilrettelagt med tanke på språkvitenskapelige undersøkelser.

Først trodde jeg det var en samling av alle ordene i et språk. men det var tydeligvis feil. Det er alle ordene men de er i bruk i en eller annen form for tekst (altså i en kontekst?).

Men språket er uendelig i variasjon og et korpus må være en begrenset mengde. Derfor blir det svært viktig å få et balansert korpus. Hvis ikke vil man få feile resultater når man bruker korpuset til forskning. Man kan for eksempel forske på gatespråket til ungdommer i London eller avvisspråket i Norge. Man kan se på hvor ofte et ord brukes (frekvens) og hvor ofte to eller flere ord står ved siden av hverandre i en tekst. Eller på frekvensen av feilstavinger hos fremmedspråklige, eller forskjeller mellom kvinner og menns ordbruk. Det finnes en rekke korpusdatabaser tilgjengelig. Blant annet Oslo korpuset som er samling av avistekster.

Man kan også lage samlinger av alle tekster til en forfatter. Da kalles det et arkiv. UIB har vært med på å lage et arkiv over Ibsens tekster.

Så til Wiki.
Vi fortsatte også med wikiprosjektet. Vi var delt i to grupper men kom til nesten samme resultat. En wiki skal per definisjon være åpen for alle til å skrive og endre på. Men vi ønsket forhåndsmoderering på det meste. Mest var vi opptatt av at studentene ikke skulle føres på ville veier. Stoler vi ikke på våre medstudenter?

Jeg prøver meg med noe nytt.! En poll: