Foredrag i Selskab for Nordisk Filologi


Jørg Asmussen:


Korpus 2000 - til hvilken nytte?

Baggrund, muligheder for empiriske sprogundersøgelser, fremtidsperspektiver

Torsdag den 21. november 2002 kl. 19:30
Københavns Universitet Amager, Njalsgade 80, lokale 18.2.173


Resumé

Korpus 2000 er et nyt korpus over dansk skriftsprog omkring år 2000. Det blev udarbejdet af Det Danske Sprog- og Litteraturselskab over en periode på toethalvt år, først og fremmest med henblik på at give alle alment sproginteresserede et  redskab til at undersøge dansk sprogbrug med. Korpus 2000 er gjort tilgængelig på internettet parallelt med det 10-15 år ældre Korpus 90, en særlig bearbejdet delmængde af Den Danske Ordbogs korpus.

Jeg vil kort komme ind på baggrunden for og opbygningen af Korpus 2000 og prøve på at placere det i en korpustypologisk ramme og positionere det i forhold til andre korpora over dansk, herunder også Arkiv for Dansk Litteratur. Dernæst vil jeg, delvis med udgangspunkt i nogle af de undersøgelsestyper, som er anført i Kennedy 1998 (kap. 3), demonstrere undersøgelsesmulighederne i Korpus 2000. Særlig vægt vil jeg lægge på sammenlignende undersøgelser mellem Korpus 2000 og Korpus 90 og diskutere, hvilke konklusioner man kan drage ud fra observationerne. Afspejler observerbare forskelle generelle sproglige forandringer - eller bare uensartet sammensatte korpora? I denne forbindelse vil jeg komme ind på de to velkendte korpuslingvistiske fantomer 'repræsentativitet' og 'balancerethed' - og opridse muligheder for at sikre sig, at to korpora som Korpus 2000 og Korpus 90 er opbygget på en ensartet måde.

Endelig vil jeg skitsere nogle fremtidsperpektiver, hvor hovedvægten vil blive lagt på de diakrone aspekter ved en løbende dokumentation af dansk sprog i form af store almene tekstkorpora.