Sveučilište u Rijeci, Filozofski fakultet
Odsjek za kroatistiku
 

HRVATSKI KORPUS GOVORNOG JEZIKA (HrAL)

Autor:
Jelena Kuvač Kraljević, Gordana Hržica
E-adresa:
jkuvac@erf.hr; gordana.hrzica@erf.hr
Klasifikacija:
pregledni članak
Sažetak
Zanimanje za korpuse govornog jezika posljednja dva desetljeća raste, pri čemu nastaju i razvijaju se novi istovrsni korpusi koji omogućuju uvid u nove činjenice o govornom jeziku. Ova vrsta korpusa predstavlja najiscrpniji izvor podataka o jeziku prosječnoga govornika. Ti se korpusi temelje na spontanom i nestrukturiranom govorenju koje je određeno različitim stilovima, registrima i dijalektima. Cilj je ovog rada predstaviti Hrvatski korpus govornog jezika odraslih (HrAL), njegovu strukturu i moguću primjenu u različitim lingvističkim granama. HrAL je oblikovan uzorkovanjem spontane konverzacije između 617 govornika iz svih hrvatskih županija i sadrži više od 250.000 pojavnica i više od 100.000 različnica. Podatci su prikupljani u tri vremenska razdoblja: od 2010. do 2011., od 2014. do 2015. te tijekom 2016. godine. HrAL je danas dostupan u TalkBank-u, bazi korpusa govornih jezika prikupljenih u različitim jezicima (https://talkbank.org), i to u pododjeljku Conversational analyses corpora unutar Conversational Bank. Podatci su transkribirani, kodirani i segmentirani rabeći transkripcijske formate Codes for Human Analysis of Transcripts (CHAT) i Computerised Language Analysis (CLAN), iz niza programa TalkBank-a. Govorni nizovi segmentirani su na komunikacijske jedinice (C-jedinice) temeljene na sintaktičkom kriteriju. Većina je transkripata povezana sa svojim audiozapisom. TalkBank je javno dostupan, odnosno svi podatci pohranjeni u njemu mogu biti slobodno upotrijebljeni prema osnovnim pravilima TalkBank-a. HrAL daje informacije o gramatici i leksikonu govornog jezika, diskursnim vještinama, proizvedenim pogreškama i produktivnosti općenito. Koristan je za sociolingvistička istraživanja kao i za istraživanja sinkronijskih jezičnih promjena u hrvatskom.
Ključne riječi
Hrvatski korpus govornog jezika odraslih (HrAL); jezično uzorkovanje; korpus spontanoga govora
Pregleda:
278
Preuzimanja:
30
 
 
 
Posjeta: 18603