Zbirke

 

Zbirke na Inštitutu za slovenski jezik Frana Ramovša
Večina raziskovalcev in raziskovalk Inštituta za slovenski jezik Frana Ramovša svojo dejavnost izvaja opirajoč se na jezikovno gradivo, ki je urejeno in obdelano po vnaprej zasnovanih postopkih v obliki t. i. podatkovnih zbirk in besedilnega korpusa Nova beseda (http://bos.zrc-sazu.si/).
 
Dokumentacijski sistem Inštituta za slovenski jezik Frana Ramovša obsega najizčrpnejšo zbirko jezikovnega gradiva v državi v obliki 3,4-milijonske listkovne kartoteke, ki je nastajala vse od leta 1945. Zbirka je bila kot osnovni slovarski vir namenjena izdelavi slovarjev slovenskega jezika in predstavlja še danes v mnogih pogledih edini relevanten dokument za razlago jezikovnih lastnosti posameznih leksemov, sprememb v določenih obdobjih, pogosto pa je tudi metodološki pripomoček pri iskanju pojasnil za podobo slovarskih redakcij v slovarskih delih povojnega obdobja. Na osnovi te zbirke, ki jo v klasičnih listkovnih kartotekah hrani Inštitut, so nastala temeljna slovarska dela, med drugim Slovar slovenskega knjižnega jezika – s stranskim produktom: Besediščem v SSKJ nesprejetega besedja, Slovenski pravopis 2001 in Vezljivostni slovar slovenskih glagolov. Danes v funkcionalnem smislu to zbirko nadomešča oziroma dopolnjuje 240-milijonski korpus Nova beseda, ki nastaja v Laboratoriju za korpus slovenskega jezika.
Sicer nastajajo na Inštitutu podatkovne zbirke, ki predstavljajo osnovo za nastajajoča slovarska dela, npr. Slovar novejšega besedja, Slovar sinonimov slovenskega jezika in Frazeološki slovar slovenskega jezika.
Izrednega pomena je tudi Zbirka oblikoslovno označenih besedil, ki predstavlja osnovo za strojno podprte metode obdelave slovenskega jezika.
 
Gradijo se tudi podatkovne zbirke strokovnega izrazja, npr. botanična zbirka, čebelarska, geografska, geološka, gledališka, zbirka splošnega tehniškega izrazja, umetnostno- in pravnozgodovinska, zbirka za slovar kemijske procesne tehnike, za slovar evropskega prava in za slovar elektronike, elektrotehnike in informatike.
 
Podatkovne zbirke Inštituta v listkovni in zvezkovni kartoteki predstavljajo tudi osnovo za nastajanje Slovenskega lingvističnega atlasa, ki bo prikazal stanje in razširjenost vseh bistvenih jezikovnih pojavov v 406 slovenskih govorih.
 
V fazi digitalizacije je listkovna kartoteka, ki predstavlja gradivo za Slovar jezika slovenskih protestantskih piscev 16. stoletja.
 
V obdobju 2005–2007 je nastala tudi spletna zbirka Besede slovenskega jezika (http://bos.zrc-sazu.si/besede.html), ki besede pomensko razloži, jih besednovrstno označi in uporabnika prek spletnih povezav pelje na referenčno gradivo na spletu.