Ústav Českého národního korpusu: Porovnání verzí
Smazaný obsah Přidaný obsah
doplnění aktuálních údajů o publikacích a činnosti ÚČNK |
Verze 9011272 uživatele Olcha Rich (diskuse) zrušena |
||
Řádek 4:
Ředitelem ústavu je prof. PhDr. [[František Čermák (jazykovědec)|František Čermák]], DrSc.
Ústav je rozčleněn na následující sekce:<ref>[http://www.korpus.cz/kolektiv.php Pracovní kolektiv ČNK]</ref>
* Lingvistická (vedoucí Mgr. [[Václav Cvrček]], PhD.)
* Komputační (vedoucí Mgr. [[Michal Křen]], PhD.)
* Mluvené korpusy (vedoucí PhDr. [[Marie Kopřivová]], PhD.)
* Diachronní korpusy (vedoucí prof. PhDr. [[Karel Kučera]], CSc.)
* Lingvistická analýza a anotace (vedoucí doc.
* Paralelní korpusy (vedoucí Ing. [[Alexander Rosen]], PhD. <ref>[http://utkl.ff.cuni.cz/ ÚTKL]</ref>)
== Činnost ==
Hlavním posláním ÚČNK je kontinuální rozvoj a budování jazykových korpusů různých typů. Představují reprezentativní lingvisticky zpracované datové základny pro empirický a exaktní výzkum českého jazyka a jde především o korpusy zachycující češtinu v jejím současném stavu (synchronní korpusy psaného a mluveného jazyka), v jejím historickém vývoji (diachronní korpusy) a v překladovém srovnání s jinými jazyky (paralelní korpusy).▼
▲Hlavním posláním ÚČNK je kontinuální rozvoj a budování jazykových korpusů různých typů. Představují reprezentativní lingvisticky zpracované datové základny pro empirický a exaktní výzkum českého jazyka a jde především o korpusy zachycující češtinu v
S budováním korpusů úzce souvisí též bezplatná veřejná služba poskytování internetového uživatelského přístupu ke všem korpusům pomocí specializovaných rozhraní a nástrojů (např. nástroj pro porovnání variant [http://syd.korpus.cz/ SyD]) a podpora uživatelů (prostřednictvím on-line [http://www.korpus.cz/bonito/index.php manuálu], [http://www.korpus.cz/vyuka.php seminářů], workshopů a [http://www.korpus.cz/konzultace.php konzultací]).▼
▲S budováním korpusů úzce souvisí též bezplatná veřejná služba poskytování internetového uživatelského přístupu ke všem korpusům pomocí specializovaných rozhraní a nástrojů (např. nástroj pro porovnání variant
==== Řady korpusů ====
V současnosti projekt ČNK spravuje následující řady korpusů
'''Korpusy psané současné češtiny''' o celkovém rozsahu 1300 milionů textových slov jsou
*
*
*
*
*
'''Korpusy mluvené češtiny''' o celkovém objemu cca 3 miliony textových slov. Mluvené korpusy řady ORAL zachycují autentickou mluvu v neformálních situacích a jsou doplněny základními sociolingvistickými údaji o mluvčích, korpus
▲* [http://www.korpus.cz/syn2000.php SYN2000] - 100 mil., žánrově vyvážený korpus, převažují texty z let 1990 - 1999
* Pražský mluvený korpus
▲* [http://www.korpus.cz/syn2005.php SYN2005] - 100 mil., žánrově vyvážený korpus, převažují texty z let 2000 - 2004
* Brněnský mluvený korpus
▲* [http://www.korpus.cz/syn2006pub.php SYN2006PUB] - 300 mil., korpus publicistických textů z let 1989 - 2004
* Oral2006
▲* [http://www.korpus.cz/syn2009pub.php SYN2009PUB] - 700 mil., korpus publicistických textů z let 1995 - 2007
* Oral2008
▲* [http://www.korpus.cz/syn2010.php SYN2010] - 100 mil., žánrově vyvážený korpus, převažují texty z let 2005 - 2009
'''Korpus diachronní''' (DIAKORP)
▲'''Korpusy mluvené češtiny''' o celkovém objemu cca 3 miliony textových slov. Mluvené korpusy řady ORAL zachycují autentickou mluvu v neformálních situacích a jsou doplněny základními sociolingvistickými údaji o mluvčích, korpus [http://ucnk.ff.cuni.cz/ORAL2008.php ORAL2008] , pokrývající celé území Čech, je navíc vyvážen v hlavních sociolingvistických kategoriích. Připravované rozhraní zpřístupní i anonymizované zvukové nahrávky.
'''Korpusy paralelní''' (InterCorp) zahrnující překladové ekvivalenty českých textů do více než dvaceti jazyků.<ref>[http://www.korpus.cz/struktura.php Dostupné korpusy]</ref>
== Publikace ==
ÚČNK dlouhodobě spolupracuje s [[Nakladatelství Lidové noviny|Nakladatelstvím Lidové noviny]],
▲**Frekvenční slovník mluvené češtiny (Karolinum, 2007)
▲**A Frequency Dictionary of Czech: Core Vocabulary for Learners (Routledge, 2011)
▲**Mluvnice současné češtiny (Karolinum, 2010)
Ke stažení jsou zpřístupněny
== Historie ==
Ústav Českého národního korpusu byl založen [[9. září]] [[1994]]. Pravidelnou činnost vyvíjí od [[1. říjen|1. října]] [[1996]], kdy byl sestaven kolektiv stálých zaměstnanců. Roku 2000 byl zveřejněn první stomilionový žánrově vyvážený korpus, SYN2000.
== Reference ==▼
<references/>▼
== Externí odkazy ==
Řádek 63 ⟶ 60:
* [http://blog.aktualne.centrum.cz/blogy/vaclav-cvrcek.php Blog korpusového lingvisty - V. Cvrček na Aktuálně]
{{Portály|Jazyk}}▼
▲== Reference ==
▲<references/>
▲{{Portály|Jazyk}}
[[Kategorie:Lexikografie]]
[[Kategorie:Čeština]]
|