slavistik-portal
Портал славістики
A collection of Slavonic text corpora.
Nr. | Title | Language(s) | Year |
---|---|---|---|
1 | UMC - ÚFAL Multilingual CorporaBojar, Ondřej, UMC ist eine Sammlung von mehrsprachigen Korpora mit dem Schwerpunkt Tschechisch-Englisch-Russisch.[URL] | Englisch (eng) | 2013 |
2 | Large Corpora used in CTSDie Webseite des Zentrums für Übersetzungsstudien (Universität Leeds) bietet die Möglichkeit der Suche in einer Reihe von slavischen und nicht slavischen Korpora.[URL] | Englisch (eng), Russisch (rus), Polnisch (pol) | 2023 |
3 | Slovene-English Parallel Corpus - IJS-ELAN corpusDept. of Knowledge Technologies, Jožef Stefan Institute, Parallelkorpus mit ca. einer Million Wörtern aus 15 slowenisch-englischen und englisch-slowenischen Texten. Das Korpus ist satzaligniert, tokenisiert, pos-getaggt und lemmatisiert. Es liegt derzeit in Version 3 (2012) vor.[URL] | Englisch (eng), Slowenisch (slv) | 2013 |
4 | PCEDT 2.0 - Prague Czech-English Dependency Treebank 2.0Institut of Formal and Applied Linguistics, Charles University in Prague, Ein tschechisch-englischer Parallelkorpus mit 1,2 Mio. Wörtern in fast 50.000 Sätzen. Nachschlagewerk für Übersetzer und zum Fremdsprachenerwerb.[URL] | Englisch (eng) | 2023 |