Портал славістики


[root][corphub]

CorpSlav Collection

A collection of Slavonic text corpora.

?
Nr.TitleLanguage(s)Year
1

Korpus DIALOG

Ústav pro jazyk český Akademie věd ČR, Die Webseite bietet Zugang zu einem multimedialen Korpus des gesprochenen Tschechischen. Das Korpus enthält Aufnahmen und Transkriptionen von öffentlich geführten Dialogen im tschechischen Fernsehen.
Pfeil [URL]
Tschechisch (cze)2011
2

Czech Academic Corpus

Institute of Formal and Applied Linguistics, Faculty of Mathematics and Physics, Charles University, Das "Czech Academic Corpus" ist ein Projekt des Instituts für Formale und Angewandte Linguistik der Prager Karls-Universität und des Instituts für tschechische Sprache der Tschechischen Akademie der Wissenschaften. Es enthält 180 Texte mit jeweils 3000 Wörtern.
Pfeil [URL]
Tschechisch (cze)2023
3

The Prague Dependency Treebank 2.0

Institut of Formal and Applied Linguistics, Charles University in Prague, "The Prague Dependency Treebank 2.0" enthält tschechische korpuslinguistische Texte mit morphologischen, syntaktischen und semantischen Annotationen.
Pfeil [URL]
Englisch (eng)2023
4

Natural Language Processing Centre

Centre for Natural Language Processing, Die Webseite informiert über die Struktur, Organisation, Projekte und Studienprogramme des Centers für Forschung von gesprochenen Sprachen (Tschechisch) an der Fakultät für Informatik an der Masaryk Universität in Brno.
Pfeil [URL]
Tschechisch (cze)2023
5

INTERCORP projekt paralelních korpusů

Čermák, František, INTERCORP ist ein Projekt für Erschafffung von einem Parallelkorpus aus Texten in Tschechisch und in allen anderen Sprachen, die an der Philosophischen Fakultät der Karls-Univesität in Prag unterrichtet werden.
Pfeil [URL]
Tschechisch (cze)2023
6

Český Národní Korpus - Czech National Corpus

Die Webseite mit der Datenbanken zum Tschechischen Textkorpus.
Pfeil [URL]
Tschechisch (cze)2023
7

PCEDT 2.0 - Prague Czech-English Dependency Treebank 2.0

Institut of Formal and Applied Linguistics, Charles University in Prague, Ein tschechisch-englischer Parallelkorpus mit 1,2 Mio. Wörtern in fast 50.000 Sätzen. Nachschlagewerk für Übersetzer und zum Fremdsprachenerwerb.
Pfeil [URL]
Englisch (eng)2023
8

ParaSol - A Parallel Corpus of Slavic and Other Older Languages

Von Waldenfels, Ruprecht, Die Webseite bietet Zugang zu einem parallelen annotierten Korpus übersetzter und originaler Texte in slawischen und anderen Sprachen.
Pfeil [URL]
Englisch (eng)2017
9

UMC - ÚFAL Multilingual Corpora

Bojar, Ondřej, UMC ist eine Sammlung von mehrsprachigen Korpora mit dem Schwerpunkt Tschechisch-Englisch-Russisch.
Pfeil [URL]
Englisch (eng)2013
10

Corpus Cyrillo-Methodianum Helsingiense: An Electronic Corpus of Old Church Slavonic Texts

Die Webseite bietet eine Sammlung von wichtigsten altkirchenslavischen Texten. Verfügbar sind: Codex Marianus, Codex Suprasliensis, Vita Constantini at Methodii u.a.
Pfeil [URL]
Englisch (eng)2023
11

Slavistische Textkorpora und Textsammlungen im Internet

Linksammlung des Slavistischen Seminars in Tübingen zu slavistischen Textkorpora und Textsammlungen im Internet. Enthält Korpora zu folgenden Sprachen: altkirchenslavisch; westslavische Sprachen: obersorbisch, polnisch, altpolnisch, slovakisch, tschechisch; südslavische Sprachen: bulgarisch, bosnisch, kroatisch, mazedonisch, serbisch, slovenisch; ostslavische Sprachen: russisch, ukrainisch, altweißrussisch. Außerdem: mehrsprachige Korpora, Linksammlungen auch zu über die Slavistik hinausgehenden mehrsprachigen Korpora und zur Korpuslinguistik.
Pfeil [URL]
Deutsch (ger)2020