Портал славістики


[root][corphub]

CorpSlav Collection

A collection of Slavonic text corpora.

?
Nr.TitleLanguage(s)Year
1

Tuebinger russische Korpora

Universität Tübingen, Eine Sammlung der russischen Korpora, die in Tübingen im Rahmen eines DFG-Projekts erstellt wurden.
Pfeil [URL]
Deutsch (ger)2023
2

VMČ (Великие Минеи Четьи)

Rabus, Achim, Die VMČ (Великие Минеи Четьи - Velikie Minei Čet'i) stellen eines der wichtigsten Denkmäler der russischen kirchenslawischen Literatur dar, die von Makarius, Metropolit von Moskau, und seinen Schreibern im 16. Jahrhundert kompiliert wurden.
Pfeil [URL]
Kirchenslawisch2023
3

Test-Installation von RRuDi als ANNIS-DB

Meyer, Roland, Die Test-Installation von RRudi mit einigen wenigen annotierten Datensegmenten (Avvakum, Domostroj, KievskijPaterik u.a.) von Roland Meyer. Die ANNIS-basierte Installation wird auf einem Server der Humboldt-Universität betrieben.
Pfeil [URL]
Kirchenslawisch, Altrussisch2023
4

nevmenandr.net: Филология. Лингвистика. Литературоведение

Орехов, Борис B., Sammlung der Parallelkorpora "Slovo o polku Igoreve", "Poetik von Aristoteles" und "Russisch-französischer Lyrikkorpus". Darüber hinaus werden eine Reihe linguistischer Tools, sowie Textressourcen mit philologischem Schwerpunkt angeboten.
Pfeil [URL]
Russisch (rus)2013
5

Narodowy Korpus Języka Polskiego - NKJP

Instytut Podstaw Informatyki PAN, Warszawa, Die Webseite bietet Informationen über den Nationalen Korpus der Polnischen Sprache. Es handelt sich hierbei um das größte, annotierte Korpus des gegenwärtigen Polnischen. Enthalten sind Texte aus den Bereichen der Alltags- und Fachpresse, klassische polnische Literatur, Gesprächsaufnahmen und Internettexte. Diese sind nach verschiedenen Kriterien gewichtet, was neben der Größe des Korpus ebenso wichtig für die Aussagekraft von korpusbasierten Untersuchungen ist.
Pfeil [URL]
Polnisch (pol)2011
6

PolDi – a Polish Diachronic Online Corpus

Institut für Slavistik der Universität Regensburg, Die Webseite bietet einen morphosyntaktisch annotierten Korpus altpolnischer Texte. Derzeit beinhaltet das Korpus sieben Texte, welche auf den Zeitraum zwischen dem 15. und 18. Jahrhundert zurückgehen, wobei der Schwerpunkt auf dem 15. und 16. Jahrhundert liegt. Die zusätzliche syntaktische Annotation bezieht sich auf Nullsubjekte, reflexive Verbformen, Passivkonstruktionen und -no/to Formen. Die Texte sind in Hinblick auf die Schreibung an das gegenwärtige Polnische angepasst.
Pfeil [URL]
Polnisch (pol)2020
7

Браун корпус за български език

Секция по компютърна лингвистика, Българска академия на науките, Die Webseite bietet Zugang zum Brown-Korpus der bulgarischen Sprache. Dieses besteht aus ca. 500 Text-Samples, darunter fiktionale und faktische Prosa. Insgesamt enthält das Korpus ca. eine Million Worteinheiten. Die Texte gehen auf den Zeitraum zwischen 1990 und 2005 zurück.
Pfeil [URL]
Bulgarisch (bul)2011
8

Slovenský národný korpus

Die Website mit der Datenbank des slowakischen Textkorpus. Das Korpus besteht aus mehreren Segmenten, das Hauptkorpus umfasst derzeit ca. 1,68 Mio. Token (2023).
Pfeil [URL]
Slowakisch (slo)2023
9

Slovarske in besedilne zbirke - Web corpora, lexicons and tools

Eine Sammlung von Nachschlagewerken, Textkorpora und Werkzeugen zum Slowenischen.
Pfeil [URL]
Englisch (eng), Slowenisch (slv)2012
10

Hrvatski nacionalni korpus (HNK)

Zavod za lingvistiku Filozofskoga fakulteta Sveučilišta u Zagrebu, Die Webseite mit der Datenbank zum nationalen Textkorpus der kroatischen Sprache.
Pfeil [URL]
Kroatisch (hrv)2020
11

Параллельный корпус переводов «Слова о полку Игореве»

Орехов, Борис, Textlorpus des Igorlieds im altrussischen Original sowie Übersetzungen in zahlreiche Sprachen: ins moderne Russische, weitere slawische Sprachen, nichtslawische Sprachen der Sowjetunion, germanische und romanische Sprachen. Das Korpus erlaubt den Vergleich zwischen verschiedenen Übersetzungen.
Pfeil [URL]
Russisch (rus)2012
12

СКАТ - Санкт-Петербургский корпус агиографических текстов

Факультета филологии и искусств Санкт-Петербургского государственного университета, Der elektronische Textkorpus der literarischen Denkmähler der altrussischen hagiographischen Literatur.
Pfeil [URL]
Russisch (rus)2014
13

Hrvatska jezična mrežna riznica - Croatian Language Online Repository

Die Webseite mit der Datenbank zum Kroatischen Textkorpus bietet ein komfortables Suchsystem.
Pfeil [URL]
Kroatisch (hrv)2010
14

ФЭБ: Фундаментальная электронная библиотека "Русская литература и фольклор" [FĖB: Fundamentalʹnaja ėlektronnaja biblioteka "Russkaja literatura i folʹklor"]

Институт мировой литературы им. А.М. Горького, Die FEB ist ein Projekt der Soros Foundation und bietet die größte Volltextsammlung zur russischen Literatur im russischen Netz. Die Grundlage der Texte bilden die Digitalisate der akademischen Ausgaben der russischen klassischen Literatur.
Pfeil [URL]
Russisch (rus)2023
15

Český Národní Korpus - Czech National Corpus

Die Webseite mit der Datenbanken zum Tschechischen Textkorpus.
Pfeil [URL]
Tschechisch (cze)2023
16

The Oslo Corpus of Bosnian Texts / Korpus bosanskih tekstova na Univerzitetu u Oslu

Die Webseite mit der Datenbank zum Bosnischen Textkorpus enthält ca. 1,5 Mio. Einheiten.
Pfeil [URL]
Englisch (eng)2010
17

Korpus Języka Polskiego IPI PAN

Die Webseite mit der Datenbank zum nationalen Textkorpus der polnischen Sprache enthält 250 Mio. Einheiten.
Pfeil [URL]
Polnisch (pol)2011
18

Large Corpora used in CTS

Die Webseite des Zentrums für Übersetzungsstudien (Universität Leeds) bietet die Möglichkeit der Suche in einer Reihe von slavischen und nicht slavischen Korpora.
Pfeil [URL]
Englisch (eng), Russisch (rus), Polnisch (pol)2023
19

Национальный корпус русского языка (НКРЯ)

Институт русского языка им. В. В. Виноградова РАН, Москва, Die Webseite mit der Datenbank zum Nationalkorpus der russischen Sprache enthält 140 Mio. Einheiten und wird durch Moskauer und St. Petersburger Sprachwissenschaftler gepflegt.
Pfeil [URL]
Russisch (rus)2023
20

Corpus Cyrillo-Methodianum Helsingiense: An Electronic Corpus of Old Church Slavonic Texts

Die Webseite bietet eine Sammlung von wichtigsten altkirchenslavischen Texten. Verfügbar sind: Codex Marianus, Codex Suprasliensis, Vita Constantini at Methodii u.a.
Pfeil [URL]
Englisch (eng)2023