slavistik-portal
Портал славістики
Eine Sammlung zur slawistischen Textkorpora.
Nr. | Titel | Sprache | UpdtJahr |
---|---|---|---|
1 | The Helsinki Annotated Corpus of Russian Texts HANCOUniversity of Helsinki, Das HANCO - Projekt des Lehrstuhls für Slawische und Baltische Sprachen an der Universität Helsinki beinhaltet einen Korpus von 100.000 russischen Wörtern. Mit morphologischen, syntaktischen und funktionalen Informationen über jedes Wort.[URL] | Englisch (eng), Russisch (rus) | 2020 |
2 | The General Internet-Corpus of Russian (GICR)Институт лингвистики РГГУ, Das Magakorpus der russischen Sprache wurde auf der Grundlage der Internettexte vom Institut für Computerlinguistik aufgebaut. Das Korpus beinhaltet über 20 Mrd. Wörter.[URL] | Russisch (rus) | 2017 |
3 | Slovenský národný korpusDie Website mit der Datenbank des slowakischen Textkorpus. Das Korpus besteht aus mehreren Segmenten, das Hauptkorpus umfasst derzeit ca. 1,68 Mio. Token (2023).[URL] | Slowakisch (slo) | 2023 |
4 | Hrvatski nacionalni korpus (HNK)Zavod za lingvistiku Filozofskoga fakulteta Sveučilišta u Zagrebu, Die Webseite mit der Datenbank zum nationalen Textkorpus der kroatischen Sprache.[URL] | Kroatisch (hrv) | 2020 |
5 | Беларускі N-корпусnicht bekannt, Das erste öffentliche Sprachkorpus des Belarussischen.[URL] | Belarussisch (bel) | 2023 |
6 | Narodowy Korpus Języka Polskiego - NKJPInstytut Podstaw Informatyki PAN, Warszawa, Die Webseite bietet Informationen über den Nationalen Korpus der Polnischen Sprache. Es handelt sich hierbei um das größte, annotierte Korpus des gegenwärtigen Polnischen. Enthalten sind Texte aus den Bereichen der Alltags- und Fachpresse, klassische polnische Literatur, Gesprächsaufnahmen und Internettexte. Diese sind nach verschiedenen Kriterien gewichtet, was neben der Größe des Korpus ebenso wichtig für die Aussagekraft von korpusbasierten Untersuchungen ist.[URL] | Polnisch (pol) | 2011 |
7 | Corpus Albaruthenicum — Корпус беларускамоўных навуковых тэкстаўLaboratory of Systems Dynamics and Material Mechanics,Belarusian National Technical University, Der Korpus der weissrussischen Sprache mit 75 Texten und 350000 Lemmata wird von der Weissrussischen Nationalen Technischen Universität aufgebaut.[URL] | Englisch (eng), Belarussisch (bel) | 2011 |
8 | Национальный корпус русского литературного языкаСанкт-Петербургский Государственный Университет, Die Webseite enthält einen Korpus der russischen Literatursprache. Dieses umfasst ca. 1 Million Token, bestehend aus vorwiegend publizistischen und populärwissenschaftlichen Texten. Insgesamt sind derzeit 218 Texte vertreten.[URL] | Russisch (rus) | 2023 |
9 | Национальный корпус русского языка (НКРЯ)Институт русского языка им. В. В. Виноградова РАН, Москва, Die Webseite mit der Datenbank zum Nationalkorpus der russischen Sprache enthält 140 Mio. Einheiten und wird durch Moskauer und St. Petersburger Sprachwissenschaftler gepflegt.[URL] | Russisch (rus) | 2023 |
10 | Slovarske in besedilne zbirke - Web corpora, lexicons and toolsEine Sammlung von Nachschlagewerken, Textkorpora und Werkzeugen zum Slowenischen.[URL] | Englisch (eng), Slowenisch (slv) | 2012 |
11 | Nova besedaAnnotiertes Textkorpus zum Slowenischen. Das Korpus enthält laut Angaben des Anbieters 240 Mill. Tokens von gesprochener und geschriebener Sprache und deckt eine große Bandbreite an Textsorten ab: Belletristik, wissenschaftliche Literatur, Fachsprache, Zeitungssprache etc. Das Korpus ist über Suchverfahren frei zugänglich (Stand: Februar 2012).[URL] | Englisch (eng), Slowenisch (slv) | 2012 |
12 | Korpus Języka Polskiego IPI PANDie Webseite mit der Datenbank zum nationalen Textkorpus der polnischen Sprache enthält 250 Mio. Einheiten.[URL] | Polnisch (pol) | 2011 |
13 | Hrvatska jezična mrežna riznica - Croatian Language Online RepositoryDie Webseite mit der Datenbank zum Kroatischen Textkorpus bietet ein komfortables Suchsystem.[URL] | Kroatisch (hrv) | 2010 |
14 | Český Národní Korpus - Czech National CorpusDie Webseite mit der Datenbanken zum Tschechischen Textkorpus.[URL] | Tschechisch (cze) | 2023 |
15 | The Oslo Corpus of Bosnian Texts / Korpus bosanskih tekstova na Univerzitetu u OsluDie Webseite mit der Datenbank zum Bosnischen Textkorpus enthält ca. 1,5 Mio. Einheiten.[URL] | Englisch (eng) | 2010 |
16 | Large Corpora used in CTSDie Webseite des Zentrums für Übersetzungsstudien (Universität Leeds) bietet die Möglichkeit der Suche in einer Reihe von slavischen und nicht slavischen Korpora.[URL] | Englisch (eng), Russisch (rus), Polnisch (pol) | 2023 |