import nltk
from nltk.corpus import PlaintextCorpusReader
from nltk.probability import FreqDist

# Pfad zum Verzeichnis mit den Dateien
#corpus_root = 'F:\\Varlaam_Iasaf\\Ruthenisch-Text-Proccess\\txt_norm'
corpus_root = 'F:\\Schulung_Python\\examples\\txt-supr-zusm'

# Erstellen des Corpus Readers für alle Dateien im Verzeichnis
wordlists = PlaintextCorpusReader(corpus_root, '.*')

# Zugriff auf alle Wörter im Corpus
words = wordlists.words()

# Erstellung einer Frequenzverteilung
fdist = FreqDist(words)

# Ausgabe der 10 häufigsten Wörter
for word, frequency in fdist.most_common(100):
    print(word, frequency)

# Häufigkeitsverteilung für jedes Dokument
for fileid in wordlists.fileids():
    words = wordlists.words(fileid)
    fdist = FreqDist(words)
    print(f"{fileid}:")
    print(fdist['тако'])  # Ersetzen Sie 'spezifischesWort' mit dem gesuchten Wort
