Zum Inhalt

Python

Regex zum Finden von Wörtern in Großbuchstaben

Hier eine kurze Demonstration der Verwendung eines regulären Ausdrucks zur Erkennung von Wörtern in Großbuchstaben in einer Reihe von Textdateien.

Das Ziel dieses code-Schnipsels ist es, alle .rtf-Dateien in einem bestimmten Verzeichnis zu öffnen und zu lesen und nur die in der Datei vorkommenden GROSSSCHREIBEN-Wörter zu identifizieren.

import os
import re

directory = '/path/to/files'
regex = r"\b[A-Z][A-Z]+\b"

for filename in os.listdir(directory):
    if filename.endswith(".rtf"):
        with open(filename, 'r') as f:
            transcript = f.read()
            matches = re.finditer(regex, transcript)
            for match in matches:
                print (match[0])