Python

Home > Wissensbasis (Inhalt)

Regex zur Suche nach Worten in Großbuchstaben

Hier ist eine kurze Demonstration, wie ein regulärer Ausdruck verwendet wird, um Worte in Großbuchstaben in einer Reihe von Textdateien zu identifizieren.

Das Ziel in diesem speziellen Schnipsel ist es, alle .rtf-Dateien in einem bestimmten Verzeichnis zu öffnen und zu lesen und nur die Worte in Großbuchstaben zu identifizieren, die in der Datei vorkommen.

import os
import re

directory = '/path/to/files'
regex = r"\b[A-Z][A-Z]+\b"

for filename in os.listdir(directory):
    if filename.endswith(".rtf"):
        with open(filename, 'r') as f:
            transcript = f.read()
            matches = re.finditer(regex, transcript)
            for match in matches:
                print (match[0])

Keywords:

Python, Regular Expressions, Textdatei, Wort, Großbuchstabe