Da ich eigentlich eine unkomplizierte Lösung haben wollte, hab ich die Weiterverarbeitung der Daten zunächst mit AWK versucht. Dort bin ich dann doch leider an Grenzen gestoßen, weshalb ich mich also etwas in Python eingearbeitet habe und ein Programm für die Bearbeitung der Daten aus dem Liturgischen Kalender von Hatto von Hatzfeld geschrieben habe.
Ich bitte schon jetzt die fähigen Python-Programmierer um Nachsicht für diesen stümperhaften Versuch. Verbesserungen und Korrekturen sind gerne gesehen – schreibt mir einfach.
Mir war es wichtig ein möglichst simples Script zu erstellen, dass auch andere Beginner verstehen können.
Das Programm kann folgend heruntergeladen werden. Ich habe versucht möglichst viele Kommentare einzupflegen, sodass man das Script halbwegs gut lesen kann. Dort kann man dann auch einfach die Eingabedateien etc. anpassen.
Da das Script die Daten über die Standardausgabe ausgibt (zum besseren Fehlersuchen), einfach diese dann in der Bash in eine Datei umleiten, bspw.:
./LiturgischerKalenderZerleger.py > Schriftverse-Einzeln-aus-Kalender.csv
Weitere Teile der Reihe zur statistischen Bibelvisualisierung:
Teil 0: Übersicht
Teil 1: Beschaffung der Daten
Teil 2: Datenaufbereitung mit einem Python-Programm (liturgischer Kalender / Heilige Messe)
Teil 3: Beschaffung der Daten zum Stundenbuch und Datenaufbereitung
Teil 4: Verarbeitung der Daten mit der Statistik-Programmiersprache R
Teil 5: Visualisierung der Daten mit RAW Graphs und Inkscape
Teil 6a: Endergebnisse
Teil 6b: Datentabellen
Pingback: Bibelvisualisierung — Teil 4: Verarbeitung der Daten in R - Jonathan Berschauer