Category Archives

6 Articles

Posted by Dirk Alvermann on

Neues Public Modell – German Kurrent 17th-18th

Heute dürfen wir unser zweites öffentlich zugängliches HTR-Modell vorstellen.

„German_Kurrent_17th-18th“ ist ein HTR-Modell für Kurrentschriften des 17. und 18. Jahrhunderts. Für dieses Modell ist Ground Truth aus unseren verschiedenen größeren und kleineren Projekten der letzten vier Jahre verwendet worden.

Es handelt sich um ein generische Modell, das Material von ca. 2000 individuellen Schreiberhänden umfasst. Der Ground Truth stammt zu etwa 35% aus Handschriften des 17. Jahrhunderts und zu 50% aus solchen des 18. Jahrhunderts. Die übrigen 15% verteilen sich auf die Jahrzehnte davor und danach. Die für das Training ausgewählten Unterlagen bestehen hauptsächlich aus amtlichen Protokollen und juristischen Schriftstücken, aber auch aus Privaten Aufzeichnungen und Briefen der Zeit. Daneben wurden auch wenige zeitgenössische Drucksachen (Fraktur), die hin und wieder in den Akten vorkommen, für das Training verwendet. Die Sprache der verwendeten Texte ist überwiegend Deutsch und Latein. Daneben wurden auch einige niederdeutsche und französische Texte verwendet.

Viel Spaß beim ausprobieren. Nutzt gerne die Kommentarfunktion um uns wissen zu lassen, wie das Modell bei euch funktioniert.

Posted by Dirk Alvermann on

Unser erstes öffentlich zugängliches Modell für die deutschen Kurrentschriften des 17. Jahrhunderts

Heute präsentieren wir „Acta 17“ als öffentlich zugängliches HTR  Modell.

Das Modell wurde anhand von mehr als 500.000 Wörtern aus Texten von etwa 1000 verschiedenen Schreibern aus der Zeit von 1580-1705 vom Universitätsarchiv Greifswald trainiert. Es kann mit deutschsprachigen, lateinischen und niederdeutschen Texten umgehen und ist in der Lage, einfache deutsche und lateinische Abkürzungen aufzulösen. Neben den üblichen Kanzleischriften enthielt das Trainingsmaterial auch eine Auswahl von Konzeptschriften und Druckschriften der Zeit.

Das gesamte Trainingsmaterial basiert auf Konsulentenanfragen, Prozessschriften und Urteilen aus dem Aktenbestand der Greifswalder Juristenfakultät Die Validierungssets basieren auf einer chronologischen Auswahl der Jahre 1580 – 1705 . GT & Validierungssets wurden von Dirk Alvermann, Elisabeth Heigl, Anna Brandt erstellt.

Aufgrund einiger Probleme bei der Durchführung umfangreicherer Serien von base model Trainings für HTR+ Modelle in den letzten Wochen haben wir beschlossen, ein von Grund auf neu trainiertes HTR+ Modell als öffentliche zugängliches Modell bereit zu stellen.

Es wird von einem PyLaia-Modell begleitet, das auf den gleichen Trainings- und Validierungssets basiert und ebenfalls ohne Nutzung eines Base Modells trainiert wurde.

Für das Validierungsset wählten wir Seiten, die einzelne Jahre des gesamten verfügbaren Materials repräsentieren. Insgesamt waren es  48 ausgewählte Jahre, fünf Seiten pro Jahr.

Wie sich die Modelle in den verschiedenen Zeiträumen des Validierungssets verhalten, könnt ihr im untenstehenden Vergleich sehen. Beide Modelle wurden ohne language model ausgeführt.

Posted by Dirk Alvermann on

Die ersten Bände mit Entscheidungen des Wismarer Tribunals online

In den letzten Wochen konnten wir die ersten Aktenbände mit den Relationen der Assessoren des Hohen königlichen Tribunals zu Wismar – des Oberapellationsgerichts der deutschen Territorien der Krone Schwedens – zur Verfügung stellen. Als Assessoren wurden die Richter am Tribunal bezeichnet. Seit dem Großen Nordischen Krieg gab es anstelle von früher acht nur noch vier von ihnen. Der Vizepräsident teilte ihnen die Fälle zu, zu denen sie sich eine juristische Meinung bilden sollten. Wie am Reichskammergericht wurden zu jedem Fall Referenten und Koreferenten bestimmt, die ihre Meinung schriftlich ausformulierten und mit ihren Kollegen diskutierten. Stimmten die Voten der beiden Richter überein und wurden sie vom Vizepräsidenten bestätigt, der alle Relationen überprüfen musste, wurde in der Gerichtssitzung nur noch formal der Konsens der verbliebenen Kollegen eingeholt. Lag der Fall komplizierter, äußerten alle Assessoren ihre Meinung zum Urteil. Diese Urteilsbegründungen sind in der Sammlung der sogenannten „Relationes“ niedergelegt.

 

Diese Relationen sind für die Rechtsgeschichte eine erstrangige Quelle, da sie zunächst in einer Erzählung den Hergang des Konflikts referieren, um dann ein Urteil vorzuschlagen. Wir können hier sowohl die Rechtsgrundlagen in den Begründungen als auch den Alltag der Menschen in den Erzählungen nachvollziehen.

 

Die Texterkennung wurde mit einem Modell realisiert, das auf die Handschriften von neun verschiedenen Richtern des königlichen Tribunals trainiert wurde. Das Trainingsset umfasste 600.000 Wörter. Entsprechend gut ist die Accuracy-Rate der Handschriftentexterkennung, die in diesem Fall bei etwa 99% liegt.

Die Ergebnisse können hier betrachtet werden. Wie man in unseren Dokumenten navigiert und wie die Volltextsuche funktioniert, ist hier erklärt.

Wer waren die Richter?

In der zweiten Hälfte des 18. Jahrhunderts fand ein gewisser Generationswechsel unter den Richtern statt. Am Ende der 1750er / zu Beginn der 1760er Jahre wurde Recht Tribunal gesprochen durch: Hermann Heinrich von Engelbrecht (1709-1760), seit 1745 als Assessor, seit 1750 als Vizepräsident, Bogislaw Friedrich Liebeherr (1695-1761), seit 1736 als Assessor, Anton Christoph Gröning (1695-1773). seit 1749 als Assessor, Christoph Erhard von Corswanten (um 1708-1777), seit 1751 Assessor, seit 1761 Vizepräsident, Carl Hinrich Möller (1709-1759), seit 1751 als Assessor, Joachim Friedrich Stemwede (um 1720-1787), seit 1760 als Assessor, Johann Franz von Boltenstern (1700-1763), seit 1762 als Assessor, Johann Gustrav Friedrich von Engelbrechten  (1733-1806), zwischen 1762 und 1775 als Assessor und Augustin von Balthasar (1701-1786), seit 1763 als Assessor, seit 1778 als Vizepräsident.

Posted by Elisabeth Heigl on

Transkribus als Hilfsmittel für Studenten und Professoren

In der diesjährigen 24-Stunden-Vorlesung der Universität Greifswald wird Transkribus und unser Digitalisierungsprojekt vorgestellt. Elisabeth Heigl, die als wissenschaftliche Mitarbeiterin in das Projekt eingebunden ist, wird einige der spannenden Kriminalfälle aus den Spruchakten der Juristenfakultät Greifswald vorstellen: ‚Hexerei, Unzucht, Mord und Totschlag in Pommern. Automatische Handschriftenerkennung und frühneuzeitliche Rechtsquellen‘. Wer Lust und Interesse an der Rechtsgeschichte hat, kann am 16.11.2019 um 12:00 ins Audimax (Rubenowstraße 1) in den Hörsaal 2 kommen.
Auf der Seite der Studierendenschaft könnt ihr euch auch das ganze Programm der 24-Stunden-Vorlesung noch als PDF anschauen.

Posted by Dirk Alvermann on

Transkribus in Chicago

Beim diesjährigen Treffen der ‚Social Scienes History Association‘ (SSHA) in Chicago wird auch Transkribus vorgestellt. Günter Mühlberger wird in seinem Beitrag nicht nur die Möglichkeiten von Transkribus aufzeigen, sondern stellt auch erste Ergebnisse und Erfahrungen aus der Verarbeitung der Katasterprotokolle des Tiroler Landesarchivs und  unserem Digitalisierungsprojekt vor. Besondere Aufmerksamkeit wird er dabei auf das Training von HTR-Modellen und die Möglichkeiten des Keyword Spotting richten. Der Vortrag findet am 21.11. ab 11:00 unter dem Titel: ‚Handwritten Text Recognition and Keyword Spotting as Research Tools for Social Science and History‘ in der Session 31 (Emerging Methods: Computation/Spatial Econometrics) statt.

Posted by Anna Brandt on

Resonanz

Der Blog „Rechtsgeschiedenis“ (Otto Vervaart/Utrecht), hat eine ausführliche Besprechung über das Projekt ‚Rechtssprechung im Ostseeraum‘ bzw. unseren Blog gegeben. Es wird sowohl unsere Arbeit mit Transkribus, das Projekt selber, sowie die Seite zur Vorstellung der Ergebnisse und des Blogs beschrieben – ein guter Überblick aus der Sicht eines Nutzers.