{"id":364,"date":"2019-09-01T08:00:42","date_gmt":"2019-09-01T06:00:42","guid":{"rendered":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/?p=364"},"modified":"2019-12-10T09:02:50","modified_gmt":"2019-12-10T08:02:50","slug":"ground-truth-is-the-alpha-and-omega","status":"publish","type":"post","link":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/ground-truth-is-the-alpha-and-omega\/","title":{"rendered":"Ground Truth ist das A und O"},"content":{"rendered":"<p><span style=\"color: #0071a1;\"><em>Release 1.7.1<\/em><\/span><\/p>\n<p>Die Grundlage f\u00fcr die <span style=\"color: #0000ff;\"><u><a style=\"color: #0000ff;\" href=\"https:\/\/transkribus.eu\/wiki\/images\/2\/21\/Modell_Training_in_Transkribus.pdf\" target=\"_blank\" rel=\"noopener noreferrer\">Erstellung von HTR-Modellen<\/a><\/u><\/span> ist der sogenannte Ground Truth (GT). Das ist erst einmal nichts weiter als eine maschinenlesbare Abschrift der historischen Handschrift, eine klassische litterale oder diplomatische Transkription, die zu 100% korrekt ist \u2013 \u201eGroundt Truth\u201c eben.<\/p>\n<p>Jeder Fehler in diesem Trainingsmaterial sorgt daf\u00fcr, dass \u201edie Maschine\u201c (neben vielem Richtigen) etwas Falsches lernt. Darum ist Qualit\u00e4tsmanagement bei der Erstellung von GT so wichtig. Aber keine Panik, nicht jeder Fehler im GT hat verheerende Folgen, er darf sich nur nicht allzu oft wiederholen, sonst wird er f\u00fcr das Modell \u201echronisch\u201c.<\/p>\n<p>Um die Qualit\u00e4t des GT innerhalb unseres Projektes zu sichern, haben wir ein paar feste <a href=\"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/?p=556&amp;preview=true\" target=\"_blank\" rel=\"noopener\">Transskriptionsrichtlinien<\/a> aufgestellt, wie man sie auch aus Editionsprojekten kennt. Es lohnt sich, dabei von einer litteralen, zeichengenauen Transkription auszugehen. Auf Regulierungen jeder Art, auf Normalisierungen, etwa bei der vokalischen oder konsonantischen Verwendung von \u201eu\u201c und \u201ev\u201c muss dabei ebenso verzichtet werden, wie auf die Aufl\u00f6sung komplexer <a href=\"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/?p=1079&amp;preview=true\">Abbreviaturen<\/a>.<\/p>\n<p>Wenn das Material nur ein oder zwei unterschiedliche Handschriften oder Schreiberh\u00e4nde enth\u00e4lt, gen\u00fcgen um die 100 Seiten transkribierter Text f\u00fcr ein erstes Training, um ein Basismodell zu erstellen, mit dem man weiterarbeiten kann. Die Anzahl der im Text verwendeten <a href=\"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/languages\/\">Sprachen<\/a> spielt dabei \u00fcbrigens nach unseren Erfahrungen keine Rolle, denn die HTR-Modelle arbeiten im Regelfall ohne <a href=\"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/?p=840&amp;preview=true\">W\u00f6rterb\u00fccher<\/a>.<\/p>\n<p>Neben der herk\u00f6mmlichen Transkription kann Ground Truth auch halbautomatisiert erstellt werden. Dazu bietet Transkribus ein spezielles Tool- Text2Image \u2013 das in einem anderen post vorgestellt wird.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Release 1.7.1 Die Grundlage f\u00fcr die Erstellung von HTR-Modellen ist der sogenannte Ground Truth (GT). Das ist erst einmal nichts weiter als eine maschinenlesbare Abschrift der historischen Handschrift, eine klassische litterale oder diplomatische Transkription, die zu 100% korrekt ist \u2013 \u201eGroundt Truth\u201c eben. Jeder Fehler in diesem Trainingsmaterial sorgt daf\u00fcr, dass \u201edie Maschine\u201c (neben vielem [&hellip;]<\/p>\n","protected":false},"author":5,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[6,10],"tags":[],"class_list":["post-364","post","type-post","status-publish","format-standard","hentry","category-transkribus-in-practice","category-wege-zum-htr-modell"],"translation":{"provider":"WPGlobus","version":"3.0.2","language":"de","enabled_languages":["gb","de"],"languages":{"gb":{"title":true,"content":true,"excerpt":false},"de":{"title":true,"content":true,"excerpt":false}}},"_links":{"self":[{"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/posts\/364","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/users\/5"}],"replies":[{"embeddable":true,"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/comments?post=364"}],"version-history":[{"count":16,"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/posts\/364\/revisions"}],"predecessor-version":[{"id":916,"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/posts\/364\/revisions\/916"}],"wp:attachment":[{"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/media?parent=364"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/categories?post=364"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/tags?post=364"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}