{"id":1303,"date":"2020-04-24T08:00:19","date_gmt":"2020-04-24T06:00:19","guid":{"rendered":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/?p=1303"},"modified":"2020-04-16T12:12:51","modified_gmt":"2020-04-16T10:12:51","slug":"breaking-rules-the-problem-wiht-concept-writings","status":"publish","type":"post","link":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/breaking-rules-the-problem-wiht-concept-writings\/","title":{"rendered":"Der Regelbruch &#8211; das Problem mit Konzeptschriften"},"content":{"rendered":"<p><span style=\"color: #0071a1;\"><em>Release 1.10.1<\/em><\/span><\/p>\n<p>Konzeptschriften werden verwendet, wenn ein Schreiber schnell einen Entwurf anfertigt, der erst sp\u00e4ter \u201eins Reine\u201c geschrieben wird. Bei den Spruchakten sind dies die sp\u00e4ter verschickten Urteile. Diese Schriften sind meist sehr fl\u00fcchtig und \u201eunordentlich\u201c geschrieben. Oftmals werden dabei Buchstaben ausgelassen oder Wortendungen \u201everschluckt\u201c. Konzeptschriften sind schon f\u00fcr den menschlichen Leser oft nicht leicht zu entziffern. F\u00fcr die HTR stellen sie eine besondere Herausforderung dar.<\/p>\n<p>Um ein HTR-Modell f\u00fcr das Lesen von Konzeptschriften zu trainieren, geht man ganz \u00e4hnlich vor, wie beim Traininig eines Modells, das Abbreviaturen interpretieren soll. Das HTR-Modell muss in beiden F\u00e4llen bef\u00e4higt werden, etwas zu lesen, was \u00fcberhaupt nicht da ist \u2013 n\u00e4mlich fehlende Buchstaben und Silben. Um das zu erreichen muss die <a href=\"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/how-to-transcribe-principal-decisions\/\" target=\"_blank\" rel=\"noopener\">Transkriptionsregel<\/a>: \u201eWir transkribieren als Ground Truth nur das, was auch wirklich auf dem Papier steht\u201c gebrochen werden. Wir m\u00fcssen vielmehr alle ausgelassenen Buchstaben und fehlende Wortendungen etc. in unsere Transkription einf\u00fcgen. Anders werden wir am Ende kein sinnvolles und durchsuchbares HTR-Ergebnis erhalten.<\/p>\n<p>Bei unseren Versuchen mit Konzeptschriften hatten wir zuerst versucht <a href=\"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/all-in-one-vs-specialized-model\/\">spezielle HTR-Modelle<\/a> f\u00fcr Konzeptschriften zu trainieren. Der Erfolg damit war eher gering. Schlie\u00dflich sind wir dazu \u00fcbergegangen, Konzeptschriften \u2013 \u00e4hnlich wie die Abbreviaturen \u2013 direkt innerhalb unseres generischen Modells mit zu trainieren. Dabei haben wir immer wieder \u00fcberpr\u00fcft, ob der \u201efalsche Ground Truth\u201c den wir dabei produzieren, das Gesamtergebnis unseres HTR-Modells verschlechtert. \u00dcberraschender weise hatte das Brechen der Transkriptionsregeln, keinen messbaren negativen Effekt auf die Qualit\u00e4t des Modells. Das ist wahrscheinlich auch auf die schiere Menge des Ground Truth zur\u00fcckzuf\u00fchren, der in unserem Fall verwendet wird (ca. 400.000 W\u00f6rter).<\/p>\n<p>HTR-Modelle sind also in der Lage Konzeptschriften von Reinschriften zu unterscheiden und entsprechend zu interpretieren \u2013 innerhalb bestimmter Grenzen. Unten findet ihr einen Vergleich des HTR-Ergebnisses mit dem GT bei einer typischen Konzeptschrift aus unserem Material.<\/p>\n<p><a href=\"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2020\/04\/Concept-Writings.jpg\" target=\"_blank\" rel=\"noopener\"><img loading=\"lazy\" decoding=\"async\" class=\"alignnone wp-image-1304\" src=\"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2020\/04\/Concept-Writings-300x177.jpg\" alt=\"\" width=\"600\" height=\"354\" srcset=\"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2020\/04\/Concept-Writings-300x177.jpg 300w, https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2020\/04\/Concept-Writings-1024x605.jpg 1024w, https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2020\/04\/Concept-Writings-768x454.jpg 768w, https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2020\/04\/Concept-Writings-1118x660.jpg 1118w, https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2020\/04\/Concept-Writings.jpg 1231w\" sizes=\"auto, (max-width: 600px) 100vw, 600px\" \/><\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Release 1.10.1 Konzeptschriften werden verwendet, wenn ein Schreiber schnell einen Entwurf anfertigt, der erst sp\u00e4ter \u201eins Reine\u201c geschrieben wird. Bei den Spruchakten sind dies die sp\u00e4ter verschickten Urteile. Diese Schriften sind meist sehr fl\u00fcchtig und \u201eunordentlich\u201c geschrieben. Oftmals werden dabei Buchstaben ausgelassen oder Wortendungen \u201everschluckt\u201c. Konzeptschriften sind schon f\u00fcr den menschlichen Leser oft nicht leicht [&hellip;]<\/p>\n","protected":false},"author":5,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[6,11],"tags":[],"class_list":["post-1303","post","type-post","status-publish","format-standard","hentry","category-transkribus-in-practice","category-ground-truth"],"translation":{"provider":"WPGlobus","version":"3.0.2","language":"de","enabled_languages":["gb","de"],"languages":{"gb":{"title":true,"content":true,"excerpt":false},"de":{"title":true,"content":true,"excerpt":false}}},"_links":{"self":[{"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/posts\/1303","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/users\/5"}],"replies":[{"embeddable":true,"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/comments?post=1303"}],"version-history":[{"count":11,"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/posts\/1303\/revisions"}],"predecessor-version":[{"id":1306,"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/posts\/1303\/revisions\/1306"}],"wp:attachment":[{"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/media?parent=1303"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/categories?post=1303"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/tags?post=1303"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}