{"id":885,"date":"2019-11-17T08:00:59","date_gmt":"2019-11-17T07:00:59","guid":{"rendered":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/?p=885"},"modified":"2020-04-07T15:01:20","modified_gmt":"2020-04-07T13:01:20","slug":"all-in-one-vs-specialized-model","status":"publish","type":"post","link":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/all-in-one-vs-specialized-model\/","title":{"rendered":"Gesamtmodell oder Spezialmodell"},"content":{"rendered":"<p>Ist dir in dem <a href=\"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2019\/09\/Viel-hilft-viel-2.jpg\">Diagramm<\/a> zur Modellentwicklung aufgefallen, dass die Zeichenfehlerquote (<a href=\"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/?p=843&amp;preview=true\">CER<\/a>) des letzten Modells wieder etwas schlechter wurde? Und das, obwohl wir den GT-Input deutlich gesteigert hatten? Wir hatten rund 43.000 mehr W\u00f6rter im Training aber eine Verschlechterung der durchschnittlichen CER von 2,79 auf 3,43 %. Erkl\u00e4ren konnten wir uns das nicht so richtig.<\/p>\n<p>An dieser Stelle kamen wir mit immer mehr GT doch nicht so richtig weiter. Wir mussten also unsere Trainings-Strategie \u00e4ndern. Bisher hatten wir Gesamtmodelle trainiert, mit Schriften aus einem Gesamtzeitraum von 70 Jahren und von \u00fcber 500 Schreibern.<\/p>\n<p>Unser erster Verdacht fiel auf die Konzeptschriften, von denen wir schon wussten, dass die Maschine (LA und HTR) \u2013 wie wir auch \u2013 damit ihre Probleme hat. Beim n\u00e4chsten Training schlossen wir deshalb diese Konzeptschriften aus und trainierten also nur mit \u201esauberen\u201c Kanzleischriften. Eine auff\u00e4llige Verbesserung brachte das aber nicht: die Test Set-CER sank von 3,43 auf gerade einmal 3,31 %.<\/p>\n<p>Im den darauf folgenden Trainings setzten wir dann zus\u00e4tzlich auf eine chronologische Sequenzierung der Modelle. Wir teilten unser Material und erstellten zwei verschiedene Modelle: Spruchakten_M_3-1 (Spruchakten 1583-1627) und Spruchakten_M_4-1 (Spruchakten 1627-1653).<\/p>\n<p>Mit den neuen Spezialmodellen erreichten wir tats\u00e4chlich wieder eine Verbesserung der HTR \u2013 wo das Gesamtmodell nicht mehr ausgereicht hatte. In den Testsets wiesen jetzt etliche Seiten eine Fehlerquote von unter 2 % auf. Im Fall des M_4-1er Modells blieben viele Seiten-CERs unter 1 % und zwei Seiten sogar fehlerfrei mit 0 %.<\/p>\n<p><a href=\"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2019\/09\/Gesamtmodell-vs.-Spezialmodell.jpg\" target=\"_blank\" rel=\"noopener\"><img loading=\"lazy\" decoding=\"async\" class=\"alignnone wp-image-886\" src=\"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2019\/09\/Gesamtmodell-vs.-Spezialmodell-300x146.jpg\" alt=\"\" width=\"600\" height=\"293\" srcset=\"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2019\/09\/Gesamtmodell-vs.-Spezialmodell-300x146.jpg 300w, https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2019\/09\/Gesamtmodell-vs.-Spezialmodell-768x374.jpg 768w, https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2019\/09\/Gesamtmodell-vs.-Spezialmodell-1024x499.jpg 1024w, https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2019\/09\/Gesamtmodell-vs.-Spezialmodell-1170x571.jpg 1170w, https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2019\/09\/Gesamtmodell-vs.-Spezialmodell.jpg 1251w\" sizes=\"auto, (max-width: 600px) 100vw, 600px\" \/><\/a><\/p>\n<p>Ob ein Gesamt- oder Spezialmodell weiterhilft und die besseren Ergebnisse bringt, h\u00e4ngt nat\u00fcrlich sehr vom Umfang und der Zusammenstellung des Materials ab. Am Anfang, wenn du noch \u201eMasse machen\u201c willst (<a href=\"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/the-more-the-better-how-much-gt-do-i-have-to-put-in\/\">viel hilft viel<\/a>) lohnt sich ein Gesamtmodell. Wenn das aber an seine Grenzen kommt, solltest du die HTR nicht weiter \u201e\u00fcberfordern\u201c sondern stattdessen deine Modelle spezialisieren.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Ist dir in dem Diagramm zur Modellentwicklung aufgefallen, dass die Zeichenfehlerquote (CER) des letzten Modells wieder etwas schlechter wurde? Und das, obwohl wir den GT-Input deutlich gesteigert hatten? Wir hatten rund 43.000 mehr W\u00f6rter im Training aber eine Verschlechterung der durchschnittlichen CER von 2,79 auf 3,43 %. Erkl\u00e4ren konnten wir uns das nicht so richtig. [&hellip;]<\/p>\n","protected":false},"author":5,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[6,10],"tags":[],"class_list":["post-885","post","type-post","status-publish","format-standard","hentry","category-transkribus-in-practice","category-wege-zum-htr-modell"],"translation":{"provider":"WPGlobus","version":"3.0.2","language":"de","enabled_languages":["gb","de"],"languages":{"gb":{"title":true,"content":true,"excerpt":false},"de":{"title":true,"content":true,"excerpt":false}}},"_links":{"self":[{"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/posts\/885","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/users\/5"}],"replies":[{"embeddable":true,"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/comments?post=885"}],"version-history":[{"count":13,"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/posts\/885\/revisions"}],"predecessor-version":[{"id":888,"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/posts\/885\/revisions\/888"}],"wp:attachment":[{"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/media?parent=885"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/categories?post=885"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/tags?post=885"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}