{"id":1388,"date":"2020-08-28T08:00:39","date_gmt":"2020-08-28T06:00:39","guid":{"rendered":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/?p=1388"},"modified":"2020-08-25T14:09:37","modified_gmt":"2020-08-25T12:09:37","slug":"compare-samples","status":"publish","type":"post","link":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/compare-samples\/","title":{"rendered":"Compare Samples"},"content":{"rendered":"<p><em><span style=\"color: #0071a1;\">Release 1.10.1<\/span><\/em><\/p>\r\n<p>Das Tool \u201eCompare Samples\u201c \u00fcberpr\u00fcft, wie der Name schon sagt, die F\u00e4higkeiten eines HTR-Modells nicht anhand eines manuell ausgew\u00e4hlten Testsets, sondern auf der Grundlage eines Samples. Wie man solche Samples erstellt, dass sie eine objektive Alternative zu konventionellen Testsets darstellen und warum sie mit wesentlich weniger Aufwand als diese erstellt werden k\u00f6nnen, haben wir in einem <a href=\"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/?p=752&amp;preview=true\">fr\u00fcheren Beitrag<\/a> erkl\u00e4rt.<\/p>\r\n<p>\u201eCompare Samples\u201c sieht zwar aus wie ein Validierungs-Tool, geh\u00f6rt aber eigentlich nicht dazu. Nicht dass man damit ein HTR-Modell nicht validieren k\u00f6nnte, aber daf\u00fcr ist das Advanced Compare eigentlich besser geeignet. Die eigentliche Funktion von \u201eSample Compare\u201c ist, dass es Voraussagen oder Prognosen \u00fcber den Erfolg eines HTR-Modells auf einem bestimmten Material erstellt.<\/p>\r\n<p>Ihr erinnert euch vielleicht an den <a href=\"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/?p=1365&amp;preview=true\">Model Booster<\/a>. Wenn man f\u00fcr ein geplantes HTR-Training unter den inzwischen zahlreichen verf\u00fcgbaren Public Models ein geeignetes HTR-Modell sucht, das als Base Model dienen kann, dann bietet es sich an, das zuerst mit \u201eCompare Samples\u201c auf seine Eignung zu \u00fcberpr\u00fcfen.<\/p>\r\n<p>Um f\u00fcr ein Sample eine solche Voraussage zu erstellen, m\u00fcsst ihr zuerst die ausgew\u00e4hlten HTR-Modelle \u00fcber das gesamte Sample laufen lassen (Davor habt ihr nat\u00fcrlich f\u00fcr das Sample schon den GT erstellt). Anschlie\u00dfend \u00f6ffnet ihr im \u201eCompare Samples\u201c-Tool den Reiter Samples. Darin sind s\u00e4mtliche Samples deiner aktiven Collection aufgelistet. Ihr w\u00e4hlt das Sample aus, das als Grundlage f\u00fcr die Vorhersage dienen soll. Jetzt k\u00f6nnt ihr in der Mitte das Modell ausw\u00e4hlen, dessen Textversion als Referenz f\u00fcr den GT dienen soll. \u201eCompute\u201c starten und fertig.<\/p>\r\n<p>Das Tool errechnet euch jetzt Durchschnittswerte f\u00fcr alle Zeilen des Samples mit jeweils einem oberen Durchschnittswert (upper bound), einem unteren (lower bound) und einem Mittelwert. In der Spanne zwischen upper bound und lower bound sollte dann f\u00fcr 95 % eures Materials die Character Error Rate liegen mit der das gew\u00e4hlte HTR-Modell voraussichtlich arbeitet. In unserem Beispiel unten also zwischen 4,7 und 2,9 %.<\/p>\r\n<p><strong><a href=\"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2020\/04\/5.-Sample-Compare.jpg\" target=\"_blank\" rel=\"noopener noreferrer\"><img loading=\"lazy\" decoding=\"async\" class=\"alignnone wp-image-1390\" src=\"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2020\/04\/5.-Sample-Compare-300x187.jpg\" alt=\"\" width=\"600\" height=\"374\" srcset=\"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2020\/04\/5.-Sample-Compare-300x187.jpg 300w, https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2020\/04\/5.-Sample-Compare-768x479.jpg 768w, https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2020\/04\/5.-Sample-Compare.jpg 900w\" sizes=\"auto, (max-width: 600px) 100vw, 600px\" \/><\/a><\/strong><\/p>\r\n<p>Ihr k\u00f6nnt auf diese Art beliebig viele Modelle f\u00fcr euer Material vergleichen. Aber das Tool erlaubt auch ein paar andere Dinge. Ihr k\u00f6nnt z.B. sehr gut \u00fcberpr\u00fcfen, wie ein HTR-Modell mit oder ohne <a href=\"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/?p=1297&amp;preview=true\">language model<\/a> oder <a href=\"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/?p=840&amp;preview=true\">dictionary<\/a> auf eurem Material arbeitet und ob sich also der Einsatz des einen oder anderen lohnt. Das bietet sich nat\u00fcrlich vor allem f\u00fcr die \u00dcberpr\u00fcfung der eigenen Modelle an.<\/p>\r\n<p><strong><a href=\"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2020\/04\/6.-Sample-Compare-2.jpg\" target=\"_blank\" rel=\"noopener noreferrer\"><img loading=\"lazy\" decoding=\"async\" class=\"alignnone wp-image-1391\" src=\"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2020\/04\/6.-Sample-Compare-2-300x145.jpg\" alt=\"\" width=\"600\" height=\"290\" srcset=\"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2020\/04\/6.-Sample-Compare-2-300x145.jpg 300w, https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2020\/04\/6.-Sample-Compare-2.jpg 697w\" sizes=\"auto, (max-width: 600px) 100vw, 600px\" \/><\/a><\/strong><\/p>\r\n<p>&nbsp;<\/p>\r\n\r\n<p class=\"has-background\" style=\"background-color: #f4e3a5;\">Tipps &amp; Tools<br \/>Erstellt lieber mehrere kleinere Samples als ein gigantisches Sample f\u00fcr all euer Material. Ihr k\u00f6nnt sie z. B. chronologisch oder nach Schreiberh\u00e4nden trennen. Das erlaubt euch sp\u00e4ter eine differenzierte Voraussage f\u00fcr den Einsatz von HTR-Modellen auf eurem gesamten Material oder auf Teilen davon.<\/p>\r\n","protected":false},"excerpt":{"rendered":"<p>Release 1.10.1 Das Tool \u201eCompare Samples\u201c \u00fcberpr\u00fcft, wie der Name schon sagt, die F\u00e4higkeiten eines HTR-Modells nicht anhand eines manuell ausgew\u00e4hlten Testsets, sondern auf der Grundlage eines Samples. Wie man solche Samples erstellt, dass sie eine objektive Alternative zu konventionellen Testsets darstellen und warum sie mit wesentlich weniger Aufwand als diese erstellt werden k\u00f6nnen, haben [&hellip;]<\/p>\n","protected":false},"author":5,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[6,10],"tags":[],"class_list":["post-1388","post","type-post","status-publish","format-standard","hentry","category-transkribus-in-practice","category-wege-zum-htr-modell"],"translation":{"provider":"WPGlobus","version":"3.0.2","language":"de","enabled_languages":["gb","de"],"languages":{"gb":{"title":true,"content":true,"excerpt":false},"de":{"title":true,"content":true,"excerpt":false}}},"_links":{"self":[{"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/posts\/1388","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/users\/5"}],"replies":[{"embeddable":true,"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/comments?post=1388"}],"version-history":[{"count":14,"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/posts\/1388\/revisions"}],"predecessor-version":[{"id":1552,"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/posts\/1388\/revisions\/1552"}],"wp:attachment":[{"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/media?parent=1388"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/categories?post=1388"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/tags?post=1388"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}