{"id":1605,"date":"2021-03-08T08:00:00","date_gmt":"2021-03-08T07:00:00","guid":{"rendered":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/?p=1605"},"modified":"2021-01-21T07:07:09","modified_gmt":"2021-01-21T06:07:09","slug":"automatic-selection-of-validation-set","status":"publish","type":"post","link":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/automatic-selection-of-validation-set\/","title":{"rendered":"Automatisch ausgew\u00e4hlte Validierungssets"},"content":{"rendered":"<p>\u00dcber Validierung und die verschiedenen Arten, ein <a href=\"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/how-to-create-test-sets-and-why-they-are-important-1\/\">Validierungsset<\/a> zusammenzustellen, findet ihr in diesem Blog schon einige Beitr\u00e4ge.<\/p>\n<p>Seit der letzten Version von Transkribus (1.12.0) gibt es eine neue M\u00f6glichkeit, Validierungssets zu erstellen. Dabei entnimmt Transkribus w\u00e4hrend der Zusammenstellung des Trainings aus dem Train-Set einen bestimmten Anteil (2%, 5% oder 10%) des Ground Truth und bildet daraus automatisch ein Validierungsset. Dieses Set besteht aus zuf\u00e4llig ausgew\u00e4hlten Seiten.<\/p>\n<p><span style=\"color: #ff0000;\"><a href=\"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2020\/11\/4_automatic_validation_set.jpg\" target=\"_blank\" rel=\"noopener\"><img loading=\"lazy\" decoding=\"async\" class=\"alignnone wp-image-1606\" src=\"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2020\/11\/4_automatic_validation_set-300x194.jpg\" alt=\"\" width=\"600\" height=\"388\" srcset=\"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2020\/11\/4_automatic_validation_set-300x194.jpg 300w, https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2020\/11\/4_automatic_validation_set-1024x663.jpg 1024w, https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2020\/11\/4_automatic_validation_set-768x497.jpg 768w, https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2020\/11\/4_automatic_validation_set-1020x660.jpg 1020w\" sizes=\"auto, (max-width: 600px) 100vw, 600px\" \/><\/a><\/span><\/p>\n<p>Gebildet werden diese Validierungssets im Trainings-Tool von Transkribus. Ihr beginnt daf\u00fcr wie \u00fcblich mit der Eingabe der Trainingsparameter f\u00fcr das Modell. Bevor ihr aber den Ground Truth zum Train-Set hinzuf\u00fcgt, w\u00e4hlt ihr den gew\u00fcnschten Prozentsatz f\u00fcr das Validierungsset aus. Diese Reihenfolge ist wichtig. Bei jedem neuen Dokument, das ihr jetzt dem Train-Set hinzuf\u00fcgt, werden von Transkribus die entsprechenden Seiten f\u00fcr das Validierungsset extrahiert. Das ist auch schon alles.<\/p>\n<p>Das neue Tool eignet sich sehr gut f\u00fcr gro\u00dfe Modelle mit entsprechend viel Ground Truth, vor allem, wenn euch die Aufstellung besonderer Validierungssets nicht wichtig ist, oder es euch f\u00fcr repr\u00e4sentative schwer f\u00e4llt.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>\u00dcber Validierung und die verschiedenen Arten, ein Validierungsset zusammenzustellen, findet ihr in diesem Blog schon einige Beitr\u00e4ge. Seit der letzten Version von Transkribus (1.12.0) gibt es eine neue M\u00f6glichkeit, Validierungssets zu erstellen. Dabei entnimmt Transkribus w\u00e4hrend der Zusammenstellung des Trainings aus dem Train-Set einen bestimmten Anteil (2%, 5% oder 10%) des Ground Truth und bildet [&hellip;]<\/p>\n","protected":false},"author":5,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[10],"tags":[],"class_list":["post-1605","post","type-post","status-publish","format-standard","hentry","category-wege-zum-htr-modell"],"translation":{"provider":"WPGlobus","version":"3.0.2","language":"de","enabled_languages":["gb","de"],"languages":{"gb":{"title":true,"content":true,"excerpt":false},"de":{"title":true,"content":true,"excerpt":false}}},"_links":{"self":[{"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/posts\/1605","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/users\/5"}],"replies":[{"embeddable":true,"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/comments?post=1605"}],"version-history":[{"count":4,"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/posts\/1605\/revisions"}],"predecessor-version":[{"id":1658,"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/posts\/1605\/revisions\/1658"}],"wp:attachment":[{"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/media?parent=1605"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/categories?post=1605"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/tags?post=1605"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}