{"id":1108,"date":"2020-02-11T08:00:10","date_gmt":"2020-02-11T07:00:10","guid":{"rendered":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/?p=1108"},"modified":"2019-12-17T08:30:37","modified_gmt":"2019-12-17T07:30:37","slug":"p2pala-postprocessing","status":"publish","type":"post","link":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/p2pala-postprocessing\/","title":{"rendered":"P2PaLA \u2013 Postprocessing"},"content":{"rendered":"<p><span style=\"color: #0071a1;\"><em>Release 1.9.1<\/em><\/span><\/p>\r\n<p>Gerade am Anfang der Entwicklung eines Strukturmodells kam es bei uns vor, dass das Modell einfach jede Unregelm\u00e4\u00dfigkeit im Layout als eigene TR erkennen wollte. Das f\u00fchrt zu \u00fcberm\u00e4\u00dfig \u2013 und \u00fcberfl\u00fcssig \u2013 vielen Textregions. Viele dieser TRs waren au\u00dferdem extrem klein.<\/p>\r\n<p>Je mehr Trainingsmaterial man investiert, desto geringer wird dieses Problem. Bei uns verschwanden diese Mini-TRs, die \u00fcberall auf der Seite zu finden waren, nachdem wir unser Modell mit etwa 1000 Seiten trainiert hatten. Bis dahin st\u00f6ren sie aber, denn sie alle von Hand zu entfernen ist m\u00fchsam.<\/p>\r\n<p>Um diese Arbeit zu vermindern, habt ihr zwei M\u00f6glichkeiten. Einmal k\u00f6nnt ihr beim Start der P2PaLA schon festlegen, wie gro\u00df die kleinste TR sein darf. Daf\u00fcr m\u00fcsst ihr den entsprechenden Wert im &#8222;P2PaLA structure analysis tool&#8220; vor dem Start des Jobs ausw\u00e4hlen (&#8222;Min area&#8220;).<\/p>\r\n<p><a href=\"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2019\/12\/Min-area-Textregions.jpg\" target=\"_blank\" rel=\"noopener noreferrer\"><img loading=\"lazy\" decoding=\"async\" class=\"alignnone wp-image-1109\" src=\"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2019\/12\/Min-area-Textregions-300x134.jpg\" alt=\"\" width=\"600\" height=\"269\" srcset=\"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2019\/12\/Min-area-Textregions-300x134.jpg 300w, https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2019\/12\/Min-area-Textregions.jpg 565w\" sizes=\"auto, (max-width: 600px) 100vw, 600px\" \/><\/a><\/p>\r\n<p>Sollte diese M\u00f6glichkeit nicht den gew\u00fcnschten Erfolg bringen, gibt es auf der linken Toolbar unter dem Punkt &#8222;other segmentation tools&#8220; die Option &#8222;remove small textregions&#8220;. In dem ge\u00f6ffneten Fenster kann man die Seiten, auf denen der Filter laufen soll, einstellen und auch die Gr\u00f6\u00dfe der zu entfernenden TRs. Die Gr\u00f6\u00dfe wird hier in &#8222;Prozent des bestehenden Images&#8220; gerechnet. Und hier l\u00e4sst sich der Wert auch feiner kalibrieren als bei der oben genannten M\u00f6glichkeit. Wenn das Material, wie in unserem Fall, oftmals kleine Notizen oder auch nur einzelne W\u00f6rter in eigenen Textregions aufweist, dann sollte immer der kleinste oder zweitkleinste Wert gew\u00e4hlt werden. Wir verwenden in der Regel eine &#8222;Threshold percentage&#8220; von 0,005.<\/p>\r\n<p><a href=\"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2019\/12\/Remove-small-Textregions.jpg\" target=\"_blank\" rel=\"noopener noreferrer\"><img loading=\"lazy\" decoding=\"async\" class=\"alignnone wp-image-1110\" src=\"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2019\/12\/Remove-small-Textregions-300x120.jpg\" alt=\"\" width=\"600\" height=\"240\" srcset=\"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2019\/12\/Remove-small-Textregions-300x120.jpg 300w, https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2019\/12\/Remove-small-Textregions.jpg 512w\" sizes=\"auto, (max-width: 600px) 100vw, 600px\" \/><\/a><\/p>\r\n<p>Selbst mit einem guten Strukturmodell kann es immer noch m\u00f6glich sein, dass einzelne TRs manuell verschmolzen, geteilt oder entfernt werden m\u00fcssen &#8211; aber in einem deutlich geringeren Ma\u00dfe, als das bei der Standard LA notwendig w\u00e4re.<\/p>\r\n\r\n<p class=\"has-background\" style=\"background-color: #f4e3a5;\"><strong>Tipps &amp; Tools<\/strong><br \/>Wichtig: Wenn man sicher sein will, dass man nicht zu viele TRs beseitigt, kann man mit einem \u201edry run\u201c starten. Dann wird zun\u00e4chst die Anzahl der potentiell zu entfernenden TRs aufgelistet. Sobald man den Haken aus dem K\u00e4stchen entfernt, werden die betroffenen TRs beim Filtern unmittelbar gel\u00f6scht.<\/p>\r\n","protected":false},"excerpt":{"rendered":"<p>Release 1.9.1 Gerade am Anfang der Entwicklung eines Strukturmodells kam es bei uns vor, dass das Modell einfach jede Unregelm\u00e4\u00dfigkeit im Layout als eigene TR erkennen wollte. Das f\u00fchrt zu \u00fcberm\u00e4\u00dfig \u2013 und \u00fcberfl\u00fcssig \u2013 vielen Textregions. Viele dieser TRs waren au\u00dferdem extrem klein. Je mehr Trainingsmaterial man investiert, desto geringer wird dieses Problem. Bei [&hellip;]<\/p>\n","protected":false},"author":4,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[6,9],"tags":[],"class_list":["post-1108","post","type-post","status-publish","format-standard","hentry","category-transkribus-in-practice","category-layout-analysis"],"translation":{"provider":"WPGlobus","version":"3.0.2","language":"de","enabled_languages":["gb","de"],"languages":{"gb":{"title":true,"content":true,"excerpt":false},"de":{"title":true,"content":true,"excerpt":false}}},"_links":{"self":[{"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/posts\/1108","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/users\/4"}],"replies":[{"embeddable":true,"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/comments?post=1108"}],"version-history":[{"count":9,"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/posts\/1108\/revisions"}],"predecessor-version":[{"id":1188,"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/posts\/1108\/revisions\/1188"}],"wp:attachment":[{"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/media?parent=1108"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/categories?post=1108"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/tags?post=1108"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}