{"id":1096,"date":"2020-01-21T08:00:25","date_gmt":"2020-01-21T07:00:25","guid":{"rendered":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/?p=1096"},"modified":"2019-12-17T08:28:51","modified_gmt":"2019-12-17T07:28:51","slug":"p2pala-or-structure-training","status":"publish","type":"post","link":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/p2pala-or-structure-training\/","title":{"rendered":"P2PaLA oder Strukturtraining"},"content":{"rendered":"<p><span style=\"color: #0071a1;\"><em>Release 1.9.1<\/em><\/span><\/p>\n<p>Die Page-to-Page-Layoutanalyse (P2PaLA) ist eine Form der Layoutanalyse f\u00fcr die, \u00e4hnlich wie bei der HTR, individuelle Modelle trainiert werden k\u00f6nnen. Diese Modelle k\u00f6nnen trainiert werden, sodass sie entweder<del><\/del> nur Textregionen erkennen oder Textregionen und Baselines \u2013 sie erf\u00fcllen also dieselben Funktionen, die auch von der Standard Layoutanalyse (CITlab Advanced) ausgef\u00fchrt werden. Die P2PaLA ist vor allem geeignet wenn ein Dokument viele Seiten mit mixed Layout<del><\/del> aufweist. Die Standard Layoutanalyse erkennt in solchen F\u00e4llen meist nur <a href=\"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/textregions\/\">eine TR<\/a> \u2013 und das kann im Text zu Problemen bei der Reading Order f\u00fchren.<\/p>\n<p>Mit Hilfe eines Strukturtrainings kann die Layoutanalyse lernen, wo in etwa oder auch wie viele TRs sie erkennen soll.<\/p>\n<p>Die CITlab Advanced LA hatte bei unserem Material h\u00e4ufig Probleme Textregionen ausreichend differentziert zu erkennen. Daher haben wir in unserem Projekt fr\u00fch mit der P2PaLA experimentriert. Zun\u00e4chst probierten wir Strukturmodelle aus, die <a href=\"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/?p=1114&amp;preview=true\">ausschlie\u00dflich Textregionen<\/a> setzten (Haupttext, Marginalien, Fu\u00dfnoten etc.). In den so erzeugten TRs konnte dann die gew\u00f6hnliche Line detection durchgef\u00fchrt werden. Aber auch hier waren die Ergebnisse f\u00fcr uns nicht immer zufriedenstellend.<span style=\"color: #ff00ff;\"><br \/>\n<\/span><\/p>\n<p>Die BLs waren oft zu kurz (am Zeilenanfang oder Zeilenende) oder vielfach zerrissen \u2013 auch bei Seiten mit einfachem Layout. Deshalb haben wir auf Grundlage unseres bereits funktionierenden P2PaLA-Modells ein weiteres, mit zus\u00e4tzlicher <a href=\"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/?p=1103&amp;preview=true\">Erkennung der BLs<\/a>, trainiert. Unser neuestes Modell erkennt mittlerweile alle &#8218;einfachen&#8216; Seiten fast fehlerlos. Bei Seiten mit sehr differenzierten Layouts m\u00fcssen die Ergebnisse immer noch korrigiert werden, allerdings mit deutlich geringerem Aufwand als zuvor.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Release 1.9.1 Die Page-to-Page-Layoutanalyse (P2PaLA) ist eine Form der Layoutanalyse f\u00fcr die, \u00e4hnlich wie bei der HTR, individuelle Modelle trainiert werden k\u00f6nnen. Diese Modelle k\u00f6nnen trainiert werden, sodass sie entweder nur Textregionen erkennen oder Textregionen und Baselines \u2013 sie erf\u00fcllen also dieselben Funktionen, die auch von der Standard Layoutanalyse (CITlab Advanced) ausgef\u00fchrt werden. Die P2PaLA [&hellip;]<\/p>\n","protected":false},"author":5,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[6,9],"tags":[],"class_list":["post-1096","post","type-post","status-publish","format-standard","hentry","category-transkribus-in-practice","category-layout-analysis"],"translation":{"provider":"WPGlobus","version":"3.0.2","language":"de","enabled_languages":["gb","de"],"languages":{"gb":{"title":true,"content":true,"excerpt":false},"de":{"title":true,"content":true,"excerpt":false}}},"_links":{"self":[{"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/posts\/1096","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/users\/5"}],"replies":[{"embeddable":true,"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/comments?post=1096"}],"version-history":[{"count":11,"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/posts\/1096\/revisions"}],"predecessor-version":[{"id":1263,"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/posts\/1096\/revisions\/1263"}],"wp:attachment":[{"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/media?parent=1096"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/categories?post=1096"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/tags?post=1096"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}