{"id":1114,"date":"2020-02-04T08:00:25","date_gmt":"2020-02-04T07:00:25","guid":{"rendered":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/?p=1114"},"modified":"2019-12-17T08:19:24","modified_gmt":"2019-12-17T07:19:24","slug":"p2pala-training-for-textregions","status":"publish","type":"post","link":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/p2pala-training-for-textregions\/","title":{"rendered":"P2PaLA \u2013 Training f\u00fcr Textregions"},"content":{"rendered":"<p><span style=\"color: #0071a1;\"><em>Release 1.9.1<\/em><\/span><\/p>\r\n<p>An einer anderen Stelle dieses Blogs findet ihr Hinweise und Tipps zum <a href=\"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/?p=1168&amp;preview=true\">Strukturtagging<\/a>. Diese Art des Taggings kann f\u00fcr vieles gut sein \u2013 hier soll es um seinen Nutzen f\u00fcr eine verbesserte Layout Analyse gehen. Denn das Strukturtagging ist ein wichtiger Teil beim Training P2PaLA-Modelle.<\/p>\r\n<p>Bei unseren <a href=\"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/mixed-layouts\/\">Mixed Layouts<\/a> musste die Standard LA einfach versagen. F\u00fcr eine manuelle Erstellung des Layouts war das Material zu umfangreich. Also entschieden wir uns, es mit der <a href=\"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/?p=1096&amp;preview=true\">P2PaLA<\/a> zu versuchen. Dazu haben wir Trainingsmaterial erstellt, f\u00fcr das wir m\u00f6glichst typische &#8217;schwierige&#8216; Seiten aus unserem Material ausgew\u00e4hlt haben. Das waren Seiten, die neben dem eigentlichen Haupttext au\u00dferdem noch Randbemerkungen,<del><\/del> Nachs\u00e4tze und \u00e4hnliches enthielten.<\/p>\r\n<p>&nbsp;<\/p>\r\n<p><a href=\"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2019\/12\/Bsp.-Textregions.jpg\" target=\"_blank\" rel=\"noopener noreferrer\"><img loading=\"lazy\" decoding=\"async\" class=\"alignnone wp-image-1115\" src=\"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2019\/12\/Bsp.-Textregions-199x300.jpg\" alt=\"\" width=\"398\" height=\"600\" srcset=\"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2019\/12\/Bsp.-Textregions-199x300.jpg 199w, https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2019\/12\/Bsp.-Textregions-437x660.jpg 437w\" sizes=\"auto, (max-width: 398px) 100vw, 398px\" \/><\/a><br \/>coll: UAG Strukturtagging, doc. UAG 1618-1, image 12<\/p>\r\n<p>Beim Trainingsmaterial sind nur die richtig gezogenen und getaggten Textregions wichtig. Line detection oder HTR interessieren an diesem Punkt noch nicht. Es k\u00f6nnen also auch bereits vollst\u00e4ndig bearbeitete Seiten ins Training aufgenommen werden. Wenn man neue Seiten nimmt, auf denen nur die TR gezogen und getaggt werden muss, geht es allerdings schneller. So k\u00f6nnen in einer Stunde schon mal achtzig bis hundert Seiten f\u00fcr ein Training vorbereitet werden.\u00a0<\/p>\r\n<p>W\u00e4hrend wir bei unserem ersten Modell sieben unterschiedliche Strukturtypen getaggt hatten, haben wir die Zahl sp\u00e4ter auf f\u00fcnf reduziert. Eine zu starke Differenzierung der Strukturtypen wirkt sich nach unserer Erfahrung eher negativ auf das Training aus.<\/p>\r\n<p>Nat\u00fcrlich h\u00e4ngt der Erfolg des Trainings auch von der Menge des Trainingsmaterials ab, das man investiert. Nach unseren Erfahrungen (und bezogen auf unser Material) kann man mit 200 Seiten einen guten Anfang machen, mit 600 Seiten erh\u00e4lt man ein Modell mit dem man schon arbeiten kann, ab 2000 Seiten ist es sehr zuverl\u00e4ssig.<\/p>\r\n\r\n<p class=\"has-background\" style=\"background-color: #f4e3a5;\"><strong>Tipps &amp; Tools<\/strong><br \/>Wenn man das Material f\u00fcr ein Strukturtraining erstellt ist es anfangs schwierig sich bewusst zu machen, dass es hier nicht um Inhalte geht. Das hei\u00dft egal welcher Inhalt dort steht, die TR in der Mitte ist immer der Paragraph. Auch wenn in der Mitte nur eine Notiz steht und das Konzept darunter viel l\u00e4nger ist und inhaltlich viel bedeutender. Nur so k\u00f6nnen im Training wirklich die n\u00f6tigen Muster erkannt werden.<\/p>\r\n","protected":false},"excerpt":{"rendered":"<p>Release 1.9.1 An einer anderen Stelle dieses Blogs findet ihr Hinweise und Tipps zum Strukturtagging. Diese Art des Taggings kann f\u00fcr vieles gut sein \u2013 hier soll es um seinen Nutzen f\u00fcr eine verbesserte Layout Analyse gehen. Denn das Strukturtagging ist ein wichtiger Teil beim Training P2PaLA-Modelle. Bei unseren Mixed Layouts musste die Standard LA [&hellip;]<\/p>\n","protected":false},"author":4,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[6,9],"tags":[],"class_list":["post-1114","post","type-post","status-publish","format-standard","hentry","category-transkribus-in-practice","category-layout-analysis"],"translation":{"provider":"WPGlobus","version":"3.0.2","language":"de","enabled_languages":["gb","de"],"languages":{"gb":{"title":true,"content":true,"excerpt":false},"de":{"title":true,"content":true,"excerpt":false}}},"_links":{"self":[{"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/posts\/1114","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/users\/4"}],"replies":[{"embeddable":true,"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/comments?post=1114"}],"version-history":[{"count":13,"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/posts\/1114\/revisions"}],"predecessor-version":[{"id":1180,"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/posts\/1114\/revisions\/1180"}],"wp:attachment":[{"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/media?parent=1114"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/categories?post=1114"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/tags?post=1114"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}