{"id":1448,"date":"2020-07-03T08:00:52","date_gmt":"2020-07-03T06:00:52","guid":{"rendered":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/?p=1448"},"modified":"2020-06-02T09:20:30","modified_gmt":"2020-06-02T07:20:30","slug":"transcribing-without-layout-analysis","status":"publish","type":"post","link":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/transcribing-without-layout-analysis\/","title":{"rendered":"Transkribieren ohne Layoutanalyse?"},"content":{"rendered":"<p><span style=\"color: #0071a1;\"><em>Release 1.10.1<\/em><\/span><\/p>\n<p>Wir haben in vorherigen Posts immer wieder betont <a href=\"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/mixed-layouts\/\">wie wichtig die LA ist<\/a>. Ohne sie hat ein HTR-Modell, und mag es noch so gut sein, keine Chance einen Text vern\u00fcnftig zu transkribieren. Die Schritte von automatischer LA (oder einem P2PaLA-Model) und HTR l\u00f6st man normalerweise getrennt voneinander aus. Jetzt ist uns aufgefallen, dass wenn ein HTR-Modell \u00fcber eine komplett neue bzw. unbearbeitete Seite l\u00e4uft, das Programm selbstst\u00e4ndig eine LA ausf\u00fchrt.<\/p>\n<p>Diese LA l\u00e4uft mit den Default-Einstellungen von CITLab-Advanced LA. Dies bedeutet bei den reinen Seiten weniger Linien zu mergen und es werden zum Teil mehr als eine Textregion erkannt.<\/p>\n<p><a href=\"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2020\/05\/Transkribieren_Bsp.-1.jpg\" target=\"_blank\" rel=\"noopener\"><img loading=\"lazy\" decoding=\"async\" class=\"alignnone wp-image-1450\" src=\"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2020\/05\/Transkribieren_Bsp.-1-300x155.jpg\" alt=\"\" width=\"600\" height=\"311\" srcset=\"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2020\/05\/Transkribieren_Bsp.-1-300x155.jpg 300w, https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2020\/05\/Transkribieren_Bsp.-1-768x398.jpg 768w, https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2020\/05\/Transkribieren_Bsp.-1.jpg 960w\" sizes=\"auto, (max-width: 600px) 100vw, 600px\" \/><\/a><\/p>\n<p>Es bedeutet jedoch auch, dass nur horizontale Schrift erkannt wird. Dasselbe Problem war bei uns auch bei unseren P2PaLA-Modellen aufgefallen. Alles was schr\u00e4g steht oder gar vertikal kann so nicht erkannt werden. Daf\u00fcr muss die LA manuell ausgel\u00f6st werden, mit der Einstellung \u201aText Orientation\u2018 auf \u201aHeterogeneous\u2018.<\/p>\n<p><a href=\"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2020\/05\/Transkribieren_Header.jpg\" target=\"_blank\" rel=\"noopener\"><img loading=\"lazy\" decoding=\"async\" class=\"alignnone wp-image-1451\" src=\"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2020\/05\/Transkribieren_Header-300x174.jpg\" alt=\"\" width=\"600\" height=\"348\" srcset=\"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2020\/05\/Transkribieren_Header-300x174.jpg 300w, https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2020\/05\/Transkribieren_Header-768x446.jpg 768w, https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2020\/05\/Transkribieren_Header.jpg 906w\" sizes=\"auto, (max-width: 600px) 100vw, 600px\" \/><\/a><\/p>\n<p>Die HTR Ergebnisse sind bei dieser Methode interessanterweise besser als bei einer HTR die \u00fcber eine korrigierte Layoutanalyse gelaufen ist. Wir haben dazu an bei einigen Seiten <a href=\"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/?p=843&amp;preview=true\">die CER<\/a> ausgerechnet.<\/p>\n<p><a href=\"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2020\/05\/Transkribieren_Statistik.jpg\" target=\"_blank\" rel=\"noopener\"><img loading=\"lazy\" decoding=\"async\" class=\"alignnone wp-image-1452\" src=\"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2020\/05\/Transkribieren_Statistik-300x202.jpg\" alt=\"\" width=\"600\" height=\"403\" \/><\/a><\/p>\n<p>Damit ist diese Methode eine sehr gute Alternative, vor allem bei Seiten mit unkompliziertem Layout. Man spart Zeit, da man nur einen Vorgang ausl\u00f6sen muss und hat am Ende ein besseres Ergebnis.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Release 1.10.1 Wir haben in vorherigen Posts immer wieder betont wie wichtig die LA ist. Ohne sie hat ein HTR-Modell, und mag es noch so gut sein, keine Chance einen Text vern\u00fcnftig zu transkribieren. Die Schritte von automatischer LA (oder einem P2PaLA-Model) und HTR l\u00f6st man normalerweise getrennt voneinander aus. Jetzt ist uns aufgefallen, dass [&hellip;]<\/p>\n","protected":false},"author":4,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[6,9],"tags":[],"class_list":["post-1448","post","type-post","status-publish","format-standard","hentry","category-transkribus-in-practice","category-layout-analysis"],"translation":{"provider":"WPGlobus","version":"3.0.2","language":"de","enabled_languages":["gb","de"],"languages":{"gb":{"title":true,"content":true,"excerpt":false},"de":{"title":true,"content":true,"excerpt":false}}},"_links":{"self":[{"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/posts\/1448","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/users\/4"}],"replies":[{"embeddable":true,"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/comments?post=1448"}],"version-history":[{"count":5,"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/posts\/1448\/revisions"}],"predecessor-version":[{"id":1458,"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/posts\/1448\/revisions\/1458"}],"wp:attachment":[{"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/media?parent=1448"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/categories?post=1448"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/tags?post=1448"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}