{"id":560,"date":"2019-09-12T08:00:49","date_gmt":"2019-09-12T06:00:49","guid":{"rendered":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/?p=560"},"modified":"2019-09-10T15:46:53","modified_gmt":"2019-09-10T13:46:53","slug":"baselines","status":"publish","type":"post","link":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/baselines\/","title":{"rendered":"Baselines"},"content":{"rendered":"<p><span style=\"color: #0071a1;\"><em>Release 1.7.1<\/em><\/span><\/p>\r\n<p>Die Baseline ist die Grundlinie der Schriftzeile und bildet den wichtigsten Bezugspunkt f\u00fcr die Texterkennung. Heute wird die Segmentierung eines Textes in Zeilen in den meisten F\u00e4llen automatisch mit Hilfe der CITlab Advanced LA ausgef\u00fchrt werden. Es gibt aber immer wieder F\u00e4lle, wo ihr euch entweder sofort f\u00fcr das manuelle Ziehen der Baselines entscheiden werdet oder zumindest manuelle Korrekturen ausf\u00fchren m\u00f6chtet. Dazu ein paar praktische Tipps:<\/p>\r\n<p>Die Baseline sollte immer m\u00f6glichst genau unter dem \u201eMittelband\u201c der Zeile stehen, das hei\u00dft dort, wo \u201ea\u201c \u201eo\u201c \u201em\u201c \u201ev\u201c etc. den Boden ber\u00fchren. Falls man die Baseline manuell hinzuf\u00fcgt (was mit wenig \u00dcbung sehr fix geht), sollte man sich niemals mehr als ein bis zwei Strichst\u00e4rken der Schrift von der Grundlinie entfernen (egal in welche Richtung). Die Baseline besteht aus einzelnen Punkten, die man beim manuellen hinzuf\u00fcgen selber setzt; abgeschlossen wird das setzen mit einem Doppelklick oder Enter auf den letzten Punkt. Baselines k\u00f6nnen auch vertikal gezogen werden. In einem Image und sogar einer Textregion k\u00f6nnen verschiedene Verlaufsrichtungen der Zeilen kombiniert werden (bspw. das typische \u201ePostkartenlayout\u201c).<\/p>\r\n<p><a href=\"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2019\/08\/baseline.jpg\" target=\"_blank\" rel=\"noopener noreferrer\"><img loading=\"lazy\" decoding=\"async\" class=\"alignnone wp-image-582\" src=\"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2019\/08\/baseline-300x94.jpg\" alt=\"\" width=\"600\" height=\"187\" srcset=\"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2019\/08\/baseline-300x94.jpg 300w, https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2019\/08\/baseline.jpg 529w\" sizes=\"auto, (max-width: 600px) 100vw, 600px\" \/><\/a><\/p>\r\n<p>Probleme bei der automatischen Line Detection treten immer dann geh\u00e4uft auf, wenn entweder die Wortabst\u00e4nde stark variieren oder besonders gro\u00df werden oder wenn die Zeilenf\u00fchrung abrupt ge\u00e4ndert wird. In solchen F\u00e4llen kann es dazu kommen, dass die Baseline einer Zeile in Teilabschnitte zergliedert wird, die einzelne Wort umfassen. F\u00fcr die Texterkennung und damit auch f\u00fcr die sp\u00e4tere Volltextsuche hat das keine Konsequenzen, weil ja nach wie vor der gesamte Text erfasst werden kann. Wer allerdings Wert auf ein perfektes Layout seines Volltextes legt, das den Zeilenfall der Vorlage wiedergibt, der muss hier korrigieren. Die Korrektur der Zeilen ist nicht immer notwendig, es muss allerdings auf die <a href=\"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/?p=596&amp;preview=true\" target=\"_blank\" rel=\"noopener noreferrer\">Reading Order<\/a> geachtet werden, da sonst im sp\u00e4teren Transkript Unklarheiten entstehen k\u00f6nnen. Solche \u201ezerrissenen\u201c Zeilen lassen sich am schnellsten mit dem <a href=\"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/?p=592&amp;preview=true\" target=\"_blank\" rel=\"noopener noreferrer\">Merge-Tool<\/a> wieder zusammenf\u00fchren.<\/p>\r\n<p>&nbsp;<\/p>\r\n\r\n<p class=\"has-background wp-block-paragraph\" style=\"background-color: #f4e3a5;\"><strong> Tipps &amp; Tools<\/strong><br \/>Was wenn der Text Kopf steht?<br \/>Die CITlab Advanced LA kann die Baseline einer kopfstehenden Zeile nicht korrekt erfassen. Baselines funktionieren immer in Leserichtung. Will man kopfstehende Zeilen erkennen lassen oder manuell festlegen, muss man entweder das Image drehen oder bei der Kopfstehenden Zeile die Baseline am oberen Bereich des Mittelbandes (gegen die Leserichtung) von rechts nach links ziehen. In beiden F\u00e4llen wird Transkribus das Image bei der Transkription in die lesef\u00e4hige Richtung drehen.<\/p>\r\n\r\n\r\n\r\n<figure class=\"wp-block-image\"><a href=\"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2019\/08\/3_3-baselines_final.jpg\" target=\"_blank\" rel=\"noreferrer noopener\"><img loading=\"lazy\" decoding=\"async\" width=\"925\" height=\"661\" class=\"wp-image-583\" src=\"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2019\/08\/3_3-baselines_final.jpg\" alt=\"\" srcset=\"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2019\/08\/3_3-baselines_final-300x214.jpg 300w, https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2019\/08\/3_3-baselines_final-768x549.jpg 768w, https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2019\/08\/3_3-baselines_final-924x660.jpg 924w\" sizes=\"auto, (max-width: 925px) 100vw, 925px\" \/><\/a><\/figure>\r\n","protected":false},"excerpt":{"rendered":"<p>Release 1.7.1 Die Baseline ist die Grundlinie der Schriftzeile und bildet den wichtigsten Bezugspunkt f\u00fcr die Texterkennung. Heute wird die Segmentierung eines Textes in Zeilen in den meisten F\u00e4llen automatisch mit Hilfe der CITlab Advanced LA ausgef\u00fchrt werden. Es gibt aber immer wieder F\u00e4lle, wo ihr euch entweder sofort f\u00fcr das manuelle Ziehen der Baselines [&hellip;]<\/p>\n","protected":false},"author":4,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[6,9],"tags":[],"class_list":["post-560","post","type-post","status-publish","format-standard","hentry","category-transkribus-in-practice","category-layout-analysis"],"translation":{"provider":"WPGlobus","version":"3.0.2","language":"de","enabled_languages":["gb","de"],"languages":{"gb":{"title":true,"content":true,"excerpt":false},"de":{"title":true,"content":true,"excerpt":false}}},"_links":{"self":[{"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/posts\/560","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/users\/4"}],"replies":[{"embeddable":true,"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/comments?post=560"}],"version-history":[{"count":9,"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/posts\/560\/revisions"}],"predecessor-version":[{"id":738,"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/posts\/560\/revisions\/738"}],"wp:attachment":[{"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/media?parent=560"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/categories?post=560"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/tags?post=560"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}