{"id":840,"date":"2019-12-21T08:00:13","date_gmt":"2019-12-21T07:00:13","guid":{"rendered":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/?p=840"},"modified":"2019-11-11T15:02:29","modified_gmt":"2019-11-11T14:02:29","slug":"dictionaries","status":"publish","type":"post","link":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/dictionaries\/","title":{"rendered":"W\u00f6rterb\u00fccher"},"content":{"rendered":"<p><span style=\"color: #0071a1;\"><em>Release 1.7.1<\/em><\/span><\/p>\n<p>HTR ben\u00f6tigt keine W\u00f6rterb\u00fccher. Dennoch gibt es sie auch hier und sie k\u00f6nnen wahlweise zugeschaltet werden, wenn man eine Volltexterkennung durchf\u00fchrt.<\/p>\n<p>Bei jedem HTR-Training, kann aus dem GT im Trainingsset ein W\u00f6rterbuch generiert werden, in dem auch die H\u00e4ufigkeit, mit der ein Wort vorkam, hinterlegt ist. Es ist also m\u00f6glich, ein passendes W\u00f6rterbuch f\u00fcr jedes Modell bzw. f\u00fcr die Textart mit der man arbeitet zu erzeugen.<\/p>\n<p>Insgesamt werden W\u00f6rterb\u00fccher in Transkribus aber selten benutzt. In unserem Projekt werden sie nur zu Beginn der Arbeit an neuen Modellen eingesetzt. So lange das Modell, das verbessert werden soll noch eine <a href=\"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/?p=843&amp;preview=true\">CER<\/a> von mehr als 8% aufweist, ist n\u00e4mlich das Korrigieren der von der HTR erkannten Texte sehr aufwendig. Setzt man an dieser Stelle ein W\u00f6rterbuch ein, l\u00e4sst sich die CER manchmal bis auf 5% senken. Hat das Modell bereits eine CER unter 8%, ist der Einsatz von W\u00f6rterb\u00fcchern kontraproduktiv, weil sich das Leseergebnis dann h\u00e4ufig wieder verschlechtert. Die HTR ersetzt dann manchmal \u201ewider besseres Wissen\u201c ihr eigenes Leseergebnis gegen eine Empfehlung, die sich aus dem W\u00f6rterbuch ergibt.<\/p>\n<p>Wir setzen W\u00f6rterb\u00fccher nur zur Unterst\u00fctzung von sehr schwachen Modellen ein. Und wir tun das auch eher, um den Transcriber bei besonders schwierigen Schriften eine Hilfestellung zu geben. So haben wir ein W\u00f6rterbuch bei der Erstellung des GT f\u00fcr die wirklich kaum lesbaren Konzeptschriften eingesetzt. Die Ergebnisse mussten nat\u00fcrlich in jedem Fall korrigiert werden. Aber die \u201eLeseempfehlungen\u201c die aufgrund der HTR mit W\u00f6rterbuch entstanden, waren eine gute Hilfe. Sobald unser Modell in der Lage war, auch Konzeptschriften mit unter 8% CER zu erkennen, haben wir auf den Einsatz des W\u00f6rterbuches verzichtet.<\/p>\n<p><a href=\"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2019\/09\/dictionary.jpg\" target=\"_blank\" rel=\"noopener\"><img loading=\"lazy\" decoding=\"async\" class=\"alignnone wp-image-895\" src=\"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2019\/09\/dictionary-300x158.jpg\" alt=\"\" width=\"600\" height=\"315\" srcset=\"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2019\/09\/dictionary-300x158.jpg 300w, https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2019\/09\/dictionary-768x404.jpg 768w, https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2019\/09\/dictionary-1024x538.jpg 1024w, https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2019\/09\/dictionary.jpg 1058w\" sizes=\"auto, (max-width: 600px) 100vw, 600px\" \/><\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Release 1.7.1 HTR ben\u00f6tigt keine W\u00f6rterb\u00fccher. Dennoch gibt es sie auch hier und sie k\u00f6nnen wahlweise zugeschaltet werden, wenn man eine Volltexterkennung durchf\u00fchrt. Bei jedem HTR-Training, kann aus dem GT im Trainingsset ein W\u00f6rterbuch generiert werden, in dem auch die H\u00e4ufigkeit, mit der ein Wort vorkam, hinterlegt ist. Es ist also m\u00f6glich, ein passendes W\u00f6rterbuch [&hellip;]<\/p>\n","protected":false},"author":5,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[6,10],"tags":[],"class_list":["post-840","post","type-post","status-publish","format-standard","hentry","category-transkribus-in-practice","category-wege-zum-htr-modell"],"translation":{"provider":"WPGlobus","version":"3.0.2","language":"de","enabled_languages":["gb","de"],"languages":{"gb":{"title":true,"content":true,"excerpt":false},"de":{"title":true,"content":true,"excerpt":false}}},"_links":{"self":[{"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/posts\/840","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/users\/5"}],"replies":[{"embeddable":true,"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/comments?post=840"}],"version-history":[{"count":9,"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/posts\/840\/revisions"}],"predecessor-version":[{"id":910,"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/posts\/840\/revisions\/910"}],"wp:attachment":[{"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/media?parent=840"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/categories?post=840"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/tags?post=840"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}