{"id":1297,"date":"2020-04-14T12:42:03","date_gmt":"2020-04-14T10:42:03","guid":{"rendered":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/?p=1297"},"modified":"2020-04-14T15:18:30","modified_gmt":"2020-04-14T13:18:30","slug":"language-models","status":"publish","type":"post","link":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/language-models\/","title":{"rendered":"Language Models"},"content":{"rendered":"<p><span style=\"color: #0071a1;\"><em>Release 1.10.1<\/em><\/span><\/p>\r\n<p>Wir haben in einem fr\u00fcheren Beitrag \u00fcber die Verwendung von <a href=\"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/?p=840&amp;preview=true\">W\u00f6rterb\u00fcchern<\/a> gesprochen und dabei erw\u00e4hnt, dass \u2013 je besser ein HTR-Modell ist (CER besser als 7%) \u2013 der Nutzen eines W\u00f6rterbuches f\u00fcr das HTR-Ergebnis geringer wird.<\/p>\r\n<p>Anders ist das beim Einsatz von Language Models, die seit Dezember 2019 in Transkribus verf\u00fcgbar sind. Wie W\u00f6rterb\u00fccher werden auch Language Models bei jedem HTR-Training aus dem dort genutzten Ground Truth generiert. Anders als W\u00f6rterb\u00fccher zielen Language Models aber nicht auf die Identifizierung einzelner W\u00f6rter. Sie ermitteln stattdessen die Wahrscheinlichkeit f\u00fcr eine Wortfolge oder die regelm\u00e4\u00dfige Kombination von W\u00f6rtern und Ausdr\u00fccken in einem bestimmten Kontext.<\/p>\r\n<p>Anders als bei W\u00f6rterb\u00fcchern f\u00fchrt der Einsatz von Language Models immer zu wesentlich besseren HTR-Ergebnissen. In unseren Tests verbesserte sich die durchschnittliche CER im Vergleich zum HTR-Ergebnis ohne Language Model bis zu 1 % &#8211; und zwar durchweg, auf allen Testsets.<\/p>\r\n<p><a href=\"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2020\/04\/Statistik-language-models.jpg\" target=\"_blank\" rel=\"noopener noreferrer\"><img loading=\"lazy\" decoding=\"async\" class=\"alignnone wp-image-1298\" src=\"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2020\/04\/Statistik-language-models-300x115.jpg\" alt=\"\" width=\"600\" height=\"231\" srcset=\"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2020\/04\/Statistik-language-models-300x115.jpg 300w, https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2020\/04\/Statistik-language-models-1024x394.jpg 1024w, https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2020\/04\/Statistik-language-models-768x295.jpg 768w, https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2020\/04\/Statistik-language-models.jpg 1168w\" sizes=\"auto, (max-width: 600px) 100vw, 600px\" \/><\/a><\/p>\r\n\r\n<p class=\"has-background\" style=\"background-color: #f4e3a5;\">Tipps &amp; Tools: Das Language Model kann bei der Konfiguration der HTR ausgew\u00e4hlt werden. Anders als bei W\u00f6rterb\u00fcchern sind Language Models und HTR-Modell nicht frei kombinierbar. Es wird immer das zum HTR-Modell generierte Language Model genutzt.<\/p>\r\n\r\n\r\n\r\n<figure class=\"wp-block-image is-resized\"><a href=\"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2020\/04\/Screenshot-language-model.jpg\" target=\"_blank\" rel=\"noreferrer noopener\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-1299\" src=\"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2020\/04\/Screenshot-language-model-300x199.jpg\" alt=\"\" width=\"591\" height=\"392\" srcset=\"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2020\/04\/Screenshot-language-model-300x199.jpg 300w, https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2020\/04\/Screenshot-language-model-1024x680.jpg 1024w, https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2020\/04\/Screenshot-language-model-768x510.jpg 768w, https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2020\/04\/Screenshot-language-model-994x660.jpg 994w, https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2020\/04\/Screenshot-language-model.jpg 1188w\" sizes=\"auto, (max-width: 591px) 100vw, 591px\" \/><\/a><\/figure>\r\n","protected":false},"excerpt":{"rendered":"<p>Release 1.10.1 Wir haben in einem fr\u00fcheren Beitrag \u00fcber die Verwendung von W\u00f6rterb\u00fcchern gesprochen und dabei erw\u00e4hnt, dass \u2013 je besser ein HTR-Modell ist (CER besser als 7%) \u2013 der Nutzen eines W\u00f6rterbuches f\u00fcr das HTR-Ergebnis geringer wird. Anders ist das beim Einsatz von Language Models, die seit Dezember 2019 in Transkribus verf\u00fcgbar sind. Wie [&hellip;]<\/p>\n","protected":false},"author":5,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[6,10],"tags":[],"class_list":["post-1297","post","type-post","status-publish","format-standard","hentry","category-transkribus-in-practice","category-wege-zum-htr-modell"],"translation":{"provider":"WPGlobus","version":"3.0.2","language":"de","enabled_languages":["gb","de"],"languages":{"gb":{"title":true,"content":true,"excerpt":false},"de":{"title":true,"content":true,"excerpt":false}}},"_links":{"self":[{"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/posts\/1297","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/users\/5"}],"replies":[{"embeddable":true,"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/comments?post=1297"}],"version-history":[{"count":14,"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/posts\/1297\/revisions"}],"predecessor-version":[{"id":1336,"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/posts\/1297\/revisions\/1336"}],"wp:attachment":[{"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/media?parent=1297"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/categories?post=1297"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/tags?post=1297"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}