{"id":1589,"date":"2020-12-18T08:00:40","date_gmt":"2020-12-18T07:00:40","guid":{"rendered":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/?p=1589"},"modified":"2020-11-28T15:21:48","modified_gmt":"2020-11-28T14:21:48","slug":"htr-versus-pylaia","status":"publish","type":"post","link":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/htr-versus-pylaia\/","title":{"rendered":"HTR+ oder Pylaia"},"content":{"rendered":"<p><span style=\"color: #0071a1;\"><em>Version 1.12.0<\/em><\/span><\/p>\n<p><a name=\"_GoBack\"><\/a>Wie ihr sicher schon gesehen habt, gibt es seit dem vergangenen Sommer neben HTR+ eine <a href=\"https:\/\/readcoop.eu\/try-out-transkribus-new-recognition-software-pylaia\/\">zweite Technologie<\/a> f\u00fcr die Handschriftentexterkennung in Transkribus verf\u00fcgbar \u2013 <a href=\"http:\/\/www.jpuigcerver.net\/projects\/\">PyLaia.<\/a><\/p>\n<p>Wir haben in den vergangenen Wochen mit PyLaia-Modellen experimentiert und m\u00f6chten hier einige erste Erfahrungen und Eindr\u00fccke zu den Unterschieden von HTR+ und PyLaia dokumentieren. Hei\u00dft <a href=\"https:\/\/readcoop.eu\/transkribus\/credits\/\">billiger<\/a> auch schlechter? \u2013 Definitiv nein! Hinsichtlich der Accuracy Rate kann PyLaia es ohne weiteres mit HTR+ aufnehmen. Es ist oft sogar etwas besser. Die folgende Grafik vergleicht ein HTR+ und ein PyLaia-Modell, die mit identischem Ground Truth (ca. 600.000 W\u00f6rter) unter denselben Voraussetzungen (from the scratch) trainiert wurden. Verglichen wird die Perfomance mit und ohne <a href=\"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/?p=1297&amp;preview=true\">Language Model<\/a>.<\/p>\n<p><span style=\"color: #ff0000;\"><a href=\"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2020\/11\/1_HTR-vs.-PyLaia_vergleich.jpg\" target=\"_blank\" rel=\"noopener\"><img loading=\"lazy\" decoding=\"async\" class=\"alignnone wp-image-1591\" src=\"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2020\/11\/1_HTR-vs.-PyLaia_vergleich-300x272.jpg\" alt=\"\" width=\"600\" height=\"545\" srcset=\"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2020\/11\/1_HTR-vs.-PyLaia_vergleich-300x272.jpg 300w, https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2020\/11\/1_HTR-vs.-PyLaia_vergleich-727x660.jpg 727w\" sizes=\"auto, (max-width: 600px) 100vw, 600px\" \/><\/a><\/span><\/p>\n<p>Der vielleicht auff\u00e4lligste Unterschied ist, dass die Ergebnisse von PyLaia-Modellen sich mit dem Einsatz eines Language Models nicht ganz so stark verbessern lassen, wie das bei HTR+ der Fall ist. Das ist nicht unbedingt ein Nachteil, sondern spricht eigentlich eher f\u00fcr eine hohe Grundverl\u00e4sslichkeit dieser Modelle. Anders ausgedr\u00fcckt: PyLaia braucht nicht unbedingt ein Language Model um sehr gute Ergebnisse zu erzielen.<\/p>\n<p>Es gibt auch ein Gebiet, auf dem PyLaia schlechter abschneidet, als HTR+. PyLaia hat gr\u00f6\u00dfere Schwierigkeiten \u201egebogene\u201c Zeilen korrekt zu lesen. Bei senkrechten Textzeilen ist das Ergebnis sogar noch schlechter.<\/p>\n<p>Im Training ist PyLaia etwas langsamer als HTR+, das hei\u00dft, das Training dauert l\u00e4nger. Auf der anderen Seite ist PyLaia sehr viel schneller im \u201eAntritt\u201c. Es ben\u00f6tigt verh\u00e4ltnism\u00e4\u00dfig wenige Trainingsdurchg\u00e4nge, um gute Ergebnisse zu erzielen. In den beiden Lernkurven kann man das recht gut erkennen.<\/p>\n<p><span style=\"color: #ff0000;\"><a href=\"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2020\/11\/1_HTR-vs.-PyLaia_lernkurven.jpg\" target=\"_blank\" rel=\"noopener\"><img loading=\"lazy\" decoding=\"async\" class=\"alignnone wp-image-1590\" src=\"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/wp-content\/uploads\/2020\/11\/1_HTR-vs.-PyLaia_lernkurven-300x226.jpg\" alt=\"\" width=\"600\" height=\"452\" \/><\/a><\/span><\/p>\n<p>Unsere Beobachtungen sind nat\u00fcrlich nicht ersch\u00f6pfend. Sie beziehen sich bisher nur auf <a href=\"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/?p=1315&amp;preview=true\">generische Modelle<\/a>, die mit einem hohen Einsatz von Ground Truth trainiert wurden. Wir haben insgesamt den Eindruck, das PyLaia bei solchen gro\u00dfen generischen Modellen seine Vorz\u00fcge voll ausspielen kann.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Version 1.12.0 Wie ihr sicher schon gesehen habt, gibt es seit dem vergangenen Sommer neben HTR+ eine zweite Technologie f\u00fcr die Handschriftentexterkennung in Transkribus verf\u00fcgbar \u2013 PyLaia. Wir haben in den vergangenen Wochen mit PyLaia-Modellen experimentiert und m\u00f6chten hier einige erste Erfahrungen und Eindr\u00fccke zu den Unterschieden von HTR+ und PyLaia dokumentieren. Hei\u00dft billiger auch [&hellip;]<\/p>\n","protected":false},"author":5,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[6,10],"tags":[],"class_list":["post-1589","post","type-post","status-publish","format-standard","hentry","category-transkribus-in-practice","category-wege-zum-htr-modell"],"translation":{"provider":"WPGlobus","version":"3.0.2","language":"de","enabled_languages":["gb","de"],"languages":{"gb":{"title":true,"content":true,"excerpt":false},"de":{"title":true,"content":true,"excerpt":false}}},"_links":{"self":[{"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/posts\/1589","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/users\/5"}],"replies":[{"embeddable":true,"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/comments?post=1589"}],"version-history":[{"count":3,"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/posts\/1589\/revisions"}],"predecessor-version":[{"id":1594,"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/posts\/1589\/revisions\/1594"}],"wp:attachment":[{"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/media?parent=1589"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/categories?post=1589"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/rechtsprechung-im-ostseeraum.archiv.uni-greifswald.de\/de\/wp-json\/wp\/v2\/tags?post=1589"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}