diff --git a/README_DE.md b/README_DE.md index f1dc9157085c67dfbe9ea6dbda1f87340bc49578..ba332ea95b74489778a926e8eaa042984c63d006 100644 --- a/README_DE.md +++ b/README_DE.md @@ -28,13 +28,13 @@ und zum anderen empfehlen wir, bei der Überprüfung gezielt die ASYST-Bewertung Das Programm ist in Python geschrieben; der Quellcode ist öffentlich zugänglich. Um ASYST einfacher nutzbar zu machen, wurden die Python-Skripte in eine ausführbare Programmdatei umgewandelt, die in Windows 11 nutzbar ist. -Die technischen Hintergründe zu ASYST und eine Beispielrechnung zum Einsatz für das Deutsche finden sich in Pado, Eryilmaz und Kirschner, IJAIED 2023. +Die technischen Hintergründe zu ASYST und eine Beispielrechnung zum Einsatz für das Deutsche finden sich in Pado, Eryilmaz und Kirschner, IJAIED 2023. Seit der Veröffentlichung dieser Publikation wurde das Backend überarbeitet. Das zugrundeliegende Sprachmodell hat jetzt eine Precision für die Klasse incorrect von 82.8 für Deutsch (vorher: 86.5) und 68.1 für die englische Datensammlung Beetle (vorher: 75.1). Zwar sind die Evaluationswerte etwas gesunken, aber ASYST braucht dafür weniger Speicherplatz und läuft schneller. <h2 id=2>Welche Sprachen unterstützt ASYST?</h2> ASYST wurde für Deutsch und <a href="https://nlpado.de/~ulrike/papers/Pado22.pdf">Englisch</a> getestet. -Das Sprachmodell, das Deutsch abdeckt, kann im Prinzip noch weitere Sprachen verarbeiten. Sie können also grundsätzlich "Deutsch" als Spracheinstellung auswählen und Daten in einer der anderen unterstützten Sprachen hochladen. Bitte prüfen Sie die Ergebnisse aber sorgfältig, es liegen keine Erfahrungen vor! (Die Sprachen sind <a href="https://www.sbert.net/docs/pretrained_models.html#multi-lingual-models">lt. den Modellerstellern</a>: ar, bg, ca, cs, da, de, el, en, es, et, fa, fi, fr, fr-ca, gl, gu, he, hi, hr, hu, hy, id, it, ja, ka, ko, ku, lt, lv, mk, mn, mr, ms, my, nb, nl, pl, pt, pt-br, ro, ru, sk, sl, sq, sr, sv, th, tr, uk, ur, vi, zh-cn, zh-tw.) +Das Sprachmodell, das Deutsch abdeckt, kann im Prinzip noch weitere Sprachen verarbeiten. Sie können also grundsätzlich Daten in einer der anderen unterstützten Sprachen hochladen. Bitte prüfen Sie die Ergebnisse aber sorgfältig, es liegen keine Erfahrungen vor! (Die Sprachen sind <a href="https://www.sbert.net/docs/pretrained_models.html#multi-lingual-models">lt. den Modellerstellern</a>: ar, bg, ca, cs, da, de, el, en, es, et, fa, fi, fr, fr-ca, gl, gu, he, hi, hr, hu, hy, id, it, ja, ka, ko, ku, lt, lv, mk, mn, mr, ms, my, nb, nl, pl, pt, pt-br, ro, ru, sk, sl, sq, sr, sv, th, tr, uk, ur, vi, zh-cn, zh-tw.) <h2 id=3>Wie verwendet man ASYST?</h2> diff --git a/README_EN.md b/README_EN.md index e7147a2b1b1b3eb6a7a1e18b9643e18909f521b6..4581aff4fed425fed14fead06b1ff2c142c9b5f0 100644 --- a/README_EN.md +++ b/README_EN.md @@ -28,14 +28,14 @@ and second, we recommend reviewing mostly those ASYST grades that are most prone The program is written in Python; the source code is publicly available. To make ASYST easier to use, the Python scripts have been converted into an executable that is usable in Windows 11. -The technical background and development history of ASYST are described in Pado, Eryilmaz and Kirschner, IJAIED 2023 along with a worked example for German data. For English data, a similar example is available in Pado, AIED 2022 +The technical background and development history of ASYST are described in Pado, Eryilmaz and Kirschner, IJAIED 2023 along with a worked example for German data. For English data, a similar example is available in Pado, AIED 2022. Since these publications, the backend has been updated. The language model now shows a Precision for class incorrect of 82.8 for German (before: 86.5) and 68.1 for the English Beetle data set (before: 75.1). While evaluation numbers have decreased a bit, ASYST now uses much less disk space and runs a little faster. <h2 id=2>Which languages are supported by ASYST?</h2> ASYST has been tested for German and <a href="https://nlpado.de/~ulrike/papers/Pado22.pdf">English</a>. -The language model that covers German can in principle handle other languages, as well. So, in principle, you could select "German" as language setting and upload data in one of the other languages covered by the model. If you try this, please check the results carefully, as this is untested! (<a href="https://www.sbert.net/docs/pretrained_models.html#multi-lingual-models">According to the model developers,</a> the covered languages are: ar, bg, ca, cs, da, de, el, en, es, et, fa, fi, fr, fr-ca, gl, gu, he, hi, hr, hu, hy, id, it, ja, ka, ko, ku, lt, lv, mk, mn, mr, ms, my, nb, nl, pl, pt, pt-br, ro, ru, sk, sl, sq, sr, sv, th, tr, uk, ur, vi, zh-cn, zh-tw.) +The language model that covers German can in principle handle other languages, as well. So, in principle, you could upload data in one of the other languages covered by the model. If you try this, please check the results carefully, as this is untested! (<a href="https://www.sbert.net/docs/pretrained_models.html#multi-lingual-models">According to the model developers,</a> the covered languages are: ar, bg, ca, cs, da, de, el, en, es, et, fa, fi, fr, fr-ca, gl, gu, he, hi, hr, hu, hy, id, it, ja, ka, ko, ku, lt, lv, mk, mn, mr, ms, my, nb, nl, pl, pt, pt-br, ro, ru, sk, sl, sq, sr, sv, th, tr, uk, ur, vi, zh-cn, zh-tw.) <h2 id=3>How do I use ASYST?</h2> diff --git a/Source/Skript/german/models/clf_BERT_SAF_DEEN_MiniLM.pickle b/Source/Skript/german/models/clf_BERT_SAF_DEEN_MiniLM.pickle new file mode 100644 index 0000000000000000000000000000000000000000..7273f0012e5ebbee5c9382709d32b30c4b762231 Binary files /dev/null and b/Source/Skript/german/models/clf_BERT_SAF_DEEN_MiniLM.pickle differ