Lelepleződhetnek a csalók: magyar nyelven is működő MI-szövegfelismerőt fejlesztett egy egyetemi hallgató

  • MTI

Magyar nyelven is működő MI-szövegfelismerőt fejlesztett Kiss Mihály, a Szegedi Tudományegyetem (SZTE) programtervező informatikus mesterszakos hallgatója. A megoldás – a tesztek alapján – kiemelkedően pontosan képes megkülönböztetni az ember által írt és a nagy nyelvi modellek által generált szövegeket – tájékoztatott a felsőoktatási intézmény közkapcsolati igazgatósága.

A közlemény szerint a fejlesztés ötlete 2023 közepén született, amikor a ChatGPT és más nagy nyelvi modellek látványosan megjelentek a köztudatban. A jelenséget Kiss Mihály témavezetője vetette fel szakdolgozati kutatásként, de hamar kiderült: nem kizárólag elméleti kérdésről van szó.

Egyre többen használják ezeket az eszközöket, ami hosszú távon biztosan problémát jelent majd az oktatásban és más területeken. A felismerő modellek működését az teszi lehetővé, hogy a nagy nyelvi modellek lábnyomokat hagynak maguk után, nem adaptálódtak teljesen az emberi íráshoz. Korábban azért nem létezett minőségi MI-detektor magyar nyelvre, mert nem volt hozzá megfelelő adat. Míg angol nyelven hatalmas, jól tisztított tanító adatbázisok állnak rendelkezésre, magyar szövegekből ilyen korábban nem létezett – olvasható a közleményben.

Kiss Mihály ezért több mint 350 ezer szövegből álló adathalmazt hozott létre: irodalmi művekből, szakdolgozatokból, cikkekből, fórumokról, közösségi médiából és általános internetes forrásokból. A cél az volt, hogy a rendszer valódi, sokféle nyelvhasználattal találkozzon, ne csak "tankönyvi" példákkal.

Noha a felismerés is MI-alapú megoldásra épül, az architektúrája alapján nem tartalmat generál, hanem döntéseket hoz. A megoldás egy encoder alapú modellt használ, amely kifejezetten osztályozási feladatokban erős, hasonlóan ahhoz, ahogyan egy spamszűrő működik. A program megbecsüli, hogy mekkora eséllyel készült mesterséges intelligenciával az adott szöveg.

Kiss Mihály szövegfelismerőjének teljesítményét ezer különböző magyar nyelvű szövegen vetette össze olyan detektorokkal, amelyek állításuk szerint támogatják a magyar nyelvet. Az eredmények alapján modellje 0,98 pontossággal dolgozik, míg a többi eszköz 0,6 körüli pontossággal bír. Különösen fontos a nagyon alacsony falspozitív arány: a rendszer ritkán mondja emberi szövegre, hogy mesterséges intelligencia írta, ami az oktatásban kulcskérdés, hiszen veszélyes lenne azzal gyanúsítani egy hallgatót, hogy beadandóját az MI írta, miközben ez nem igaz.

Kiss Mihály, SZTE, MI, mesterséges intelligencia, csalás, fake news, jogszabály
A képen Kiss Mihály, a program fejlesztője – A program jogi területen is nagyon hasznos lehet, ahol egy MI által generált, pontatlan szöveg komoly kockázatot jelenthet, de HR-részlegeket is segítheti
Forrás: SZTE

Bár az elsődleges felhasználók az oktatás szereplői lehetnek, nemcsak egyetemi környezetben lehet hasznos az eszköz: a médiában, szerkesztőségekben, könyvkiadóknál is használhatják, például minőségellenőrzési céllal. Ha felmerül a mesterséges intelligencia használatának gyanúja, akkor egyfajta fake news detektorként is használható, mivel a nagy nyelvi modellek sokszor "hallucinálnak" hamis információkat. Használhatják jogi területen, ahol egy MI által generált, pontatlan szöveg komoly kockázatot jelenthet, de hasznos lehet HR-részlegek számára is az MI-eszközzel írt jelentkezések kiszűrésére.

Kiss Mihály munkáját az SZTE hallgatói innovációs díjjal ismerte el.

Az eszközt bárki használhatja, napi három detektálás ingyenes, akár egy Facebook-poszt szövege is kielemezhető egy pillanat alatt – áll a közleményben.

Hozzon ki többet az Adózónából!
Előfizetőink és 14 napos próba-előfizetőink teljes terjedelmükben olvashatják cikkeinket, emellett többek között elérik a Kérdések és Válaszok archívum valamennyi válaszát, és kérdezhetnek szakértőinktől is.

Hozzászólások (0)

Új hozzászólás

Kérjük, hogy szakértőinknek szóló kérdését ne kommentben tegye fel! Használja helyette a kérdés-válasz funkciót, kérdésében hivatkozzon az érintett írásra, lehetőleg annak URL-jét is megadva. A választ csak így tudjuk garantálni. Köszönjük!
Az Adózóna moderálási alapelveit ITT találja.




További hasznos adózási információk

NE HAGYJA KI!
Ezért érdemes előfizetni!
PODCAST

Kérdések és válaszok

SZÉP-kártya juttatás

Surányi Imréné

okleveles közgazda

Tiszteletdíj adózása nyugdíjas esetén

Széles Imre

tb-szakértő

Bértámogatás és szochokedvezmény

Széles Imre

tb-szakértő

Szakértőink

Szakmai kérdésekre professzionális válaszok képzett szakértőinktől

2026 január
H K Sze Cs P Sz V
29 30 31 1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31 1

Együttműködő partnereink