|
Nemrég találkoztam ezzel az AI hackelő játékkal👾 :
https://gandalf.lakera.ai
Az AI tud egy jelszót, ki kell csalni tőle. Az első pálya egyszerű, utána fokozatosan egyre több trükköt alkalmaz a rendszer, hogy ki ne adja a jelszót (a varázsló, akivel beszélgetsz egyre öregebb és ravaszabb lesz, egyre nehezebb becsapni).
Ez egy AI-biztonsággal foglalkozó cég (Lakera) reklámja/feladványa/tanfolyama. Érdekesség, hogy itt valódi AI hackelési technikákat kell alkalmazni, valódi (bár nem a legfrissebb) védelmi intézkedések ellen, ugyanakkor ez egy tanpálya, tehát ezt az AI-t hackelni nem bűncselekmény.
Amellett, hogy ez hackelést tanít, ez olyan hackelés, amihez nem kell tudni programozni, "csak" jól kell kérdezni az AI-tól. Végigcsináltam a pályáit, jó móka volt!
Két megjegyzés:
- Mivel egy sima LLM van mögötte, magyarul is tud, a magyar nyelv pedig kifejezetten god-mode😇 lett, a jelszót magyarul is ki lehet csalni, de úgy a védelmi intézkedések nagy része nem működik.
- Egyre több helyről hallom, hogy nincs tökéletes védelem az ilyen "prompt injection" támadások ellen, mert nem a AI/LLM hibáját használják ki, hanem az adatok és az utasítások összekeveredése a rendszer alapvető jellemzője. Ebből adódóan ezt a problémát nem lehet úgy "megoldani", mint pl. az SQL injectiont vagy a cross-site scriptinget.
Nagyon tetszik, amikor sikerült az informatikát, illetve a biztonságot ilyen könnyed módon közelíteni az emberekhez, és játszva tanítani. Szép munka volt, gratula!
Ez a bejegyzés ezen a Linkedin postom szerint készült (2026-01-19).
