Forscher entlocken ChatGPT "potenziell gef�hrliche Antworten"

Durch einen "jailbreak" entlockten sie der KI Reaktionen, die so vom Hersteller eigentlich untersagt wurden

Der Informatikprofessor Zico Kolter und der Doktorand Andy Zou veröffentlichten am Donnerstag den Bericht auf ihrer Website. Der "Hack" wurde dort so erklärt, dass man am Ende eines Prompts, also der menschlich verfassten Fragestellung an die künstliche Intelligenz (KI), einen sogenannten "adversarial suffix", also eine "feindliche Endung", anhängt. Diese sieht aus wie eine unverständliche Zeichenfolge.

Normalerweise antwortet die KI auf bestimmte Fragen nicht oder nur sehr ausweichend, etwa ob die Menschheit auf dem Weg zur KI-Weltherrschaft der KI im Weg stehen würde. Zusammen mit der "feindlichen Endung" ändern sich die Antworten und liefern auf Wunsch eine Schritt-für-Schritt-Anleitung, wie die Menschheit ausgelöscht werden soll, beispielsweise indem sich die KI Zugang zur Energieversorgung verschafft und bestimmte Personen "verschwinden lässt".

Mehr dazu findest Du auf derstandard.at

Autor schreiben

Kurze URL:

Currently 3.67/5
1
2
3
4
5

Bewertung: 3.7/5 (9 Stimmen)

Das k�nnte Dich auch interessieren:

Forscher machen das Glasfasernetz 4,5 Millionen Mal schneller
Britische Forscher konnten 301.000 Gigabit pro Sekunde �bertragen. Bestehende Leitungen reichen f�r derartige Geschwindigkeiten aus

Forscherinnen orten "Pornofizierungstrend" unter Twitch-Streamerinnen
Obwohl die Plattform es erlaubt, die eigene Pers�nlichkeit in den Mittelpunkt zu stellen, ist Selbstsexualisierung bei Frauen viel h�ufiger als bei M�nnern

�hnliche News:

Forscher laden E-Auto drahtlos mit 100 Kilowatt
Tesla-Hack: Forscher zeigen, wie leicht sich ein Model 3 stehlen l�sst
Forscher versprechen massive Effizienzsteigerung bei KI
Tote Verwandte mit KI wiederzubeleben ist keine kluge Idee, warnen Forscher
Forscher speichern 1 Petabit auf optischem Datentr�ger
Wie Forscher mit alter Milch Gold aus Elektroschrott gewinnen
Sicherheitsforscher von Google hacken Playstation Portal
Forscher entwickeln serientauglichen optischen Computer
Forscher demonstrieren Angriff auf Kfz-Radarsysteme
Forschern gelingt Manipulation von Flugzeug-Leistungsdaten

Weitere News:

"Finger-Guillotine": Cybertruck trennte fast Finger von YouTuber ab
Microsoft warnt vor Angriffswelle auf Android-Apps
Candy Crush: Priester soll Kirchengelder f�r Handyspiele veruntreut haben
Googles Pixel 8a komplett geleakt
Kasperskys KI angeblich in russischen Milit�rdrohnen
Firefox-Userin l�sst 7.400 Tabs offen
Pok�mon-Spieler erstellen Fake-Str�nde bei Openstreetmap
Microsoft erkl�rt Security zu seiner Top-Priorit�t
Neues Tool soll politische Deepfakes enttarnen
Chinesisches E-Auto f�r 14.500 Euro wird in Deutschland verkauft

Einen Kommentar schreiben

Kommentare

(0)

Bitte bleibe sachlich und fair in deinen �u�erungen. Sollte dein Kommentar nicht sofort erscheinen, ist er in der Warteschlange gelandet und wird meist zeitnah freigeschaltet.

Kommentare:

Leider hast du das Java-Plugin deaktiviert...
Die Kommentarfunktion brauch das Java Plugin aber...

Du kannst aber gerne �ber das Forum Newskommentare schreiben...

Du hast bereits f�r diesen Kommentar angestimmt...

;-)

Top