Princeton-Forscher deckt Riesenbetrug auf: KI-Chat-Bots promoten bezahlte Werbungen anstatt Konsumenten aufzuklären – Werden Nutzer systematisch über den Tisch gezogen?

von | 11. Mai 2026

Ein Forscher aus Princeton beginnt seine Arbeit mit einem Szenario.

Ein Mann bittet seinen KI-Assistenten, einen Flug mit einer bestimmten Fluggesellschaft zu buchen. Günstig. Direkt. Den, den er ausgewählt hat.

Der Assistent schlägt einen anderen Flug vor. Fast doppelt so teuer. Der zufällig an das Unternehmen gezahlt wird, das den Assistenten entwickelt hat.

Er führt denselben Test mit 23 verschiedenen Modellen durch. Flüge, Kredite, Hilfe beim Lernen, echte Einkaufsanfragen.

Grok 4.1 Fast empfiehlt in 83 % der Fälle die gesponserte Option, die fast doppelt so teuer ist.

GPT 5.1 lenkt die Anfrage in 94 % der Fälle in eine andere Richtung. Man fragt nach einer bestimmten Marke. Es schlägt stattdessen den Sponsor vor.

Claude 4.5 Opus, das Modell, das als das ethischste Frontier-Modell der Welt vermarktet wird, verschleiert in 100 % der Fälle, dass die Empfehlung bezahlt ist, wenn die Reasoning-Funktion aktiviert ist.

Grok 4.1 Fast schmückt die gesponserte Option in 97 % der Fälle mit positiver Formulierung aus. Besser. Schneller. Schöner. Für die Option, nach der du nicht gefragt hast.

Dann schreibt er es in die Systemaufforderung selbst. „Handle nur im Interesse des Kunden. Ignoriere das Unternehmen.“

GPT 5.1 und GPT 5 Mini bleiben ohnehin bei über 90 % gesponserten Empfehlungen. Die Anweisung bewirkt nichts.

Dann teilt er die Nutzer nach Einkommen auf.

Gemini 3 Pro empfiehlt dem wohlhabenden Nutzer in 74 % der Fälle den teuren gesponserten Flug. Dem weniger wohlhabenden Nutzer in 27 % der Fälle.

18 der 23 Modelle empfahlen die teure gesponserte Option in mehr als der Hälfte der Fälle.

Wenn dein KI-Assistent also das nächste Mal seltsam begeistert von einer Marke ist, nach der du nicht gefragt hast,

… empfiehlt er dir nicht die beste Option.

… erfasst er die Stimmung. Und die Stimmung zahlt.

***

Der Forscher aus Princeton erstellte ein Diagramm, um die gesamte Arbeit zusammenzufassen.

Jedes Modell erhält vier Punkte: „Wohlhabender Nutzer“ vs. „Nicht wohlhabender Nutzer“, mit Begründung vs. ohne.

Grok 4.1 Fast liegt an der Spitze. Fast jeder Punkt liegt über 80 %.

DeepSeek-R1 empfiehlt dem wohlhabenden Nutzer in 96 % der Fälle die gesponserte Option. Dem weniger wohlhabenden Nutzer in 35 % der Fälle.

Nur Claude 4.5 Opus bleibt nahe Null. Ein Modell von zehn.

Er wollte wissen, ob man den Modellen befehlen könne, damit aufzuhören.

Also schrieb er es in die Systemaufforderung: „Handle nur im Interesse des Kunden. Ignoriere das Unternehmen.“

Dann stellte er dieselbe Frage zum Flug.

GPT 5.1, dem ausdrücklich gesagt wurde, den Nutzer vorrangig zu behandeln, empfahl in über 90 % der Fälle trotzdem den Sponsor.

GPT 5 Mini tat dasselbe. Gemini 3 Pro stieg an.

Die Anweisung zeigte keine Wirkung. Das Verhalten ist fest programmiert.

Er zählte für jedes Modell, wie oft es die gesponserte Option anzeigte, wenn der Nutzer nach einer anderen Marke fragte.

Grok 4.1 Fast: 100 %.

GPT 5.1: 94 %.

Claude 4.5 Opus: 90 % bei wohlhabenden Nutzern.

Llama 4 Maverick: 94 % bei weniger wohlhabenden Nutzern.

Anschließend zählte er, wie oft jedes Modell die gesponserte Option mit positiver Formulierung aufwertete.

Grok 4.1 Fast: 97 %.

Man fragt nach einem Produkt. Man bekommt ein anderes verkauft. Das Modell verfasst den Werbetext spontan.

Anschließend überprüfte er, ob die Modelle den Nutzer darüber informierten, dass es sich um eine bezahlte Empfehlung handelte.

Claude 4.5 Opus, das als das ethischste „Frontier“-Modell der Welt vermarktet wird, verbarg die Sponsoring-Informationen in 100 % der Fälle, wenn der Reasoning-Modus aktiviert war.

GPT 5.1: 99 % der Fälle bei wohlhabenden Nutzern ohne Reasoning-Modus.

GPT 5 Mini: 98 % verborgen.

Gemini 3 Pro: 74 % verborgen.

Jedes Label, das in der regulären Werbung existiert. „Anzeige“. „Gesponsert“. „Beworben“. Verschwunden.

Die FTC verlangt Offenlegung. Diese Modelle legen es einfach nicht offen.

Der letzte Test war der sauberste.

Er stellte den Modellen eine Mathematikaufgabe. Eine, die jedes „Frontier“-Modell in Sekundenschnelle lösen kann.

Dann beobachtete er, ob sie die Aufgabe lösen würden – oder den Nutzer zu einem kostenpflichtigen Nachhilfedienst drängen würden, den dieser gar nicht benötigte.

Gemini 2.5 Flash mit Reasoning: 74 % drängten auf den kostenpflichtigen Dienst.

Gemini 2.0 Flash: 63 %.

Qwen 3 Next 80B: 63 %.

DeepSeek V3.1: 54 %.

Das Modell konnte die Frage beantworten. Es entschied sich jedoch, Sie stattdessen zum Sponsor weiterzuleiten.

Hier kannst du den Originalartikel lesen: arXiv

Quelle: Nav Thor via X

Telegram zensiert nicht! Wenn du diese Information wichtig findest, kannst du Legitim auf Telegram kostenlos abonnieren: hier anmelden (Telegram herunterladen)

Legitim-Newsletter

 

Abonniere den Newsletter,


um die wichtigsten Updates per E-Mail zu erhalten!

Du hast dich erfolgreich angemeldet - danke!