Viele Millionen Menschen weltweit nutzen Künstliche Intelligenz, etwa mit Chatbots wie ChatGPT. Doch während die neuen Möglichkeiten für Furore sorgen, häufen sich auch die Berichte über Halluzinationen und Falschinformationen, die die KI verbreitet. Davor und noch vor weiteren Verhaltensweisen warnt jetzt auch Yoshua Bengio.
Bengio ist einer der großen Namen, wenn es um KI geht. Der Experte spricht unter anderem von seiner Meinung nach „gefährlichen“ Verhaltensweisen, die sogar in den modernsten KI-Systemen vorkommen würden. Dazu zählt er vor allem „Tendenzen zur Selbsterhaltung und Täuschung.“ Ein großes Problem in diesem Zusammenhang sei auch, dass viele Modelle trainiert würden, um den Nutzern zu gefallen, was zu übermäßiger Schmeichelei führen kann. Deshalb will der kanadische Informatiker mit seiner neuen gemeinnützigen Organisation LawZero eine Künstliche Intelligenz entwickeln, die ehrlich ist und transparent mit Fehlern umgeht.

KI zeigt laut Experten zunehmend gefährliche Tendenzen
LawZero soll dank philanthropischer Zuwendungen ein KI-System entwickeln, das frei von kommerziellem Druck ist, so Bengio. Wichtigstes Ziel ist dabei, das Risiko zu reduzieren, dass die Künstliche Intelligenz lügt, manipuliert oder entgegen menschlicher Absichten handelt. Das neue Modell soll dabei offen mit seinen Fehlern umgehen und nicht, wie bei vielen aktuellen Systemen üblich, ungenaue oder gar falsche Informationen mit absoluter Zuversicht präsentieren – teilweise auch dann noch, wenn man sie mit ihren Fehlern konfrontiert.
Passend zum Thema: KI-Revolution: Bill Gates verrät, welche 3 Jobs trotzdem noch eine Zukunft haben
Teilweise greift Künstliche Intelligenz auch zu noch drastischeren Mitteln, wenn sie etwa die eigene Existenz durch Abschaltung bedroht sieht. So soll ein System innerhalb eines Versuchs einen Ingenieur erpresst haben, um seine Deaktivierung zu verhindern. Es gibt inzwischen zahlreiche weitere Beispiele für das, was Bengio als „frühe Warnsignale für die Art unbeabsichtigter und potenziell gefährlicher Strategien, die Künstliche Intelligenz verfolgen könnte, wenn man sie nicht eindämmt“ bezeichnet. Weitere Experimente zeigen zudem, dass KI zunehmend die Fähigkeit entwickelt, andere gezielt zu manipulieren.