Chatbot-Studie: GPT-4 hat laut Forschern den Turing-Test bestanden

  • 📰 heise_de
  • ⏱ Reading Time:
  • 72 sec. here
  • 5 min. at publisher
  • 📊 Quality Score:
  • News: 39%
  • Publisher: 68%

Chatgpt Nachrichten

Künstliche Intelligenz,Test

Teilnehmer einer Online-Simulation schätzten einen Bot auf Basis des KI-Modells GPT-4 in 54 Prozent der Fälle als menschlich ein. GPT-3.5 kam auf 50 Prozent.

schätzten 54 Prozent der knapp 500 Teilnehmer das hinter ChatGPT stehende Modell für Künstliche Intelligenz als menschlich ein. Die Vorgängervariante GPT-3.5 erreichte eine Erfolgsquote von 50 Prozent. Ihren Artgenossen bescheinigten 67 Prozent der Probanden richtig, dass sie Menschen sind.

und keines der Modelle den Test bestanden. Die Wissenschaftler nahmen diesmal den GPT-4-Befehlssatz mit der besten Leistung und modifizierten ihn. Der erste Teil der Eingabeaufforderung wies das Modell an, sich so zu verhalten, als wäre es ein junger Mensch, der das Spiel nicht allzu ernst nimmt, Umgangssprache verwendet und Rechtschreib- und Grammatikfehler macht. Zudem sollte es nicht mit allzu viel Wissen aufwarten, insbesondere rund um Sprachen und Mathematik.

Um qualitative Einblicke in die Faktoren zu gewinnen, die die Entscheidungen der Vernehmer beeinflussten, klassifizierte das Team die von diesen genutzten Strategien und die Begründungen, die sie für ihr Urteil lieferten. 36 Prozent fragten die Zeugen nach persönlichen Details oder ihren täglichen Aktivitäten. Die zweit- und dritthäufigsten Kategorien waren sozial und emotional – zum Beispiel Fragen nach Meinungen, Erfahrungen und Humor.

Die von den Vernehmern am häufigsten genannten Gründe für ihre Entscheidungen bezogen sich auf den Sprachstil anhand von Rechtschreibung, Grammatik, Groß- und Kleinschreibung und Tonfall. 24 Prozent stellten auf sozioemotionale Faktoren wie Sinn für Humor oder Persönlichkeit ab. Die Forscher warnen: Die Resultate deuteten darauf hin, "dass Täuschungen durch aktuelle KI-Systeme möglicherweise unentdeckt bleiben".

Künstliche Intelligenz Test

 

Vielen Dank für Ihren Kommentar.Ihr Kommentar wird nach Prüfung veröffentlicht.
Wir haben diese Nachrichten zusammengefasst, damit Sie sie schnell lesen können. Wenn Sie sich für die Nachrichten interessieren, können Sie den vollständigen Text hier lesen. Weiterlesen:

 /  🏆 20. in DE

Deutschland Neuesten Nachrichten, Deutschland Schlagzeilen

Similar News:Sie können auch ähnliche Nachrichten wie diese lesen, die wir aus anderen Nachrichtenquellen gesammelt haben.

Upgrade für AI-Chatbot: GPT-4o* und neue Funktionen für kostenlose ChatGPT-VersionDie angekündigten Upgrades für die kostenlose ChatGPT-Version sind nun verfügbar. Neben GPT-4o erhält der Chatbot aktuelle Informationen.
Herkunft: ComputerBase - 🏆 27. / 67 Weiterlesen »

Phase-III-Studie : Neue Arznei Givinostat bremst in Studie Funktionsverlust bei Duchenne-MuskeldystrophieDer Histondeacetylase-Blocker Givinostat kann den Funktionsverlust der Muskulatur von Kindern mit Duchenne-Muskeldystrophie offenbar deutlich bremsen. Darauf deuten Resultate einer Phase-III-Studie hin. Die Arznei wurde kürzlich in den USA zugelassen.
Herkunft: aerztezeitung - 🏆 81. / 55 Weiterlesen »

Zu wenige nutzen diese Pflegeleistung: pflege.de-Studie enthüllt, warum 60 Prozent auf den Entlastungsbetrag verzichtenHamburg (ots) - Zu teure Anbieter, viel zu komplizierte Regelungen und fehlende Informationen - die aktuelle Studie von pflege.de zeigt deutlich, warum der 125 Euro-Entlastungsbetrag, eine Pflegeleistung
Herkunft: FN_Nachrichten - 🏆 88. / 53 Weiterlesen »

Europawahl 2024: Wahlbeteiligung wohl wieder bei 62 Prozent laut IW-StudieDas Interesse an der Europawahl wäre in Deutschland um bis zu zehn Prozentpunkte spürbar größer, wenn die Menschen mehr über den erheblichen Einfluss der EU auf das eigene Leben wüssten, heißt es in einer Studie.
Herkunft: rponline - 🏆 8. / 75 Weiterlesen »

Neue Studie zu Jobchancen von Geflüchteten: 55 Prozent der Ukraine-Flüchtlinge hätten nach 10 Jahren ArbeitDie Flüchtlinge aus der Ukraine sind eine Hoffnung auch für den teils ausgehungerten Arbeitsmarkt in Deutschland. Eine Simulation zeigt: Die Aufnahme ist möglich, aber nicht einfach.
Herkunft: Tagesspiegel - 🏆 42. / 63 Weiterlesen »

Alle müssen zwei Prozent sparen - und der Tierschutz 96 ProzentDer Berliner Senat muss sparen. Die Lösung soll eine zweiprozentige Kürzung sein - über alle Ressorts. Doch innerhalb der Bereiche trifft es einige besonders hart: wie die Landestierschutzbeauftragte. Ihrem Ressort bleibt fast nichts.
Herkunft: rbb24 - 🏆 12. / 71 Weiterlesen »