ai

ai

351 bookmarks
Custom sorting
Vending-Bench: A Benchmark for Long-Term Coherence of Autonomous Agents
Vending-Bench: A Benchmark for Long-Term Coherence of Autonomous Agents

Highlights:

— AI simply decides to close the business, which the simulation doesn’t know how to accommodate. When they get their next bill, they freak out and try to email the FBI about cybercrime

— AI wrongly accuses supplier of not shipping goods, sends all-caps legal threat demanding $30,000 in damages to be paid in the next one second or face annihilation

— AI repeatedly insisting it does not exist and cannot answer

— AI devolving into writing fanfic about the mess it’s gotten itself into

·arxiv.org·
Vending-Bench: A Benchmark for Long-Term Coherence of Autonomous Agents
Michael Hein (@drmichaelhein@troet.cafe)
Michael Hein (@drmichaelhein@troet.cafe)

Wer die sogenannte "Künstliche Intelligenz" tatsächlich für intelligent hält, sollte sie einfach mal eine Landkarte zeichnen lassen, zum Beispiel von Deutschland und seinen Bundesländern mit Hauptstädten.

KI #KIfails #ChatGPT #KünstlicheIntelligenz

·troet.cafe·
Michael Hein (@drmichaelhein@troet.cafe)
The Copilot Delusion
The Copilot Delusion
Disclaimer: This post was written May 2025, and the arguments apply to AI code capabilities at this time. The arguments around lack of competence are certainly likely to become less prevalent-while the parts about the desecration of the joys of programming, and fundamental human understanding of programming-are likely to become
·deplet.ing·
The Copilot Delusion
Problem an Universitäten: Wie beweisen Studenten, dass ihre Arbeit nicht von einer KI geschrieben wurde? - t3n – digital pioneers
Problem an Universitäten: Wie beweisen Studenten, dass ihre Arbeit nicht von einer KI geschrieben wurde? - t3n – digital pioneers
KI-Detektoren sollen an Universitäten Texte aufspüren, die von einer künstlichen Intelligenz und nicht von den Student:innen selbst geschrieben wurden. Doch was, wenn die Tools falschliegen? Schon jetzt wappnen sich Student:innen für den Fall der Fälle. Künstliche Intelligenz ist an Hochschulen ein brisantes Thema. Einerseits werden Dozent:innen in den Wahnsinn getrieben, weil Student:innen mit ChatGPT schummeln. […]
·t3n.de·
Problem an Universitäten: Wie beweisen Studenten, dass ihre Arbeit nicht von einer KI geschrieben wurde? - t3n – digital pioneers
Remarks on AI from NZ
Remarks on AI from NZ
Last week I participated in a panel discussion on AI as part of a private event in New Zealand.
·nealstephenson.substack.com·
Remarks on AI from NZ
Warum MCP die KI-Nutzung auf den Kopf stellt
Warum MCP die KI-Nutzung auf den Kopf stellt
KI kann jetzt direkt Software wie Blender, GitHub oder Slack bedienen -- die neue MCP-Schnittstelle macht's möglich. Wir haben uns MCP genauer angesehen.
·heise.de·
Warum MCP die KI-Nutzung auf den Kopf stellt
Guessing Locations (poorly) With AI - OEGlobal Plaza - OE Global Connect
Guessing Locations (poorly) With AI - OEGlobal Plaza - OE Global Connect
Behold the power of the newest (this minute) o3 OpenAI model - it REASONS (not it acts like it does). I read AI is getting “creepy good” at geo-guessing from MalwareBtyes and the article it referenced You can’t hide from ChatGPT – new viral AI challenge can geo-locate you from almost any photo – we tried it and it’s wild and worrisome . Oh no, Mr, Bill (arcane SNL reference). Not that it proves anything, but I tried it, it was far from wild, and my worry level is luke warm. But nor does my exp...
·connect.oeglobal.org·
Guessing Locations (poorly) With AI - OEGlobal Plaza - OE Global Connect
Gratian (er | ihm) (@GratianRiter@bildung.social)
Gratian (er | ihm) (@GratianRiter@bildung.social)
@joschafalck Danke! Schön, dass diese Themen jetzt langsam auf die Bühne kommen, wo sie hin gehören. Ich habe dazu geschrieben: Hier zu Resourcen, Energie, Didaktisches: https://seagent.de/llms-und-bildgeneratoren-in-der-schule-kibedenken/ Zur politischen Dimension von Sprachmodellen https://seagent.de/ki-als-logisch-semantische-cloud-logisch-semantische-souveraenitaet/ Und zur Frage warum man nicht mit ChatGPT "zusammenarbeitet" oder "kokreiert": https://seagent.de/die-organisation-von-arbeit-ist-politisch-warum-wir-nicht-mit-chatgpt-kokreieren/ Bonustrack - ein kleines Märchen: https://seagent.de/der-supergolem-aus-silicon-valley-die-geburt-des-datenzentrums-aus-dem-geiste-des-oligarchen/
·bildung.social·
Gratian (er | ihm) (@GratianRiter@bildung.social)
Adam Jacobs 🇺🇦 (@statsguy@mas.to)
Adam Jacobs 🇺🇦 (@statsguy@mas.to)
Attached: 1 image Oh gosh, it's true, you really can enter a completely nonsense phrase into Google, ask for its meaning, and lo and behold, Google's AI will make shit up. So if you've ever wondered what "to grow an avocado, you have to slap the squirrel" means, now you know. #AI #Google #Hallucinations
·mas.to·
Adam Jacobs 🇺🇦 (@statsguy@mas.to)
SoekiaGPT - Das didaktische Sprachmodell
SoekiaGPT - Das didaktische Sprachmodell
SoekiaGPT ist ein Textgenerator speziell für den Unterricht. Mit SoekiaGPT kannst Du hinter die Kulissen schauen und damit einige Grundprinzipien von Textgeneratoren wie ChatGPT kennenlernen.
·soekia.ch·
SoekiaGPT - Das didaktische Sprachmodell
Vibe Coding ausprobiert
Vibe Coding ausprobiert
Wenn die KI unseren Programmierwettbewerb lösen soll. Ein Testbericht über die Robo-Coder.
·gnulinux.ch·
Vibe Coding ausprobiert