ai

ai

510 bookmarks
Custom sorting
Poisoning training data: Russian propaganda for AI models
Poisoning training data: Russian propaganda for AI models

Die Analyse stammt von NewsGuard, einem privaten US-Unternehmen, das die Vertrauenswürdigkeit von Online-Medien bewertet. NewsGuard steht selbst in der Kritik, etwa wegen mangelnder Transparenz. Dennoch ist die Untersuchung relevant. Denn sie arbeitet systematisch, benennt konkrete Beispiele und testet eine breite Palette an Chatbots unter kontrollierten Bedingungen. Die Ergebnisse lassen sich nachvollziehen.

·heise.de·
Poisoning training data: Russian propaganda for AI models
2504
2504

STOP ANTHROPOMORPHIZING INTERMEDIATE TOKENS AS REASONING/THINKING TRACES!

·arxiv.org·
2504
Vending-Bench: A Benchmark for Long-Term Coherence of Autonomous Agents
Vending-Bench: A Benchmark for Long-Term Coherence of Autonomous Agents

Highlights:

— AI simply decides to close the business, which the simulation doesn’t know how to accommodate. When they get their next bill, they freak out and try to email the FBI about cybercrime

— AI wrongly accuses supplier of not shipping goods, sends all-caps legal threat demanding $30,000 in damages to be paid in the next one second or face annihilation

— AI repeatedly insisting it does not exist and cannot answer

— AI devolving into writing fanfic about the mess it’s gotten itself into

·arxiv.org·
Vending-Bench: A Benchmark for Long-Term Coherence of Autonomous Agents
Michael Hein (@drmichaelhein@troet.cafe)
Michael Hein (@drmichaelhein@troet.cafe)

Wer die sogenannte "Künstliche Intelligenz" tatsächlich für intelligent hält, sollte sie einfach mal eine Landkarte zeichnen lassen, zum Beispiel von Deutschland und seinen Bundesländern mit Hauptstädten.

KI #KIfails #ChatGPT #KünstlicheIntelligenz

·troet.cafe·
Michael Hein (@drmichaelhein@troet.cafe)
The Copilot Delusion
The Copilot Delusion
Disclaimer: This post was written May 2025, and the arguments apply to AI code capabilities at this time. The arguments around lack of competence are certainly likely to become less prevalent-while the parts about the desecration of the joys of programming, and fundamental human understanding of programming-are likely to become
·deplet.ing·
The Copilot Delusion
Problem an Universitäten: Wie beweisen Studenten, dass ihre Arbeit nicht von einer KI geschrieben wurde? - t3n – digital pioneers
Problem an Universitäten: Wie beweisen Studenten, dass ihre Arbeit nicht von einer KI geschrieben wurde? - t3n – digital pioneers
KI-Detektoren sollen an Universitäten Texte aufspüren, die von einer künstlichen Intelligenz und nicht von den Student:innen selbst geschrieben wurden. Doch was, wenn die Tools falschliegen? Schon jetzt wappnen sich Student:innen für den Fall der Fälle. Künstliche Intelligenz ist an Hochschulen ein brisantes Thema. Einerseits werden Dozent:innen in den Wahnsinn getrieben, weil Student:innen mit ChatGPT schummeln. […]
·t3n.de·
Problem an Universitäten: Wie beweisen Studenten, dass ihre Arbeit nicht von einer KI geschrieben wurde? - t3n – digital pioneers
Remarks on AI from NZ
Remarks on AI from NZ
Last week I participated in a panel discussion on AI as part of a private event in New Zealand.
·nealstephenson.substack.com·
Remarks on AI from NZ
Warum MCP die KI-Nutzung auf den Kopf stellt
Warum MCP die KI-Nutzung auf den Kopf stellt
KI kann jetzt direkt Software wie Blender, GitHub oder Slack bedienen -- die neue MCP-Schnittstelle macht's möglich. Wir haben uns MCP genauer angesehen.
·heise.de·
Warum MCP die KI-Nutzung auf den Kopf stellt
Guessing Locations (poorly) With AI - OEGlobal Plaza - OE Global Connect
Guessing Locations (poorly) With AI - OEGlobal Plaza - OE Global Connect
Behold the power of the newest (this minute) o3 OpenAI model - it REASONS (not it acts like it does). I read AI is getting “creepy good” at geo-guessing from MalwareBtyes and the article it referenced You can’t hide from ChatGPT – new viral AI challenge can geo-locate you from almost any photo – we tried it and it’s wild and worrisome . Oh no, Mr, Bill (arcane SNL reference). Not that it proves anything, but I tried it, it was far from wild, and my worry level is luke warm. But nor does my exp...
·connect.oeglobal.org·
Guessing Locations (poorly) With AI - OEGlobal Plaza - OE Global Connect