Search Test Information Space

Found 9 bookmarks

Custom sorting

Toward understanding and preventing misalignment generalization | OpenAI

Read the paper(opens in a new window)

·openai.com·Jun 18, 2025

Deliberative alignment: reasoning enables safer language models | OpenAI

·openai.com·Jan 8, 2025

OpenAI trained o1 and o3 to 'think' about its safety policy | TechCrunch

·techcrunch.com·Dec 23, 2024

12 Days of OpenAI | OpenAI

·openai.com·Dec 20, 2024

Weak to strong generalization

·cdn.openai.com·Dec 15, 2023

Now we know what OpenAI’s superalignment team has been up to

·technologyreview.com·Dec 14, 2023

Weak-to-strong generalization

·openai.com·Dec 14, 2023

Superalignment Fast Grants

·openai.com·Dec 14, 2023

What Sam Altman’s Firing Means for the Future of OpenAI

·wired.com·Nov 19, 2023