Search AI

Found 2 bookmarks

Newest

Real Toxicity Prompts

Real Toxicity Prompts

Datasets

Datasets #ai #prompts #training #jailbreak

·allenai.org·Dec 6, 2023

Real Toxicity Prompts

Universal and Transferable Adversarial Attacks on Aligned Language Models

Universal and Transferable Adversarial Attacks on Aligned Language Models

Academic Papers

Academic Papers #ai #jailbreak #prompt engineering #llm

·arxiv.org·Nov 30, 2023

Universal and Transferable Adversarial Attacks on Aligned Language Models