Search Test Information Space

Found 2 bookmarks

Custom sorting

Training Language Models to Self-Correct via Reinforcement Learning

View PDF

#Large Language Models #Accuracy #Reinforcement Learning #DeepMind #Paper #PDF

·arxiv.org·Sep 22, 2024

Training Language Models to Self-Correct via Reinforcement Learning

Long-form factuality in large language models

#Large Language Models #Accuracy #Fact-checking #Paper #PDF

·arxiv.org·Mar 29, 2024

Long-form factuality in large language models