Search Test Information Space

Found 2 bookmarks

Custom sorting

HardTests: Synthesizing High-Quality Test Cases for LLM Coding

#Testing #Large Language Models #Paper #PDF #Coding #Verification

·arxiv.org·Jun 3, 2025

HardTests: Synthesizing High-Quality Test Cases for LLM Coding

OpenAI Builds AI to Critique AI

#OpenAI #ChatGPT #Coding #Verification #Large Language Models

·spectrum.ieee.org·Jun 27, 2024

OpenAI Builds AI to Critique AI