Search Public

Found 4 bookmarks

Custom sorting

Improved Baselines with Visual Instruction Tuning

Improved Baselines with Visual Instruction Tuning

#ai #llm #multimodal

·arxiv.org·Oct 9, 2023

Improved Baselines with Visual Instruction Tuning

GPT-4 Technical Report

GPT-4 Technical Report

#ai #llm #multimodal

·cdn.openai.com·Mar 14, 2023

GPT-4 Technical Report

Visual ChatGPT: Talking, Drawing and Editing with Visual Foundation Models

Visual ChatGPT: Talking, Drawing and Editing with Visual Foundation Models

#ai #llm #multimodal

·arxiv.org·Mar 12, 2023

Visual ChatGPT: Talking, Drawing and Editing with Visual Foundation Models

CogVideo: Large-scale Pretraining for Text-to-Video Generation via Transformers

CogVideo: Large-scale Pretraining for Text-to-Video Generation via Transformers

#ai #llm #video #multimodal

·arxiv.org·Feb 13, 2023

CogVideo: Large-scale Pretraining for Text-to-Video Generation via Transformers