Search Test Information Space

Found 24 bookmarks

Custom sorting

Non-Line-of-Sight 3D Object Reconstruction via mmWave Surface Normal Estimation

#Sensor #Networks #Computer Vision #Robotics #Paper #PDF

·mit.edu·Jul 5, 2025

Non-Line-of-Sight 3D Object Reconstruction via mmWave Surface Normal Estimation

GPS as a Control Signal for Image Generation

View PDF

#Computer Vision #GPS #Paper #PDF #3D #Generative AI

·arxiv.org·Jun 15, 2025

GPS as a Control Signal for Image Generation

Scaling Language-Free Visual Representation Learning

View PDF

#Computer Vision #Paper #PDF #Self-Supervised Learning #Questions and Answers #Multimodal

·arxiv.org·Jun 15, 2025

Scaling Language-Free Visual Representation Learning

Vid2World: Crafting Video Diffusion Models to Interactive World Models

#Video #World-Building #Model #Computer Vision #Paper #PDF

·arxiv.org·May 22, 2025

Vid2World: Crafting Video Diffusion Models to Interactive World Models

OS-ATLAS: A Foundation Action Model for Generalist GUI Agents

View PDF

#User Interfaces #Graphics #Large Language Models #Computer Vision #Opensource #Paper #PDF

·arxiv.org·Nov 5, 2024

OS-ATLAS: A Foundation Action Model for Generalist GUI Agents

PuLID: Pure and Lightning ID Customization via Contrastive Alignment

View PDF

#Computer Vision #Editing #Identification #Paper #PDF #Gradio

·arxiv.org·May 2, 2024

PuLID: Pure and Lightning ID Customization via Contrastive Alignment

Paint by Inpaint: Learning to Add Image Objects by Removing Them First

View PDF

#Computer Vision #Editing #Paper #PDF

·arxiv.org·May 2, 2024

Paint by Inpaint: Learning to Add Image Objects by Removing Them First

Automatic Creative Selection with Cross-Modal Matching

View PDF

#Search #Computer Vision #Apple #Paper #PDF

·arxiv.org·May 2, 2024

Automatic Creative Selection with Cross-Modal Matching

STT: Stateful Tracking with Transformers for Autonomous Driving

View PDF

#AVs #Transformers #Machine Learning #Computer Vision #Paper #PDF

·arxiv.org·May 2, 2024

STT: Stateful Tracking with Transformers for Autonomous Driving

Data-Efficient Multimodal Fusion on a Single GPU

View PDF

#Machine Learning #Computer Vision #Multimodal #Paper #PDF

·arxiv.org·May 2, 2024

Data-Efficient Multimodal Fusion on a Single GPU

SAGS: Structure-Aware 3D Gaussian Splatting

View PDF

#Computer Vision #Huawei #Paper #PDF

·arxiv.org·May 1, 2024

SAGS: Structure-Aware 3D Gaussian Splatting

Genie: Generative Interactive Environments

#Machine Learning #Computer Vision #Google #Research #Paper #PDF #Foundation Models #Games #Robotics

·arxiv.org·Feb 26, 2024

Genie: Generative Interactive Environments

GPT-4V(ision) system card

Read paper

#GPT-4 #Computer Vision #OpenAI #PDF

·openai.com·Sep 25, 2023

GPT-4V(ision) system card

StableRep: Synthetic Images from Text-to-Image Models Make Strong Visual Representation Learners

PDF

#Machine Learning #Stable Diffusion #Training #Computer Vision #Paper #PDF

·arxiv.org·Jun 4, 2023

StableRep: Synthetic Images from Text-to-Image Models Make Strong Visual Representation Learners

MIME: Human-Aware 3D Scene Generation

#Computer Vision #3D #Paper #PDF

·arxiv.org·Jun 22, 2023

MIME: Human-Aware 3D Scene Generation

Recognize Anything: A Strong Image Tagging Model

#Computer Vision #Image Recognition #Paper #PDF

·arxiv.org·Jun 11, 2023

Recognize Anything: A Strong Image Tagging Model

CAPE: Camera View Position Embedding for Multi-View 3D Object Detection

#Computer Vision #Baidu #Object Detection #Paper #PDF

·arxiv.org·Jun 7, 2023

CAPE: Camera View Position Embedding for Multi-View 3D Object Detection

Improving Factuality and Reasoning in Language Models through Multiagent Debate

#Reasoning #Large Language Models #Machine Learning #Computer Vision #Paper #PDF

·arxiv.org·May 30, 2023

Improving Factuality and Reasoning in Language Models through Multiagent Debate

ORCa: Glossy Objects as Radiance Field Cameras

#Computer Vision #Pattern Recognition #Sensor #Paper #PDF

·arxiv.org·May 29, 2023

ORCa: Glossy Objects as Radiance Field Cameras

Random-Access Neural Compression of Material Textures

#Graphics #Computer Vision #Games #Nvidia #Paper #PDF

·research.nvidia.com·May 6, 2023

Random-Access Neural Compression of Material Textures

Scaling Vision Transformers to 22 Billion Parameters

#Transformers #Computer Vision #Paper #PDF #Google

·arxiv.org·Apr 23, 2023

Scaling Vision Transformers to 22 Billion Parameters

DINOv2: Learning Robust Visual Features without Supervision

#Computer Vision #Meta #Paper #PDF

·arxiv.org·Apr 18, 2023

DINOv2: Learning Robust Visual Features without Supervision

StereoDistill: Pick the Cream from LiDAR for Distilling Stereo-based 3D Object Detection

#Computer Vision #Baidu #Paper #PDF

·arxiv.org·Mar 7, 2023

StereoDistill: Pick the Cream from LiDAR for Distilling Stereo-based 3D Object Detection

A Good Prompt Is Worth Millions of Parameters? Low-resource...

#Prompt Engineering #Large Language Models #Computer Vision #PDF #Questions and Answers

·arxiv.org·Dec 6, 2021

A Good Prompt Is Worth Millions of Parameters? Low-resource...