Cvpr 2026 Linking Perception Confidence

[CVPR 2026] Linking Perception, Confidence and Accuracy in MLLMs

[

[CVPR 2026] Making the Classification Explanation Faithful to the Confidence Score

This is a paper on how to make the explanation of classification models faithful to the classification results (category+

[CVPR 2026]

Disentangle-then-Align: Non-Iterative Hybrid Multimodal Image Registration via Cross-Scale Feature Disentanglement.

[CVPR 2026] 4D Local and Global Perception for Ambiguity-free RI Point Cloud Analysis

Video presentation of our

[CVPR 2026] UniPR

UniPR: Unified Object-level Real-to-Sim

[CVPR 2026] Training-free Detection of Generated Videos via Spatial-Temporal Likelihoods

Video presentation for "STALL: Training-free Detection of Generated Videos via Spatial-Temporal Likelihoods", presented at ...

[CVPR 2026] Scene-Centric Unsupervised Video Panoptic Segmentation

Title: Scene-Centric Unsupervised Video Panoptic Segmentation Authors: Christoph Reich*, Oliver Hahn*, Nikita Araslanov, ...

[CVPR 2026] MUFASA: A Multi-Layer Framework for Slot Attention

Title: MUFASA: A Multi-Layer Framework for Slot Attention Authors: Sebastian Bock*, Leonie Schüßler*, Krishnakant Singh, ...

DENALI | CVPR 2026 Highlight Paper

More info: http://nikhilbehari.com/denali.

Perception Programs - CVPR 2026

Video for the paper "Don't Show Pixels, Show Cues: Unlocking Visual Tool Reasoning in Language Models via

CVPR 2026 Presentation of NeuroFlow

NeuroFlow: Toward Unified Visual Encoding and Decoding from Neural Activity.

[CVPR 2026] Breaking the Regional Perception Bottleneck of MLLMs via External Reasoning Framework

[CVPR 2026] CarlaOcc

CVPR 2026

[CVPR 2026] RealVLG-R1

[

[CVPR 2026] LocateAnything3D

https://arxiv.org/abs/2511.20648.

[CVPR 2026] Hear What You See: Video-to-Audio Generation with Diffusion Transformer and STAR-DPO

[CVPR 2026] PAMotion

PAMotion: Physics-Aware Motion Generation for Full-Body Interaction with Multiple Objects. Authors:Yan Di, Yuheng Li, Yaoxing ...

[CVPR 2026] A More Word-like Image Tokenization for MLLMs

Hyun Lee, Hyemin Jeong, Yejin Kim, Hyungwook Choi, Hyunsoo Cho, Soo Kyung Kim, Joonseok Lee. A More Word-like Image ...

[CVPR 2026] Revisiting Pose Sensitivity in Splat-based Computed Tomography

Kiseok Choi, Hyeongjun Cho, Inchul Kim, Min H. Kim (