Dynamic Programming in Edit Distance

Selective Prediction for VQA: Enhancing Trust in MLLMs Through Normalized Edit-Distance Conformal Calibration

Abstract: Visual Question Answering (VQA) is a challenging multimodal task that requires models to generate accurate, freeform answers based on both visual and textual inputs. While Multimodal Large ...

Some results have been hidden because they may be inaccessible to you

Show inaccessible results

Feedback

Selective Prediction for VQA: Enhancing Trust in MLLMs Through Normalized Edit-Distance Conformal Calibration

Trending now