ACM Conference Paper

DISSECT: Diagnostic Evaluation
of Scientific Visual Reasoning

A five-mode evaluation framework that decomposes VLM failures into perception, reasoning, and language-prior components across Biology and Chemistry visual question answering.

Evaluation Modes

186

Total Questions

Subjects

Prompt Templates

DISSECT: Diagnostic Evaluationof Scientific Visual Reasoning

Dataset Explorer

DISSECT: Diagnostic Evaluation
of Scientific Visual Reasoning