RFMiD

mentions 1 type Organization feed RSS

// recent coverage 1 mentions

04:00

2026-05-27

arxiv.org

computer-vision

Benchmarking Convolutional, Transformer, Hybrid, and Vision Language Models for Multi Disease Retinal Screening

A new study benchmarked twelve deep learning architectures across four model families—convolutional neural networks, vision transformers, hybrid CNN-transformer backbones, and vision-language models—f…

// co-occurs with top 6 entities

Messidor-2 1 SwinTiny 1 CoAtNet0 1 MaxViTTiny 1 CLIP ViT-B/16 1 SigLIP-Base384 1