MJEPA

mentions 1 type Organization feed RSS

// recent coverage 1 mentions

04:00

2026-06-25

arxiv.org

machine-learning

MJEPA: A Simple and Scalable Joint-Embedding Predictive Architecture for Audio-Visual Learning

Researchers introduced MJEPA, a joint-embedding predictive architecture for audio-visual learning that uses a single unified encoder and a single predictive objective. The model outperforms prior froz…

// co-occurs with top 4 entities

AudioSet-20K 1 ESC-50 1 FSD50K 1 ViT-g 1