MVEB：大型視訊嵌入基準測試

研究 1 個來源 · 1 小時前

為何重要

提供開發者一個標準化的框架來評估視訊模型能力，並揭示設定對模型效能的實際影響。

Hugging Face Daily Papers 發布了 Massive Video Embedding Benchmark (MVEB)，這是一個包含分類、配對分類、檢索和視訊問答等 23 個任務的評測集。評估發現 MLLM-based embeddings 與 multimodal binding 各有千秋，並揭示了音訊與視覺標註來源對跨模態效能的關鍵影響。該基準已整合進 MTEB 生態系統供統一評估。

MVEBvideo embeddingbenchmarkmultimodalMTEB

來源 · 1 篇報導

首發 Hugging Face Daily Papers huggingface.co 04:00

MVEB：大型視訊嵌入基準測試

來源 · 1 篇報導

相關動態 · 研究