ai.doge.tg 繁體 AI 情報 最新 專案 搜尋 Telegram ↗

VisualClaw:用於物理世界的即時、個人化 Agent

工具 1 個來源 · 2 天前
為何重要

解決了即時部署視覺 Agent 的技術壁壘,讓高成本的 VLM 能在邊緣裝置或受限環境中以更低的運算負擔運作,並透過自我進化適應複雜的物理世界任務。

VisualClaw 透過混合編碼技術過濾無用視訊幀並壓縮技能庫,將視覺語言模型(VLM)的 API 成本降低高達 98%,並具備從歷史錯誤中自學的能力以提升準確率。

VisualClawVLMEdge-ComputingSelf-EvolvingVideo-QA

來源 · 1 篇報導

首發 Hugging Face Daily Papers huggingface.co 04:00