NVIDIA 於業界首個 Agentic AI 基準測試中展現領先的 Agentic Coding Performance

工具 2 個來源 · 1 天前

為何重要

此舉確立了評估 LLM 推論系統在 Agent 應用情境下效能的標準，協助開發者與企業精準選擇硬體解決方案。

AI agents 顯著提升了推論工作負載的複雜程度，過去業界難以制定統一的標準來衡量這類系統的效能表現。Artificial Analysis AgentPerf (AA-AgentPerf) 這項業界首個多供應商開放基準測試，旨在追蹤並評估具備代表性的真實世界 AI agent 編碼任務概況。

NVIDIAArtificial AnalysisAA-AgentPerfAI agentsBenchmarkCoding

相關動態 · 工具