ai.doge.tg 繁體 AI 情報 最新 專案 搜尋 Telegram ↗

網頁試算表「下一步操作」預測的評估基準與框架

研究 1 個來源 · 3 小時前
為何重要

這項研究提供了試算表自動化的關鍵評估指標,驗證了針對特定領域工作流(如財報分析、資料維護)微調小型語言模型(SLM)的可行性與優勢。對於工具開發者而言,這意味著未來 Excel 類產品可能會內建專門的「行動預測 Agent」來降低操作門檻,這將是辦公軟體智慧化的重要趨勢。 儘管影響目前財報或投資決策有限,但該研究反映了從「泛用程式碼補全」轉向「垂直領域特定操作預測」的技術演變。

目前業界的預測式自動完成技術多集中於程式碼編輯,但網頁試算表因為使用場景更廣泛,卻幾乎缺乏相關作法。為填補這個缺陷,研究團隊建構了一套基準框架,用於評估系統根據使用者歷史記錄預測未來操作的表現。

  • 資料來源:手動建構 52 組序列,共計 12,000 個操作作為評估基準,並以此重建公開資料庫中的試算表。
  • 技術挑戰:研究指出兩大難點:公開資料庫缺乏編輯歷史紀錄,以及試算表操作空間在空間、時間與複合層級上的複雜性。
  • 評估機制:採用線上評估框架,要求模型在每次使用者行動後立即預測下一步,並根據接受與否動態更新未來的預測路徑。
SpreadsheetsBenchmarkLLMAuto-completionAutomation

來源 · 1 篇報導

首發 Hugging Face Daily Papers huggingface.co 04:00