網頁試算表「下一步操作」預測的評估基準與框架
為何重要
這項研究提供了試算表自動化的關鍵評估指標,驗證了針對特定領域工作流(如財報分析、資料維護)微調小型語言模型(SLM)的可行性與優勢。對於工具開發者而言,這意味著未來 Excel 類產品可能會內建專門的「行動預測 Agent」來降低操作門檻,這將是辦公軟體智慧化的重要趨勢。 儘管影響目前財報或投資決策有限,但該研究反映了從「泛用程式碼補全」轉向「垂直領域特定操作預測」的技術演變。
目前業界的預測式自動完成技術多集中於程式碼編輯,但網頁試算表因為使用場景更廣泛,卻幾乎缺乏相關作法。為填補這個缺陷,研究團隊建構了一套基準框架,用於評估系統根據使用者歷史記錄預測未來操作的表現。
- 資料來源:手動建構 52 組序列,共計 12,000 個操作作為評估基準,並以此重建公開資料庫中的試算表。
- 技術挑戰:研究指出兩大難點:公開資料庫缺乏編輯歷史紀錄,以及試算表操作空間在空間、時間與複合層級上的複雜性。
- 評估機制:採用線上評估框架,要求模型在每次使用者行動後立即預測下一步,並根據接受與否動態更新未來的預測路徑。