網頁試算表「下一步操作」預測的評估基準與框架

研究 1 個來源 · 3 小時前

為何重要

這項研究提供了試算表自動化的關鍵評估指標，驗證了針對特定領域工作流（如財報分析、資料維護）微調小型語言模型（SLM）的可行性與優勢。對於工具開發者而言，這意味著未來 Excel 類產品可能會內建專門的「行動預測 Agent」來降低操作門檻，這將是辦公軟體智慧化的重要趨勢。儘管影響目前財報或投資決策有限，但該研究反映了從「泛用程式碼補全」轉向「垂直領域特定操作預測」的技術演變。

目前業界的預測式自動完成技術多集中於程式碼編輯，但網頁試算表因為使用場景更廣泛，卻幾乎缺乏相關作法。為填補這個缺陷，研究團隊建構了一套基準框架，用於評估系統根據使用者歷史記錄預測未來操作的表現。

資料來源：手動建構 52 組序列，共計 12,000 個操作作為評估基準，並以此重建公開資料庫中的試算表。
技術挑戰：研究指出兩大難點：公開資料庫缺乏編輯歷史紀錄，以及試算表操作空間在空間、時間與複合層級上的複雜性。
評估機制：採用線上評估框架，要求模型在每次使用者行動後立即預測下一步，並根據接受與否動態更新未來的預測路徑。

SpreadsheetsBenchmarkLLMAuto-completionAutomation

來源 · 1 篇報導

首發 Hugging Face Daily Papers huggingface.co 04:00

網頁試算表「下一步操作」預測的評估基準與框架

來源 · 1 篇報導

相關動態 · 研究