微軟開源 SkillOpt 框架|自動提升 AI 智能體效能無需修改模型權重
微軟推出開源框架 SkillOpt,將智能體技能文件轉化為可訓練對象,透過深度學習式機制自動調整指令,無需修改底層模型權重。該框架解決了手動調整技能時常見的步長控制及驗證問題,在多項基準測試中顯著提升 AI 準確度。
【揀報】微軟 (Microsoft) 推出開源框架 SkillOpt,旨在提升智能體 (Agent) 技能而無需修改底層模型權重。該框架將 Markdown 格式的技能文件轉化為可訓練對象,透過類似深度學習的機制自動調整指令組合。微軟亞洲研究院研究員楊一凡 (Yifan Yang) 指出,傳統手動調整存在三大失效模式,包括缺乏步長控制導致技能漂移 (skill drift)、缺乏驗證導致效能下降,以及缺乏負面記憶令錯誤重複出現。
SkillOpt 透過「提議-測試」迴圈 (propose-and-test) 運作。系統會先凍結目標模型,執行任務批次以生成執行軌跡 (execution trajectories),再由優化器 (Optimizer) 分析成敗並提出結構性編輯建議。楊一凡表示:「問題不在於能否修改技能,而在於無法保證修改是否帶來改進 (improvement)。」為防止準確度大幅波動,SkillOpt 引入「編輯預算 (edit budget)」限制修改幅度,並透過驗證集 (validation set) 確保改動有效,機制與深度學習中的學習率 (learning rate) 相似。
在多項行業基準測試中,SkillOpt 顯著提升了大型語言模型的準確度。在處理合約、發票等文件數據提取任務時,表現尤為出色。楊一凡強調,這項技術改善的是「可靠性 (reliability)」,而非單純死記硬背。目前 SkillOpt 已在 GitHub 開源,採用 MIT 授權,方便開發者整合至現有 AI 基礎設施。
新聞來源:《VentureBeat》