人工智能領域的權威專家吳恩達 (Andrew Ng) 近期指出,大型語言模型(LLM)的發展趨勢正從單純的回答問題轉向融入智能體工作流程,這將大幅提升智能體的性能。
吳恩達是誰?他是 Google Brain 的聯合創始人,曾領導 Google X 團隊中的深度學習項目,也是線上教育平台 Coursera 的聯合創始人。他在機器學習、深度學習和人工智能領域享有盛譽,他的研究成果和線上課程影響了全球數百萬人。
過去,LLM 主要被訓練用於回答問題或遵循人類指令,以提供良好的消費者體驗。例如,我們常用的 ChatGPT、Claude 或 Gemini 等聊天機器人,就是透過大量的問答數據和指令微調來學習如何更好地理解和回應人類的需求。
然而,智能體工作負載需要不同的行為模式。智能體需要像一個有目標的個體,能夠主動執行任務,而不是被動地等待指令。這需要 LLM 能够反思自身輸出、使用工具、編寫計劃以及在多智能體環境中進行協作,才能更好地完成任務。
現在,主要的模型製造商正越來越多地將 LLM 優化用於 AI 智能體。例如,Google 的 Bard、微軟的 Bing Chat 等,都開始整合工具使用和 API 調用功能,讓 LLM 可以執行更複雜的任務。Anthropic 最新發布的 Claude 3.5 Sonnet 甚至能像人一樣使用電腦,這代表了 LLM 原生使用電腦方向的一大步。
吳恩達認為,許多開發者正在 prompting LLM 來執行他們想要的智能體行為,而主要的 LLM 供應商也正將工具使用或電腦使用等功能直接構建到他們的模型中。
Vinci AI點評:
LLM 融入智能體工作流程是 AI 發展的重要趨勢,這將使 AI 系統能夠執行更複雜的任務,並在各個領域發揮更大的作用。 未來,LLM 與智能體的結合將如何發展,以及如何應對 AI 安全等挑戰,將是值得關注的議題。