Introspective Tips: Large Language Model for In-Context Decision Making
論文討論了使用大型語言模型 (LLM) 進行上下文決策制定的方法。
近年來,大型語言模型 (LLM) 已經在自然語言處理領域產生了重大影響,在多種任務中取得了出色的結果。在這項研究中,作者使用“內省提示”來幫助 LLM 自我優化其決策制定。通過內省地檢查軌跡,LLM 生成簡潔且有價值的提示,來改進其政策。
這種方法在很少或沒有示例的情況下提高了代理的表現,考慮了三個重要場景:從代理過去的經驗中學習、集成專家演示,并泛化到不同的游戲。
重要的是,我們實現這些改進并不需要微調 LLM 參數,而是調整提示以概括上述三個場景的洞察力。我們的框架不僅支持,而且強調使用 LLM 進行上下文決策制定的優勢。通過超過 100 個 TextWorld 游戲的實驗,我們展示了我們的方法的優勢。
論文: https://www.aminer.cn/pub/646aecaad68f896efa05a6f6
![]() |
機器人底盤 Disinfection Robot 消毒機器人 講解機器人 迎賓機器人 移動機器人底盤 商用機器人 智能垃圾站 智能服務機器人 大屏機器人 霧化消毒機器人 紫外線消毒機器人 消毒機器人價格 展廳機器人 服務機器人底盤 核酸采樣機器人 機器人代工廠 智能配送機器人 噴霧消毒機器人 圖書館機器人 導引機器人 移動消毒機器人 導診機器人 迎賓接待機器人 前臺機器人 消殺機器人 導覽機器人 |