美格知识库
Search
搜索
暗色模式
亮色模式
探索
标签: 训练
此标签下有1条笔记。
2026年5月21日
Agentic-RL(智能体强化学习)
RL
SFT
GRPO
PPO
LoRA
训练
强化学习