あれ2025/5/28 16:15:00 RAG・MCPありきのLLMモデルとかあったら小規模にできて楽しそう。 知識そのものを覚えてるんじゃなくて、どこに知識があるかを覚えてるみたいな感じ。 MCPに繋いだままGRPOにかける。