t_wの輪郭

「欲しいものをもっと」算法強化学習活用と探索レコメンド

あれ

2021/3/2 15:46:00

強化学習においては学習が進むにつれて探索優先から活用優先に変わっていくのが定石とされている。しかし、レコメンドシステムにおいては活用優先から探索優先に変わっていくのがいいかもしれない。利用者の飽きを防止できる。

あれ

あれ

2021/3/2 16:04:00

推薦が無視されたときに、負の報酬を与えると探索的になる。