t_wの輪郭

Finetuningfine tuning機械学習
『[2501.05707] Multiagent Finetuning: Self Improvement with Diverse Reasoning Chains』『Fine-tuning a pretrained model』『Examples — transformers 2.2.2 documentation』あれあれ

あれ

2024/4/22 9:54:00

llama.cppでfinetuningためしとるけども、全然うまくいってないな。

素直にTransformers使うべきなんか。
でもなーPythonやだしなー。

SFT

2024/4/21 12:48:00

Supervised Fine-tuning