t_wの輪郭

onnxruntime-nodeでgzipで圧縮したonnxファイルを読み込むonnxに変換して量子化するコマンドBERTONNX

あれ

2023/12/2 15:24:00

500MBあるBERTをONNXに変換した後に量子化したら110MBほどになってLambdaで動かせるようになった。
Githubに乗せるファイルは100MB以下でないとだめなので、ダメ押しでgzipで圧縮したら75MBになった。

あれ