t_wの輪郭

あれ

gzip

2023/7/13 15:00:00
CompressionStream『CompressionStream でブラウザで gzip 圧縮する』gzipでスパム判定onnxruntime-nodeでgzipで圧縮したonnxファイルを読み込むあれ

あれ

2023/7/13 16:24:00

そういうわけでgzipでSentence Embeddingが作れるんじゃないかと予備実験してみるとこんな感じ。そこまでパキッとしてないのでそんなに精度が出なさそうな感じがある。類義語をうまく取り扱えてないという感触。

類義語はともあれ、同じ文字が使われていれば類似度が出るので、最低限のベースラインとしては使えそう。

ちなみに、「類似度」というラベルで出しているが、サイズの比になるので、この値は小さいほど類似度が高いということになっている。