t_wの輪郭

ONNX

2021/9/8 3:30:00

『ONNXとは言語である：高橋かずひとの備忘録。』ONNX Runtime ONNX Runtime GenAI sherpa-onnx-node 『[Rust] ortでonnxモデルを使って推論したりWASMにしたりしてみる | DevelopersIO』あれあれ onnxruntime onnxruntime-nodeでgzipで圧縮したonnxファイルを読み込む onnxに変換して量子化するコマンド transformers.onnx あれあれ netron mrsekut-p『ONNX』「ONNXはOpen Neural Network Exchangeの略称で、推論で広く使用されている機械学習モデルのフォーマットです。」Open Neural Network Exchange ONNX Runtime Web

『ONNXとは言語である：高橋かずひとの備忘録。』

2026/5/10 1:39:00

https://techbookfest.org/product/c6DSVV4s9NsZHAzi9EF8vg?productVariantID=7Remf4C8WYiHQieQKCXaMq

生成AI ONNX ONNX Runtime

ONNX Runtime GenAI

2025/1/3 15:32:00

『Ryzen AI ソフトウェア』『GitHub - microsoft/onnxruntime-genai: Generative ...

ONNX Runtime

2025/1/3 15:32:00

ONNX Runtime GenAI ONNX Runtime Web

sherpa-onnx-node

2024/9/29 12:59:00

『[Rust] ortでonnxモデルを使って推論したりWASMにしたりしてみる | DevelopersIO』

2024/6/6 22:51:00

https://dev.classmethod.jp/articles/ort-wasm/

あれ

2023/12/30 5:23:00

ONNX BERT onnxに変換して量子化するコマンド

あれ

2023/12/2 15:24:00

500MBあるBERTをONNXに変換した後に量子化したら110MBほどになってLambdaで動かせるようになった。
Githubに乗せるファイルは100MB以下でないとだめなので、ダメ押しでgzipで圧縮したら75MBになった。

onnxruntime

2023/12/2 15:17:00

onnxruntime-web 『microsoft/onnxruntime-training-examples: Examples for using ONNX Runtime for model training.』onnxruntime-node

ONNX Transformers

transformers.onnx

2023/11/27 11:52:00

onnxに変換して量子化するコマンド

ONNX gzip onnxruntime-node

onnxruntime-nodeでgzipで圧縮したonnxファイルを読み込む

2023/12/2 15:17:00

const onnx_zip = fs.readFileSync('./sonoisa_sentence-bert-base-ja-mean-tokens-v2_onnx/model_quantized.gz');
const onnx_buffer = zlib.unzipSync(onnx_zip)
const session = await ort.InferenceSession.create(onnx_buffer);

Next.js ONNX Next.jsでサーバーレスSentence Embedding

onnxに変換して量子化するコマンド

2023/12/2 9:38:00

python3 -m transformers.onnx --model=sentence-transformers/paraphrase-multilingual-mpnet-base-v2 onnx/ --opset=18

optimum-cli onnxruntime quantize --onnx_model ./onnx --output onnx_quantize/ --arm64