t_wの輪郭

言語モデルというやつが何をやってるかというと、「次の単語は何か？」を学習・予測している。コンピューターの世界においては文字や単語は数値として処理されている。すなわち、言語モデルは数値の時系列予測をしていると言える。この抽象から導き出される具象として、言語モデルは株価という数値を予測可能ということだ。

同じことを考える人はやはりいて、『AI(Transformer)を用いた株価予測』という記事が見つかった。

あれ

Transformer 時系列予測

『Yes, Transformers are Effective for Time Series Forecasting (+ Autoformer)』

2023/7/5 11:11:00

https://huggingface.co/blog/autoformer

Transformerは株価予測ができる？

Cartesian Genetic Programmingで文章の類似度を学習 knownetにベクトル検索を実装 Transformer GPGPU 言語モデル Attention tzmtwtr/tw-posts-ja 再帰的な構造

あれ

2023/6/22 12:05:00

遺伝的プログラミングで文章の類似度を学習させるの、CPUで一から学習させるには計算量が全然足りない。GPGPUで学習させたいが、再起的な構造と処理によって文章を処理しているために、GPGPUとは相性が悪い。構造から手をつけるべきか。

Transformerを参考にすると良さそうだが、あれを理解するのに手間取っている。さらに言えばAttentionも理解できていない。あり物のモデルを使ったり学習させるだけなら理解は不要だが、遺伝的プログラミングに組み込もうとすると十分に理解する必要がある。

普通の言語モデルも一から学習させると相応に時間がかかるだろうし、一晩で学習が進まないのを嘆くのは気が早すぎるかもしれない。私の投稿を学習データ化した物でさえ、一晩でやっと一巡できる程度だ。Wikipediaも学習データに含み出すととんでもない時間がかかる。

あれ