t_wの輪郭

けいしょう
類似度継承検索性の継承描写埋め込みの難しさ2022年10月5日日記あれ

類似度継承

2023/11/9 14:23:00

検索語と検索対象の類似度によって順位付けを行う検索において、検索対象の上位に紐付けられたものの類似度を、検索対象の類似度として合算してしまうという手法

ある検索対象自身の類似度がたまたま高くなってしまって、検索結果においてノイズとなる可能性があるが、複数の類似度の合算とすることで、類似度のブレを抑えることが出来る。

  • 文章の部品として使った場合、文章の不調和が顕になる。
    • 論理的つながりの不和があらかじめわかるという利点としてみることもできる
    • 文章の書き方の不一致が生じる
      • 「です、ます」、「だ、である」の不一致
      • 段落で字下げをするかしないかの不一致
      • 見出しの粒度の不一致
  • 変化する

 プログラミングでたまに言われる、「関数として共通化するよりコピペしたほうが良い」みたいなところがある。早すぎる抽象化だ。

 描写埋め込みが強力であると見ているが、関数継承同様に「大いなる力には、大いなる責任が伴う」ということだろうか。