概要

高安研究室とは

金融システム作成中

ディーラーモデル

金融システム

暴騰・暴落

金融システム 作成中

板情報

金融システム

PUCKとは

ネットワーク 作成中

企業間取引ネットワーク

Web上の口コミ

ソーシャルメディア

購買行動作成中

POSシステム

GPS人流データ

COVID-19感染予測

GPS人流データ作成中

人流モデル

腸内細菌叢作成中

生態系モデル

Web上の口コミ

インターネットの掲示板やブログでは、日々様々な記事が書き込まれている。 最近、このようなWEB上の膨大なテキストデータを自動的にサーチし、秒単位のタイムスタンプつきで集積する情報技術が開発され、人間の社会的集団的な行動を定量的に観測することができるようになった。 (株)電通が開発した「電通バスリサーチ」というWEB上の単語のサーチエンジンが、電通との共同研究という形で高安研究室に提供されており、これを用いて独自に観測した時系列データの解析とモデル化を行っている。

通常の単語の場合、発生頻度はある平均値のまわりでランダムに揺らいでいるが、
「KY(空気読めない)」「ニコニコ動画」「食べるラー油」
のように時間とともに指数関数的に発生頻度が増加するような事例を見つけることができる(下図)。
また、指数関数以外の関数形で近似できるような増加・減少するような変動、さらには、有限時間で発散するような傾向を示すような事例もあることがわかってきている。 例えば、『人のうわさも七十五日』ということわざがあるが、データ解析によって、定量的にことわざの信憑性を議論することもできる。

無数にある単語の中からこのような特徴的な変動を示す単語をいち早く検出し、 その出現頻度の将来の増減を予測する技術は、“社会のニーズ”や“流行”をいち早く商品開発に結び付けたいマーケティングの分野において重要な基盤研究となる。 膨大な量の単語の発生頻度のデータを解析するためには、与えられたデータから、システマティックなノイズ成分や確率的なゆらぎの成分、さらには、動力学的な成分を分離する手法が不可欠である。 また、特徴的な変動から未来の増減を予測するためには、数理モデルを構築することも必要である。 また、WEB情報を参照した人間の集団的な書き込み行動に普遍的な振る舞いのパターンがあるとすれば、その普遍性を生み出すメカニズムを解明することは統計物理学の観点からも重要である。

口コミ数時系列サンプル

指数的な増減をする口コミの例「KY(空気読めない)」

(文責:佐藤和也 2014)