第12章 データマイニング分野におけるGNN
はじめに
データマイニングは,大量のデータからパターンや知識を抽出することを目指している(Han et al., 2022). こうした現実世界で得られる大量のデータは,グラフとして自然に表現できる形を持っている. 例えばWeb上では,Facebookの友だち関係やX(旧Twitter)のフォロー関係といった「SNSユーザ間の関係」はソーシャルグラフとして,また,ECサイトにおける「ユーザとアイテム間の過去のインタラクション」は二部グラフとして表現できる. この二部グラフでは,ユーザとアイテムを2つのノード集合とし,それらの間のインタラクション(購入や閲覧など)がエッジを形成する. さらに,都市・地域内の道路および道路の一区画は,それらの間の空間的関係を通して相互に依存していることが多い. これらの空間的関係は,道路や道路の一区画をノードとし,それらの間の空間的関係をエッジとした交通ネットワークによって表現することができる.
以上のことから,GNNはデータマイニングの様々なタスクの推進にごく自然に適用されている. 本章では,「Webデータマイニング」「都市データマイニング」「サイバーセキュリティ・データマイニング」といった代表的なデータマイニングタスクにGNNがどのように適用されるかをみていく.
目次
- 12.1 はじめに
- 12.2 Web データマイニング
- 12.2.1 ソーシャルネットワーク分析
- 12.2.1.1 社会的影響の予測
- 12.2.1.2 社会的関係性の特徴量学習
- 12.2.2 推薦システム
- 12.2.2.1 協調フィルタリング
- 12.2.2.2 アイテムに関する付加情報を用いた協調フィルタリング
- 12.2.2.3 ユーザに関する付加情報を用いた協調フィルタリング
- 12.2.1 ソーシャルネットワーク分析
- 12.3 都市データマイニング
- 12.3.1 交通量の予測
- 12.3.2 大気質予測
- 12.4 サイバーセキュリティ・データマイニング
- 12.4.1 悪質アカウントの検出
- 12.4.1.1 アカウントとデバイスに基づいたグラフの構築
- 12.4.1.2 GNN による悪意あるアカウントの検出
- 12.4.2 フェイクニュース検出
- 12.4.2.1 ニュース記事に基づいたグラフの構築
- 12.4.2.2 グラフ分類タスクとしてのフェイクニュース検出
- 12.4.1 悪質アカウントの検出
- 12.5 本章のまとめ
- 12.6 参考文献