R Advent Calenderの18日の記事(の草稿)です
「お手持ちのデータをネットワークとして扱う」までをお手伝いする記事です。
「複雑ネットワーク」「ネットワーク解析」という言葉を聞き、自分の仕事や研究にも役立つかもと思い「スケールフリー性」「○○中心性」「6次の隔たり」などのキーワードをひととおり勉強された方も多いと思います。ネット上にも資料はゴロゴロしています。
しかし、いざ手持ちのデータをネットワーク解析しようとすると、案外「データをネットワークに変換する作業」の部分を詳しく書いている資料が無くて困った覚えが私にはあります。
知らない人のために書いておくと、複雑ネットワーク(complex network)ないしネットワークサイエンスは、数学のグラフ理論から発展した分野です。
この分野では「頂点(node)」と「枝(edge)」で様々なものとものの繋がりや相互作用を定式化しようという方法をとります。いろいろな対象をネットワークとして捉えることができ、例えばSNS上の人と人との繋がり方や、WEBサイトのネットワーク、自然言語処理の共起ネットワークなどがあります。
①枝リストの考え方→疎行列みたいなの
②行列に変換しなくてもいいよ! add.edge
③実際にデータを使って描いてみよう
枝リストの考え方
ネットワークの表現の仕方