画像認識、自然言語処理、ネットワークなどの様々な解析のテストに使えそうなオープンデータについてのまとめサイトを教えてもらいました。
この中から、Stanford Large Network Dataset Collectionの中から、Facebookユーザー約4千ノード(人)のデータを使ってネットワークを書いてみました。
ココで公開されているSNAPというパッケージも試してみたかったのですが、なぜかインストールできなかったので断念。python+networkxで読み込んで、Gephiで描画してみました。facebook_combined.txt.gzが枝リストの形式で扱いやすいです。
ただ、ネットワーク構造のデータのみなので、他の属性(性別、年齢など)を絡めた分析はできなさそうです。
ただし、ソーシャルだけでなく道路やAmazonのデータもあるようなので、ネットワークどうしの比較などを試してみたら面白そうです。
他にもこういうまとめもあります。