歩いたら休め

なんでこんな模様をしているのですか?

2013-01-01から1年間の記事一覧

【Python】YouTubeのURLリストのリンク切れをチェックするためのコード

歌謡ロックbotのリンク切れを直しています。歌謡ロックbotはひたすらYouTubeのPVを流すだけのアカウントで、予め登録した曲のリストから一定時間おきに投稿します。 以前はリンク切れカッターが使えたのですが、YouTubeの仕様が変わったのか、このツールでは…

【Python】nltkでロシア語の自然言語処理ができないか調査中、とりあえず歌詞の頻出単語ランキング

主に参考にしたのはこの記事 映画「The Social Network」の脚本をNLTKで解析して遊んでみた - ぬいぐるみライフ(仮) ロシア語でも基本的に同じことができると思います。Pythonでやるならこの本が非常に参考になるでしょう(英語&日本語でやってます)。 入…

【Python】pandasで枝リストの形式にデータを変換する

import pandas as pd #ファイルを読み込む pixivdata = pd.read_csv("aikatsunet/pixivdata.csv",encoding="utf-8") #不要なカラムを消す del pixivdata["userID"] del pixivdata["date"] print pixivdata #カラム名からキャラクター名を取得 chara = pixivd…

【R】【Python】igraphやNetworkXで手持ちのデータをネットワークに変換してみよう

R Advent Calenderの18日目の記事です 「お手持ちのデータからネットワークを作成をしてみよう」というテーマです。 Rを使ったネットワークの解析(次数や媒介中心性、コミュニティ検出etc...)のやり方については様々な方が本やブログにまとめてらっしゃい…

【Python】【pixiv】pixivAPIから、アニメキャライラストのタグデータをcsvで出力する

pixivは(基本的に)APIを公開しておらず、ログインした状態で全てのページを情報を参照する方法が無いか長らく悩んでいました。以前、よくわからないpixivAPIを使って、ログインしていない状態で取得できる限られたデータからアニメの人間関係ネットワーク…

【Python】魔法少女まどか☆マギカ考察Wikiの各話別台詞集をpandasのデータフレームに変換する

@Med_KUさんがラブライブ各話のキャラに向けたセリフのネットワークを描いてらしたので、同じことをPythonでもできないかと画策中。 (余裕があったらやりたいですが)さすがにアニメ全話見返してセリフを写経する時間は無いので、魔法少女まどか☆マギカ考察…

【R】igraphを使ってお手持ちのデータをネットワークにしてみよう

R Advent Calenderの18日の記事(の草稿)です 「お手持ちのデータをネットワークとして扱う」までをお手伝いする記事です。 「複雑ネットワーク」「ネットワーク解析」という言葉を聞き、自分の仕事や研究にも役立つかもと思い「スケールフリー性」「○○中心…

【Python】wav形式の音声ファイルをPythonで再生&波形をプロット

音楽の特徴量抽出器みたいなのを作ったらボロ儲けできるんじゃないかと思っていろいろ調べてみています。アメリカのインターネットラジオPandoraのミュージックゲノム計画も、専門家の人海戦術で特徴量を抽出しているようですし、そこを自動化できたら目があ…

【Python】matplotlibのグラフ描画が便利そうなのでメモっとく

この間から、Pythonのグラフ描画ライブラリであるMatplotlibを使ってNetworkXのアニメーションを作ってみています。 このMatplotlibがかなり高機能で、物理シミュレーションの可視化にも便利なんじゃないかな~と思い始めてきました。 ギャラリーを見ると様…

【Python】NetworkXのネットワーク描画をmatplotlibでgifアニメ化

ニコニコ動画のボーカロイド共演ネットワーク - 驚異のアニヲタ社会復帰への道 ↑これと似たようなものをPythonで再現してみよう企画その2 前回は適当な線グラフをmatplotlib+ImageMagickでgifアニメにしましたが、今回Pythonのネットワークを扱うパッケージ…

【Python】matplotlibでグラフのgifアニメを作成

Rではanimationというライブラリでgifアニメが作れるという話を聞き、Pythonでも同じことができないかどうか調べてみました。 具体的には↓の記事でRを使ってやってることです。 これからの可視化は動画の時代~Rでanimationパッケージで動画を作成する方法@T…

【Python】python-igraphをインストールしました でもグラフのプロットだけできない

今までネットワークを扱う際にPythonのnetworkxを使っていましたが、igraphがCを使ったパッケージだと聞いて、計算早いんじゃないかと期待してインストールしてみました。 networkxを遅いと感じたことはありませんが、ネットワークシミュレーションもやって…

【Twitter】【Topsy】TopsyAPIについて調べています

Twitterの検索結果を利用するのに、公式が提供しているAPIよりTopsyのAPI使ったほうが良さそうなので調べてみています。Twitter公式APIだと古いデータ(一週間前くらいより以前)が取れないのがキツすぎです。 このTopsyAPI、以前はだれでも自由に使えていて…

【自己紹介】マイクテスト、マイクテスト

RやPython、その他勉強したことについて書き残していきたいと思います。 FC2ブログもやってますが、はてなブログのほうがマジメな話をしてる人が多いので、まあ使いわけようと思ってます。 とりあえず以上です。