音楽ナタリーは素晴らしいサイトなのですが、RSSを登録していると自分の興味のないアーティストまで流れてきてしまい、ちょっと不便に感じることがあります。
そこで、ナタリーのRSSをいい感じに整形してくれるためのライブラリを作りました。
cron等での定期実行を想定しているため、「(もしプログラムを24時間ごと起動させるなら)24時間以内の記事をチェックする」というような設定ができるようにしています。
import nataliechecker # 24時間前までの布袋寅泰の記事を取得する checker = nataliechecker.checker(exec_span=24, target_tags=['布袋寅泰']) urls = checker.get_articles() print(urls) # [{'updated_parsed': time.struct_time(tm_year=2016, tm_mon=4, tm_mday=15, tm_hour=14, tm_min=36, tm_sec=0, tm_wday=4, tm_yday=106, tm_isdst=0), 'title': '布袋寅泰ベスト盤、本人こだわりの曲順で収めた全51曲を発表', 'url': 'http://natalie.mu/music/news/183835', 'tags': ['ベスト盤', '布袋寅泰']}]']}]
target_tagsを与えなければ、全ての記事を除外せずに残します。
checker = nataliechecker.checker(exec_span=24, target_tags=['布袋寅泰']) urls = checker.get_articles()
この結果をTwitterに投稿すれば簡易的なニュースbotが作れますし、Slackのチャンネルを作るのもいいかもしれません。
RSSをparseするfeedparserというライブラリがすごく便利でした。