なぜかPandasがインストールできず、標準ライブラリのみで書くことがありました。意外となんとかなったものの、ものすごく手間取ってしまったため簡単なメモを残しておきます。
tsvファイルの読み込み
import csv
tsv = csv.reader(file("data.tsv"), delimiter = '\t')
時間の変換
import datetime
import time
#tstrは"2012-10-13 11:22:33"みたいな形式の文字列
tdatetime = datetime.datetime.strptime(tstr, '%Y-%m-%d %H:%M:%S')
year = tdatetime.year #年を取り出す
month = tdatetime.month #月を取り出す
unixtime = int(time.mktime(tdatetime.timetuple())) #unixtimeに変換
多次元リストのソート
URD0027 | ささら | 10月10日 |
URD0333 | カティア | 3月3日 |
URD0151 | しめじ |
4月6日 |
を、多次元リストで表現したときのソート方法。
output = ["URD0027","ささら","10/10"],["URD0333","カティア","3/3"],["URD0151","しめじ","4/6"]
#リスト(output)内の
0番目、1番目、7番目の要素でソート
#ソートする順番は0→1→7
output.sort(key=lambda x:(x[0],x[1],x[7]))