歩いたら休め

なんでこんな模様をしているのですか?

【本】『クックパッドのデータ分析力』とかを読みました

最近読んだ本について、ざっくり紹介しておきます。

クックパッドのデータ分析力

法人向けにユーザー行動のデータを提供するたべみるというサービスのリニューアルの話です。

「少し先の未来」を予測する クックパッドのデータ分析力

「少し先の未来」を予測する クックパッドのデータ分析力

「リニューアル自体には上の人にも興味を持ってもらえるけど、エンジニアの配置などの優先順位のせいで思う通りには進まなかったけど、いろいろ工夫して実現した!」みたいな話です(めっちゃ雑!)。

話に触れられている範囲は広く、データやWEBのポータルサービスなどの事業に関わっている人なら参考になる部分はある&ちょっと勇気がもらえる話だと思います。

  • 「レシピの検索」という、ユーザーの目的がハッキリしたクックパッドの検索ログが、マーケティングデータとして素晴らしいと気づいた話
  • 事あるごとにリニューアルを提案した話
  • ポータルのデータを使うビジネスが、「材木屋が端材で商売する」ように、仕入れコストや人件費がかからないということ
  • ユーザーのニーズを表す「PI値」などの指標づくり
  • 当時リリースしたばかりのRedshiftがちょうど理想の条件のデータソースだったこと
  • マーケティングの4Pとか3Cとか

自社でも「材木屋が端材で商売する」ようなサービスできないかなあ…。

国家とインターネット

国家とインターネット (講談社選書メチエ)

国家とインターネット (講談社選書メチエ)

@KaitoSSS_さんに教えてもらった本。インターネットやITが、国家、ハッカー文化、企業などの利害が一致したり対立したりで発展してきたことを述べた本です(多分)。難しかったのであんまり理解してません。

みんな大好きポール・グレアムの『ハッカーと画家』や、オープンソース文化について書かれた名著『伽藍とバザール』など、ハッカー(本の中ではクラッカーと区別するため、「倫理的ハッカー」と呼ばれています)の文化や思想について書かれた本はいくつもありますが、それを外(国や企業の視点)からも見て視点を広げた本みたいな印象でした。

  • ハッカー文化は先進的だが、「現実と妥協した」ところのものが普及する。
    • GNUが理想主義すぎて孤立し、後に市場も取り込んだLinuxが普及したこと。
    • 閲覧機能しかない「テレビのような」MOSAICブラウザが最初に普及したこと。(後に編集機能なども追加され広がっていった)
  • ある意味、インターネットやSNSは、情報統制の強い国に対する「諜報活動の民営化」のような効果があった。
    • そのような国の情報も、インターネットに投稿された情報を見ることでアメリカが手に入れることができた。
    • オバマ大統領が、ムバラク政権の弾圧を直接批判(国内問題に干渉)せず、情報を遮断して自由を遮断したことを批判したこと。
  • 80年代当時は冷戦の不安が強く(政治利用のため煽動する政治家もおり)、国家も制御できない可能性も持ったARPAネットを開発するコンピュータ研究者にとってもプラスになった。

プログラマーのはしくれとしては、「現実と妥協した」ものが普及するみたいな話に興味を惹かれました。マーケティング的に「要するにテレビみたいなもんだよ」と言って普及させた後に、高機能なもの(理想に近いもの)が広がっていくという感じですかね。

新自由主義がどうこうみたいな話もあったのですが、適当なことしか言えないので割愛。

Google BigQueryではじめる自前ビッグデータ処理入門

クソザコプログラマーなので、BigQueryのオライリー本を読んでいても「要するに他のサービスに比べて何が便利なの?」って疑問だったので読んでました。主に非エンジニアのための本です。

Google BigQueryではじめる自前ビッグデータ処理入門

Google BigQueryではじめる自前ビッグデータ処理入門

まだ読んでる途中ですが、最初に一般的なビッグデータの話で、次にHadoopとかとの比較や技術の出自みたいな話なので、わかりやすいはわかりやすかったです。

本質的な話じゃないですが、テストデータの文章(アイルランドの諺らしい)がめちゃめちゃかっこ良くて印象的でした。

Dance as if no one's watching, sing as if no one's listening, and live everyday as if it were your last.
だれも見ていないと思って踊れ。誰も聞いていないと思って歌え。最後だと思って毎日を生きろ。

後半Excelツール使ってて逆に面倒くさいです。個人的にはRのbigrqueryとか、Python2系のpandasとかの使い方をのっけてほしい…(じゃあオライリー本読めよ)。