歩いたら休め

なんでこんな模様をしているのですか?

【自動要約】海外のニュースを自動で要約して翻訳して、自動でまとめてくれるプログラムを書ければいいなあ

海外のニュースを簡単に通知できないか試そう(試したい)という記事です。 国内の業界ニュースは当然追っているにせよ、海外に面白い動きがあるのに、全然把握できていないことは多々あります。

とはいえ、私は英語が得意ではないため、自分の興味のあるニュースなのか、おおざっぱでも良いので要約して通知したいと考えています。

ということで、同僚が読んでいた不動産関連のニュースを要約→翻訳してみようと思います。 日本語の自動要約は難しいものの、簡単なAPIやライブラリである程度はできるんじゃないかと踏んでます。

www.zoopla.co.uk

最終行に、都合のいいことに全体の要約があります。

  • The number of people buying a home with a mortgage has bounced back to the level seen before the UK voted to leave the European Union.
  • A total of 40,851 mortgages were approved for house purchase in October, the highest level since May.
  • But the number of loans in the pipeline for homeowners remortgaging to a new deal dipped slightly compared with September and is broadly unchanged since August.

これをGoogle翻訳すると、すごくいい結果が返ってきます。

  • 住宅ローンを持つ住宅を購入する人々の数は、英国が欧州連合を離れることに投票する前の水準まで戻ってきた。
  • 10月の総住宅購入件数は40,851件で、5月以来の最高水準であった。
  • しかし、新規契約に移管する住宅所有者のパイプラインの融資件数は、9月に比べて若干減少したが、8月以降は変わらない。

自動要約には、取り急ぎ、sumyというPythonプログラムを使いました。

github.com

コマンドラインでURLを指定すると使えるようです。なんてお手軽!

とりあえず、3文でまとめてもらうことにしましょう。

sumy lex-rank --length=3 --url="http://www.zoopla.co.uk/discover/property-news/mortgaging-activity-bounces-back-says-bba/#DR1uX77tk3xgULQQ.97"
  • The mortgage figures support anecdotal evidence from estate agents that following a brief dip in confidence after the referendum, buyers are once again returning to the housing market.
  • But despite the increase, mortgages for people buying a house are still 10% lower than they were in October last year, possibly due to affordability constraints following recent strong house price gains.
  • The fact that buyers appear to be returning to the market is obviously good news for people trying to sell a property.

何も考えずにGoogle翻訳に突っ込んでみます。

  • 住宅ローン数値は、住民投票後に安心して短期間で暴落した後、買い手が住宅市場に再び戻ってくる不動産業者からの事例を裏付けている。
  • しかし、住宅価格の上昇にもかかわらず、家を購入する人々の住宅ローンは、最近の強い住宅価格の上昇に伴う手頃な価格の制約のため、昨年10月の住宅ローンよりも10%低い。
  • バイヤーが市場に戻っているように見えるという事実は、財産を売ろうとしている人にとっては明らかに良いニュースです。

要約…というにはちょっと微妙な気がします。

要約さえきちんとできれば、最近精度が大幅に向上したGoogle翻訳でなんとかなりそうです。