Yamamotoの日記

Yale SOM MBA、金融工学、技術関係の記事を書きたいです

機械学習を使ってお買い得中古物件を探す~スクレイピング編~

www.analyze-world.com

こちらの記事に着想を得てやってみました.。元記事は賃貸物件を探しますが、僕は中古物件を探しています。 まずはSuumoのサイトからデータを取得します。Suumoのサイトにはスクレイピング禁止とは書いてなかったけど、問題あったら誰か教えて下さい。 巨大なデータになるのでCSVで保存したくない。。。データベースの勉強も必要ですね。

データがとても汚いので、前処理が大変そう。