2020-05-14から1日間の記事一覧

線形回帰について ーデータクレンジング編その②

線形回帰のデータクレンジング編その①の続きです。 前回は、 ざっと欠損値の確認、及び外れ値の処理について、確認した。 外れ値をquantileで削ることで、幾分か分布が緩やかになった。 もう一度その分布をみておく。 いい感じですね。 そして、再度、クリー…

線形回帰について ーデータクレンジング編その①

今日はPythonの実装のアウトプット。 まだまだ知らないことがたくさんあるので、そこは、勉強勉強。 今回のメインテーマはデータクレンジング。 主に2点ある。①欠損値の処理 ②外れ値の処理について、学んだのでそれをおもむろにアウトプット。今回扱うデータ…