Kaggle's 30 Days of ML - Day9
Kaggleの初心者向けプログラム「30 Days of ML」に挑戦中。
Day9の課題
- the Intro to ML CourseのLesson 3のチュートリアルを読む
- the Intro to ML CourseのLesson 3のexerciseを実施する
- the Intro to ML CourseのLesson 4のチュートリアルを読む
- the Intro to ML CourseのLesson 4のexerciseを実施する
the Intro to ML CourseのLesson 3の内容
- モデリングのためのデータを選ぶ
覚えておきたいと思った点
- 予測の手順:
- 予測対象のデータを決める
- 予測に使うデータ(特徴)を決める
- モデルを構築する
- Pandasでは、読み込んだcsvデータに対して以下の操作が可能
data.columns
で列の見出しを取得data.列名
で列のデータを取得data[列見出しリスト]
で、指定した複数列のデータを取得data.head()
で先頭の5行を取得
the Intro to ML CourseのLesson 4の内容
- モデルを評価する
覚えておきたいと思った点
train_test_split()
でテストデータと検証データの分割ができるmean_absolute_error()
で平均絶対誤差を取得できる