Pythonを勉強し始めたし、機械学習の勉強もしたいなと思ったんだけど、一体機械学習って何ができるんだろう・・・
機械学習は、これまでわかっているデータをもとに、今後の予測ができるんだ。
今日は、機械学習の体感をしてみよう。
あの人は朝型?夜型・・?
アオウニはお仕事で、顧客(お医者さん)にメールを送ることがあるのですが、
「あれ、この医師は朝型なのか、夜型なのか・・?
どのタイミングでメール送ったらより開封してくれるのだろうか・・」
と悩むことがあります。
ということで、
事前情報をもとに、気になるあの人が朝型か夜型か機械学習を用いて予測してみました!
事前準備
表形式であらかじめわかっている18名の情報をcsvファイル化
日本語で入力していたら途中でエラーが起きたので、今回は数字に直しました。。
性別 1=女 2=男
診療科 1=内科 2=外科
Googlecolabを使用し、コード入力
①まずはマウント
from google.colab import drive
drive.mount('/content/drive')
②pandsインポート
import pandas as pd
③csvファイル読み込み
df = pd.read_csv('/content/drive/MyDrive/pandascsv/mornignornight.csv')
df.head(3)
ちゃんと読み込めていればOK!!
データの前処理
④特徴量を指定
xcol = ['性別','診療科','年代']
x = df[xcol]
x
⑤正解データを指定
t = df['朝型か夜型か']
t
モデルの準備、そして実行(学習)
⑥モデルを学習させる
from sklearn import tree
model = tree.DecisionTreeClassifier(random_state=0)
model.fit(x,t)
エラーが出ていなければOK
予測
⑦予測させるのは、Aドクターで、
性別:女性、診療科:内科、年代:40代
女性は1 内科は1 だったため、数字で情報を入力。
#Adrは女性・内科・40代
Adr = [[1 ,1 ,40 ]]
model.predict(Adr)
夜型って書いてある!!!
ということで、
夜にメール送ろう...
自分の仕事にいかすことができそうです!
もっと情報量多ければ、より正確なものができると思いますし、
朝型夜型の2択だけではなく、細かく1時間単位とかで比較的空いている時間を予測させてみても面白いかも!!
と思いました。
また、気になるあの人は
「インドア派なのか、アウトドア派なのか・・・」
「きのこの山派なのか、たけのこの里派なのか・・・」
「白米かパンか麺何が好きな傾向があるのか・・」
など事前情報さえあれば、予測がさまざまにできるかもです。
読んでくれてありがとうでした♪