Python与机器学习(第2版)(微课版) 课件 4-02-逻辑回归分类任务实施_第1页
Python与机器学习(第2版)(微课版) 课件 4-02-逻辑回归分类任务实施_第2页
Python与机器学习(第2版)(微课版) 课件 4-02-逻辑回归分类任务实施_第3页
Python与机器学习(第2版)(微课版) 课件 4-02-逻辑回归分类任务实施_第4页
Python与机器学习(第2版)(微课版) 课件 4-02-逻辑回归分类任务实施_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

主讲人:陈清华逻辑回归分类任务实施【数据挖掘应用】课程性别分类分析会使用sklearn第三方包实现机器学习算法应用;会应用逻辑回归算法实现分类分析;会使用LogisticRegression()对性别进行分类分析与预测应用。能力目标主要内容任务工单引导问题任务评价标准任务解决方案代码解析使用逻辑回归实现性别分类hw.csv教学难点任务工单项目中使用的hw.csv文件中的数据,包含了性别、年龄、身高、体重等数据项。性别项的值为字符类型,其中F代表女,M代表男。为了分析数据,我们需要将两者分别映射为1和0,再进行逻辑回归分类。任务概述

任务描述:从本地文件(hw.csv)中获取数据并逻辑回归分类分析。010010011001101010100100110110100101110101000100001011011101001010101101010011010010数据源hw.csv显示结果

任务要求任务概述(1)性别与人的哪些生理特征是密切相关的?(2)男和女的映射值会不会对训练结果造成影响?(3)逻辑回归的原理是什么?主要应用在哪些方面?(4)sklearn中是如何实现逻辑回归算法的?写出关键函数与实现步骤。(5)模型的输入与输出分别是什么?”

问题引导:任务概述

任务评价:任务概述评价内容评价要点分值分数评定自我评价1.任务实施数据准备2分数据正确读取得1分,数据标签映射正确得1分

模型训练2分模型初始化正确得1分,模型训练顺利执行得1分

模型预测2分模型能应用得1分,模型预测结果可展现得1分

2.效果评估模型可视化并评估效果3分能正确展现模型得2分,模型准确率90%以上得1分

3.任务总结依据任务实施情况总结结论1分总结内容切中本任务的重点要点得1分

合计10分

任务解决方案一、数据读取#coding:utf-8importpandasaspddf=pd.read_csv('hw.csv',delimiter=',')df.head()任务解决方案二、数据预处理fromsklearnimportpreprocessing#类型转换df['Weight']=df['Weight'].astype(float)df['Height']=df['Height'].astype(float)#对性别进行数值化处理le=preprocessing.LabelEncoder()df['Gender_2']=le.fit_transform(df['Gender'])df.head()任务解决方案三、数据可视化分析importmatplotlib.pyplotaspltX=df[['Height','Weight']]Y=df[['Gender_2']]plt.figure()plt.scatter(

df[['Height']],df[['Weight']],c=Y,s=80,edgecolors='black',linewidths=1,

cmap=plt.cm.Paired)plt.title('性别判定(实际值)')plt.xlabel('身高/厘米')plt.ylabel('体重/千克')plt.show()任务解决方案四、模型训练fromsklearnimportlinear_model#初始化回归模型classifier=linear_model.LogisticRegression(solver='liblinear',C=100)#拟合classifier.fit(X,Y.values.ravel())#给出预测结果output=classifier.predict(X)output=output.reshape(len(output),1)任务解决方案五、模型应用结果展现plt.figure()plt.scatter(

df[['Height']],df[['Weight']],c=output,s=80,edgecolors='black',

linewidths=1,cmap=plt.cm.Paired)plt.title('性别判定(线性分类器,预测值)')plt.xlabel('身高')plt.ylabel('体重')plt.show()任务解决方案五、模型应用结果展现:进阶x_min,x_max=df[['Height']].values.min()-1.0,df[['Height']].values.max()+1.0y_min,y_max=df[['Weight']].values.min()-1.0,df[['Weight']].values.max()+1.0step_size=0.2x_values,y_values=np.meshgrid(np.arange(x_min,x_max,step_size),np.arange(y_min,y_max,step_size))mesh_output=classifier.predict(np.c_[x_values.ravel(),y_values.ravel()])mesh_output=mesh_output.reshape(x_values.shape)plt.pcolormesh(x_values,y_values,mesh_output,cmap=plt.cm.gray)plt.scatter(df[['Height']],df[['Weight']],c=Y,s=80,edgecolors='black',linewidths

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论