版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
主讲人:陈清华逻辑回归分类任务实施【数据挖掘应用】课程性别分类分析会使用sklearn第三方包实现机器学习算法应用;会应用逻辑回归算法实现分类分析;会使用LogisticRegression()对性别进行分类分析与预测应用。能力目标主要内容任务工单引导问题任务评价标准任务解决方案代码解析使用逻辑回归实现性别分类hw.csv教学难点任务工单项目中使用的hw.csv文件中的数据,包含了性别、年龄、身高、体重等数据项。性别项的值为字符类型,其中F代表女,M代表男。为了分析数据,我们需要将两者分别映射为1和0,再进行逻辑回归分类。任务概述
任务描述:从本地文件(hw.csv)中获取数据并逻辑回归分类分析。010010011001101010100100110110100101110101000100001011011101001010101101010011010010数据源hw.csv显示结果
任务要求任务概述(1)性别与人的哪些生理特征是密切相关的?(2)男和女的映射值会不会对训练结果造成影响?(3)逻辑回归的原理是什么?主要应用在哪些方面?(4)sklearn中是如何实现逻辑回归算法的?写出关键函数与实现步骤。(5)模型的输入与输出分别是什么?”
问题引导:任务概述
任务评价:任务概述评价内容评价要点分值分数评定自我评价1.任务实施数据准备2分数据正确读取得1分,数据标签映射正确得1分
模型训练2分模型初始化正确得1分,模型训练顺利执行得1分
模型预测2分模型能应用得1分,模型预测结果可展现得1分
2.效果评估模型可视化并评估效果3分能正确展现模型得2分,模型准确率90%以上得1分
3.任务总结依据任务实施情况总结结论1分总结内容切中本任务的重点要点得1分
合计10分
任务解决方案一、数据读取#coding:utf-8importpandasaspddf=pd.read_csv('hw.csv',delimiter=',')df.head()任务解决方案二、数据预处理fromsklearnimportpreprocessing#类型转换df['Weight']=df['Weight'].astype(float)df['Height']=df['Height'].astype(float)#对性别进行数值化处理le=preprocessing.LabelEncoder()df['Gender_2']=le.fit_transform(df['Gender'])df.head()任务解决方案三、数据可视化分析importmatplotlib.pyplotaspltX=df[['Height','Weight']]Y=df[['Gender_2']]plt.figure()plt.scatter(
df[['Height']],df[['Weight']],c=Y,s=80,edgecolors='black',linewidths=1,
cmap=plt.cm.Paired)plt.title('性别判定(实际值)')plt.xlabel('身高/厘米')plt.ylabel('体重/千克')plt.show()任务解决方案四、模型训练fromsklearnimportlinear_model#初始化回归模型classifier=linear_model.LogisticRegression(solver='liblinear',C=100)#拟合classifier.fit(X,Y.values.ravel())#给出预测结果output=classifier.predict(X)output=output.reshape(len(output),1)任务解决方案五、模型应用结果展现plt.figure()plt.scatter(
df[['Height']],df[['Weight']],c=output,s=80,edgecolors='black',
linewidths=1,cmap=plt.cm.Paired)plt.title('性别判定(线性分类器,预测值)')plt.xlabel('身高')plt.ylabel('体重')plt.show()任务解决方案五、模型应用结果展现:进阶x_min,x_max=df[['Height']].values.min()-1.0,df[['Height']].values.max()+1.0y_min,y_max=df[['Weight']].values.min()-1.0,df[['Weight']].values.max()+1.0step_size=0.2x_values,y_values=np.meshgrid(np.arange(x_min,x_max,step_size),np.arange(y_min,y_max,step_size))mesh_output=classifier.predict(np.c_[x_values.ravel(),y_values.ravel()])mesh_output=mesh_output.reshape(x_values.shape)plt.pcolormesh(x_values,y_values,mesh_output,cmap=plt.cm.gray)plt.scatter(df[['Height']],df[['Weight']],c=Y,s=80,edgecolors='black',linewidths
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 煤矿机电设备管理系统技术方案
- 绩效发展咨询服务
- 展会服务合同范本在线看
- 拼花地板购销合同样本
- 个人工作承诺
- 社区安宁餐饮业静音承诺
- 马戏团表演安全保障服务协议
- 终止协议合同的操作
- 版评审表采购合同
- 机电工程招标文件解读与指导
- 产品合格证标签出厂合格证模板
- GA/T 2007-2022法庭科学气枪弹检验技术规范
- 春节人员流失预控方案
- 《孔乙己》改编剧本
- 化工自动化控制仪表作业安全操作资格培训教材课件
- 绘画心理治疗专家讲座
- 合同Amazon店铺代运营协议模板
- 小学少先队活动课赣教三年级上册主题一唱响嘹亮的队歌勇敢前进
- 拉丁字母字体造型规律课件
- 《穿井得一人》《桑中生李》阅读练习及答案
- 五年级下册第三单元百年追梦复兴中华《不甘屈辱奋勇抗争-虎门销烟》教案
评论
0/150
提交评论