




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2.4实践任务任务1认识线性回归任务2准备数据任务3设计模型任务4训练模型任务5预测数据任务1认识线性回归线性回归是利用数理统计中回归分析,来确定两种或两种以上变量间相互依赖的定量关系的
一种统计分析方法,
运用十分广泛。回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。如果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性回归分析。任务1认识线性回归线性回归属于回归算法,表达监督学习的过程。通过属性的线性组合来预测函数,其线性模型基本形式为:一般向量形式写成:
其中w=(w1;w2;…;wd)。w1;w2;…;wd为模型训练数据中学习到的参数,或赋予每个变量的“权值”。b也是一个学习到的参数,这个线性函数中的常量也称为模型的偏置。任务2准备数据为了更好地理解前面所讲的概念,本节将引入一个案例:根据程序员的编程代码量来预测其编程水平测试的成绩。我们将实现一个线性回归模型,并用梯度下降算法求解该模型,从而给出预测直线。这个实例问题是:假如有历史编程代码量和成绩的数据,我们应如何预测未来某个程序员的编程水平成绩呢?针对这个问题,我们的求解步骤包括:准备数据、设计模型、训练和预测。
任务2准备数据首先,我们编造一批代码量的数据。代码量数据就可以为0,1,2,3…,每个数表示以百行为单位,例如3表示300行代码量
任务2准备数据
我们可以用PyTorch的linspace来构造0~100之间的均匀数字作为代码量的变量x:任务2准备数据然后,我们生成对应的编程成绩数据,假设它就是在x的基础上加上一定的噪声,实现代码如下:任务2准备数据这样我们就构造了一个数据集,x表示代码量,y表示编程水平成绩。在这100个不同的代码量𝑥𝑖和每一个成绩𝑦𝑖对应,其中,每个<𝑥𝑖,𝑦𝑖>称为一个样本点。任务2准备数据下面,我们将数据集切分成训练集和测试集两部分。任务2准备数据接下来,我们对训练数据点进行可视化:图2.19模拟编程水平数据集的散点图任务3设计模型并让它尽可能地小。任务3设计模型
任务3设计模型在计算的过程中,我们需要计算出𝐿对𝑎、𝑏的偏导数,利用PyTorch的:
backward()可以非常方便地将这两个偏导数计算出来。任务4训练模型我们将上述思路转化为PyTorch代码。首先,我们需要定义两个自动微分变量a和b:任务4训练模型设置学习率:learning_rate=0.0001然后,完成对a和b的迭代计算:任务4训练模型另外,有几点技术细节值得说明。在计算predictions时,为了让a、b与x的维度相匹配,我们对a和b进行了扩维。PyTorch规定,不能直接对自动微分变量进行数值更新,只能对它的data属性进行更新。所以在更新a的时候,我们是在更新a.data,也就是a所包裹的张量。在PyTorch中,如果某个函数后面加上了“_”,就表明要用这个函数的计算结果更新当前的变量。例如,a.data.add_(3)的作用是将a.data的数值更新为a.data加上3。任务4训练模型最后,将原始的数据散点联合拟合的直线画出来,如下所示:图2.20数据点与拟合线任务5预测数据在测试数据集上应用我们拟合的直线来预测对应的y,也就是编程水平成绩。只需要将测试数据的x值带入我们拟合的直线即可:任务5预测数据那么,预测结果到底准不准呢?我们不妨把预测数值和实际数值绘制在一起,如下所示:图2.21拟合线与预测数据本章小节2.1PyTorch介绍2.1.1PyTorch概述2.1.2计算图概述2.2环境搭建.2.2.1Anaconda安装2.2.2PyTorch安装2.2.2Pycharm安装2.3PyTorc
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- GB/T 45125-2025数字印刷材料用酚醛树脂软化点的测定显微熔点仪法
- 河道下踏步施工方案
- 河钢广场施工方案
- 沙坪坝地毯施工方案
- 二零二五年度农村土地坟地租赁与墓园墓碑清洗服务协议
- 美容院员工晋升与发展激励合同(2025年度)
- 2025年度驾校教练员车辆保险承包合同
- 二零二五年度温泉度假村股份合作协议
- 二零二五年度农业技术居间保密合同
- 二零二五年度医院间医疗信息共享与数据安全协议
- 镀锌管理论重量表常用
- ISO9001ISO14001ISO45001内审检查表
- 现代密码学公钥密码体制课件
- 铁总计统【2017】177号关于进一步加强铁路建设项目征地拆迁工作和费用管理的指导意见
- 电子技术基础与技能-(3)
- 部编版四年级下册语文第二单元课文教材分析及全部教案
- 电动车销售合同
- 美术开学第一课(课堂PPT)
- 出生证明委托书(共2页)
- 刑释解教人员安置帮教工作档案
- 内部审计发展史
评论
0/150
提交评论