版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
大智移云下的财务管理创新思维
问题的提出在平面上有这样的两组数据,如何将他们进行分类,以便于在将来新的数据加入进来能将新的数据划分到某一方:SVM原理以及基本概念1.什么是SVMSVM(supportvectorsmachine,SVM,支持向量机)支持向量机(又名支持向量网络)一种二类分类模型,它的基本模型是的定义在特征空间上的间隔最大的线性分类器,是一种机器学习算法。SVM中最关键的思想之一就是引入和定义了“间隔”这个概念。SVM的学习策略就是间隔最大化。核心:超平面,核,训练与测试SVM原理以及基本概念2.SVM原理要进行分类,则要将两类尽可能的分开,且误差最小。SVM的目标是:寻找距离最大化的边界。边界定义为:分离面(决策边界)与其最近的训练样本之间的距离现在问题就变成了:如何确定与分离面距离最近的样本?
SVM原理以及基本概念2.1点到分离面的距离总结
SVM原理以及基本概念
分隔平面我们假设这个平面的方程是:
将这个方程写成向量的形式就变为:
这两个平面就变成了边界现在的问题就变成了如何找到这个平面?X的位置X的垂直分量X在平面内的分量
2.2最大间距SVM原理以及基本概念
SVM求解
Python求解SVM现有一系列企业,我们把这些企业根据营业额度,税前利润,交税,存利润四个维度划分为四类,这四类我们分别标注为:1,2,3,4。现在有一些新的企业,如何将这些企业进行分类呢?进行预测的步骤1.导入需要用到的包2.导入样本数据和预测数据3.对样本数据进行分析4.校验预测的精度4.利用分析的结果对未来进行预测5.显示预测结果利用SVM进行分类准备工作:本次实验,需要装载数据,并且对数据进行处理,因此需要使用numpy和pandas包绘图需要用到pyplot包进行训练和预测,需要用到sklearn包中的svm第一步,导入包:importnumpyasnp#计算所用包importmatplotlib.pyplotasplt#绘图用importpandasaspd#计算所用包fromsklearn.svmimportSVC#算法fromsklearn.model_selectionimporttrain_test_split#用来分离测试数据与训练数据导入数据:init_data=pd.read_excel("i:/myjupyter/ceshi.xlsx")将数据和标签分别取出:data=init_data.loc[:,["value","profit"]]label=init_data.loc[:,"label"]将数据进行标准化stand_data=StandardScaler().fit(data).transform(data)创建向量机linear_svc=SVC(kernel="linear")将原始数据进行分割,分为训练和测试x_train,x_test,y_train,y_text=train_test_split(data,label,test_size=1/5,random_state=33)创建一个SVC实例,并应用数据进行训练linear_svc=SVC(kernel="linear")linear_svc.fit(x_train,y_train)对测试数据进行测试,查看测试精度test_predic=linear_svc.predict(x_test)linear_svc.score(x_test,y_test)直观查看,绘图a=-linear_svc.coef_[0,0]/linear_svc.coef_[0,1]b=-linear_ercept_[0]/linear_svc.coef_[0,1]x_min,x_max=data["value"].min(),data["value"].max()y_min,y_max=data["profit"].min(),data["profit"].max()plt.xlim(x_min,x_max)plt.ylim(y_min,y_max)x=np.linspace(x_min,x_max,1000)plt.scatter(x_train.loc[:,"value"],x_train.loc[:,"profit"],c=y_train)plt.plot(x,a*x+b,c="r")plt.plot(x,a*x+(linear_svc.support_vectors_[1,1]-a*linear_svc.support_vectors_[1,0]))plt.plot(x,a*x+(linear_svc.support_vectors_[0,1]-a*linear_svc.support_vectors_[0,0]))plt.scatter(linear_svc.support_vectors_[0,0],linear_svc.support_vectors_[0,1],s=100)plt.scatter(linear_svc.support_vectors_[1,0],linear_svc.support_vectors_[1,1],s=100)plt.show()线性不可分的情况以上我们看到的情况是两类有明确的分隔平面,这个属于线性可分。用一个线性函数把两类样本分开,比如二维空间中的直线、三维空间中的平面以及高维空间中的线性函数但是,当线性不可分呢?例如下图!现在我们将图像由二维转向三维,z轴我们可以考虑由x和y组合而成。假设z=x*y0,31,22,13,0线性不可分的情况0,31,22,13,00,3,03,0,01,2,22,1,2现在我们将图像由二维转向三维,z轴我们可以考虑由x和y组合而成。假设z=x*y核函数
核函数:
fromsklearn.model_selectionimportGridSearchCVparameters=('kernel':(linear','rbf'),'C:[1,2,3,4,5,6,7,8,9,10],'gamma:[0.01,0.02,0.03,0.04,0.05,0.10,0.2,0.3,0.4,0.5]}svr=svm.SVC()grid=Grid
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年白山市县(市、区)事业单位公开招聘应征入伍高校毕业生备考题库(1号)(16人)含答案详解
- 2026上半年安徽事业单位联考泗县招聘39人备考题库有答案详解
- 2026上半年云南省文化和旅游厅直属事业单位招聘20人备考题库及一套答案详解
- 2026新疆兵团遴选和选调公务员114人备考题库(含答案详解)
- 2026上半年云南事业单位联考云南大理大学招聘备考题库参考答案详解
- 2026北京协和医院消防专业人员招聘备考题库及一套完整答案详解
- 2026年咸阳市高新一中教师招聘备考题库及答案详解(易错题)
- 2026年度日照市莒县事业单位公开招聘初级综合类岗位人员备考题库及一套完整答案详解
- 2026上海国茂控股有限公司招聘备考题库及参考答案详解
- 2026年合肥理工学院编外人员招聘12名备考题库及参考答案详解1套
- 2026年江苏经贸职业技术学院单招职业倾向性测试模拟测试卷必考题
- 2026年中药材生产质量管理规范理论考试题含答案
- 北京市东城区2025-2026年高三上期末地理试卷(含答案)
- 镇海区国资系统招聘笔试题库2026
- 2026秋招:国家电投面试题及答案
- 智能机械与机器人全套课件
- 《2025年CSCO前列腺癌诊疗指南》更新要点解读
- 脓毒症诊断与治疗临床规范指南(2025年版)
- 国有企业财务管理制度
- GB 19079.12-2013体育场所开放条件与技术要求第12部分:伞翼滑翔场所
- BB/T 0019-2000包装容器方罐与扁圆罐
评论
0/150
提交评论