版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数据挖掘实验报告(一)
数据预解决
姓名:李圣杰
班级:计算机1304
学号:
一、实验目的
1.学习均值平滑,中值平滑,边界值平滑的基本原理
2.掌握链表的使用方法
3.掌握文献读取的方法
二、实验设备
PC一台,dev-c++5.11
三、实验内容
数据平滑
假定用于分析的数据包含属性ageo数据元组中age的值如下(按递增
序):13,15,16,16,19,20,20,21,22,22,25,25,25,
25,30,33,33,35,35,35,35,36,40,45,46,52,70。
使用你所熟悉的程序设计语言进行编程,实现如下功能(规定程序具有通用性):
(a)使用按箱平均值平滑法对以上数据进行平滑,箱的深度为3。
(b)使用按箱中值平滑法对以上数据进行平滑,箱的深度为3o
(c)使用按箱边界值平滑法对以上数据进行平滑,箱的深度为3o
四、实验原理
使用c语言,对数据文献进行读取,存入带头节点的指针链表中,同时计数,均
值求三个数的平均值,中值求中间的一个数的值,边界值将中间的数转换为离边
界较近的边界值
五、实验环节
代码
#include<math.h>
#inc1ude<stdio.h>
#defineDEEP3
#inelude<stdlib.h>
#defineDATAFILE"data.txt
#defineVPT10while(!feof(fp)){
〃定义结构体ooq=(data)malloc(sizeof(struct
typedefstructchain{chain));
intnum;q—>nex"NULL;
。structchain*next;ofscanf(fpj'%d"J&q->num);
}*data;/*读一个数据*/
〃定义全局变量3p->next=q;
。datahead,p,q;p=q;
FILE*fp;3count++;
ointnum,sum,count=0;}
inti,j;/*关闭文献*/
int*box;fc1ose(fp);
voidmean();。//输出
void。medain();printf(”源数据为:\n“);
voidboundary();printf("^%d箱%(1个数据\n\c
intmain()ount/DEEP^count);
(p=head->next;
〃定义头指针®count=l;
。head=(data)malloc(sizeof(strusnum=l;
ctchain));while(p!=NULL){
head->next=NULL;oif(count==l)printf(H
/*打开文献*/箱%亡”,num);
。fp=fopen(DATAFILE>"r");if(count==DEEP){
,,
3printf("%d\nJp->num);
exit(0);onum++;
p=head;o6count=l;
DO}0。sum=sum+p->num;
。e1se{box[num]=sum/DEEP;
printf(H%dn,p->nueosum=0;
m);0。num++;
。。count++;°}
e1se(
。p=p->next;Qsum=sum+p—>num;
}。count++;
0mean();6)
medain();33p=p->next;
boundary();。}
0scanf("%d;&i);®for(i=0;i<num;i++){
return0;。叩rintf(',\r^%d:',i+l);
}6°for(j=0;j<DEEP;j++)
//均值。printf("%d",box[i]);
ovoidmean(){)
printf(”均值平滑后为:”);3p=head->next;
。box=(int*)malloc(sizeof(i。printf(“\n离群值为:”);
nt)*num);owhi1e(p!=NULL){
。p=head->next;®for(i=0;i<num;i++)
。count=l;
num=0;for(j=0;j<DEEP;j++)
。sum=0;°{
while(p!=NULL){3if(abs(p—>num-box[i])>(i
eif(count==DEEP){nt)VPT)
。count=l;
。»printf("\n箱%di+1);0sum=p->num;
。printf("%d",p->num);6)
0e1se{
°p=p->next;?0if(count==DEEP/2+1)
)—sum=(p->num+mid)/2;
)。else
}3。6mid=p->num;
}°}
〃中值count++;
voidmedain(){)
叩rintf(”\n中值平滑后为:”);eP=p->next;
。p=head->next;}
count=l;for(i=0;i<num;i++){
num=0;printf("\n^%d:\i+l);
intmid;for(j=0;j<DEEP;j++)
while(p!=NULL){叩「intf("%d",box[i]);
if(count==DEEP){O
00box[num]=surn;}
3count=l;//边界值
。num++;voidboundary(){
°}3printf("\n边界值平滑后
else{为:\n");
?if(count==DEEP/2|Icount==p=head->next;
DEEP/2+1)count=1;
。if(DEEP%2){ebox=(int*)malloc(sizeof(in
0if(count==DEEP/2+1)t)*num*2);
num=0;®if(count==l)
。while(p!=NULL){sprintf(“箱%d:",num);
。if(count==DEEP){if((p->num-box[2*n
。。box[2*num+l]=p—>num;um])>(box[2*num+1]-p->num)){
。count=l;oprintf("%d",box[2*
。©。num++;num+1]);
o°}
eelse{oelse
3if(count==1){oprintf("%d",box[2*num]);
ooobox[2*num]=p->num;«>if(count==DEEP){
6}。printf("\n");
。®count++;count=0;
6)num++;
oop=p->next;。}
°}3ocount++;
3p=head->next;3。p=p—>next;
count=l;)
onum=0;°}
。whi1e(p!=NULL){
实验数据文献:data.txt用空格分开
1315161619202021222225252525303333353535
35364045465270
六、结果截图
畸□
M{E}ant⑸is
常*
,士也啕旦-9
1
1!辘
2il6
?»,i2015
316
2i,-t2219
-t2120
4:5i25
J:<t332522
625
一,7l3s25
^'3330
t3涕6
;835
中g35
4035
-1.包45
tl45裕2
6170
:il8MM
.2
3l21
4t241814
.i2M62118
'521
624
ۥ!7%2624
/26
:C
^33
O3533
€.?9
I.,4035
1群i7040
5力6
”F
—9l564
1值
**A.5
1.
1.19215
2119
q!e3
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年南宁客运从业资格证考试题目和答案图片
- 2024年三亚驾驶员客运从业资格证模拟考试题库
- 2024年延安办理客运从业资格证理论考试题
- 2024年从业资格证考客运
- 2024年济南汽车驾驶员客运资格证考试题及答案
- 智能教育机器人行业消费者群体特征分析
- 区块链医疗数据共享行业的消费心理分析
- 育婴员(五级)考试题库及答案
- 艺术品保险行业的消费心理分析
- 低碳汽车行业投资机会分析与策略研究报告
- 供销社社有资产监督管理规定培训
- 数列放缩法高考专题
- 风光互补方案
- 亲子鉴定的报告单图片
- 高血压的病例分享
- 《版式设计》(高职)课程标准
- 打造有影响力的政务号:短视频运营方案揭秘
- 酒店升级改造方案
- 脊柱裂诊治专家共识护理课件
- 成果转化协议书
- 合作协议中的费用分配方式
评论
0/150
提交评论