第一章认识数据与大数据_第1页
第一章认识数据与大数据_第2页
第一章认识数据与大数据_第3页
第一章认识数据与大数据_第4页
第一章认识数据与大数据_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一章认识数据与大数据数据、信息与知识

1.1数据:数据是描述事物的符号记录,是信息的载体。在计算机科学中,数据是计算机识别、存储和加工的对象,例如字符、图像和音频等。

小刘同学学习了数据的相关知识,以下可以称为数据的是(

A.U盘

B.报纸

C.图形

D.图像

E.硬盘

F.光盘

G.视频

H.杂志

解析:正确选项为C、D、G。其他选项为数据、信息与知识的载体或存储介质。

1.2信息:信息是数据所表示的意义,可以用来消除接收者某种认识上的不确定性。信息量的大小可用消除不确定性的多少来表示。

1.3信息的特征

1)信息的表示、传播和存储需要依附于某种载体,用来反映其内容和含义。

2)信息的传递和共享体现了信息的意义。

3)信息的产生和利用具有时效性。

4)信息的价值和效用因人而异。

王老师将知识重难点做成微课存放到班级QQ群,方便疫情期间同学们在家学习,这说明信息是()

A.有真伪的

B.可分析的

C.可共享的

解析:正确选项为C。

1.4数据、信息与知识的关系

1)数据经过处理后,就有可能转换为相应的信息;人们对信息进行提炼和归纳后,获得实践中解决问题的观点、经验和技能,信息才会内化为知识,知识是人们在社会实践中所获得的认识和经验的综合,是人类在实践中认识世界的成果。

2)数据、信息和知识的转换依赖于它们使用的环境和应用者的知识结构。

二、数字化与编码

2.1模拟信号和数字信号:模拟信号的波形可以表示为时间的连续函数;数字信号在取值上是离散的、不连续的。

2.2二进制与数制转换

二进制是计算机采用的数制,它是由德国的数理大师莱布尼茨发明,并且在20世纪以后开始广泛地应用起来,如果将十进制数65转换为二进制数,应选用下列哪个选项(

A.01000001

B.11000001

C.01010000

解析:根据“除2反向取余法”,正确选项为A。

※二进制转化成十进制:按权展开求和法2.3数据编码:计算机作为数据处理的一种工具,无论处理的是字符、图像、声音,还是其它形式的内容,都需要转换成二进制形式的编码。字符编码

※计算机中存储一个“0”或“1”占用1个二进制位(bit)。8个二进制位组成1个字节(Byte),字节是常见的存储单位,与其他存储单位的换算关系如下所示:※不同数制的特点:

※ASCII编码※美国信息交换标准代码

(American

Standard

Code

for

Information

Interchange)※字符集:大小写字母、数字、常用符号等128个字符※字符编码:利用1个字节对128个字符进行数字编码

英文字母“A”的ASCII码为01000001,那么英文字母“E”的ASCII码为:

解析:根据ASCII编码规律,在十进制下,'A'+4='E',十进制整数4转换成二进制为00000100,与01000001进行求和运算,最终答案为01000101。

2)声音编码

※音频所占的存储容量(B)=采样频率(Hz)*量化位数*声道数*时长(s)/8;

※常见的音频文件格式有WAV、WMA、MP3、AMR、APE和FLAC等。其中,WAV格式声音质量较高;MP3格式是一种通过有损压缩存储声音的文件格式;AMR格式质量较差,多用于语音通话;APE和FLAC格式是无损压缩格式。

1.王老师完成了某节微课的录制,通过耳机自带的话筒录制了声音,声音信号存储到计算机中经历的过程依次是(

A.采样、量化、编码

B.采样、编码、量化

C.量化、编码、采样

2.王老师制作微课时,使用录音软件录制了一段参数为“双声道、16位、44.1kHz”的解说词,其中的“16位”是指(

A.信噪比

B.量化位数

C.音频格式

3.通常对声音编码的基本方法是按照一定的时间间隔采集声波的振幅,并将其转换为二进制数序列,一个5分钟的双声道、16位采样位数、44.1kHz采样频率的声音文件,数据量大约为(

A.50.47B

B.50.47MB

C.403.75KB

4.刘老师的电脑中有很多多媒体文件,其中属于音频文件格式的是(

A.MP3

B.BMP

C.XLS

解析:正确选项分别是A、B、B、A,其中第3题根据音频所占的存储容量计算公式计算即可。

5.在数字音频采集过程中,影响采集质量的因素有声道数、量化位数、麦克风、采样频率。

3)图像与视频编码

※图像所占的存储容量(B)=水平像素数*垂直像素数*颜色深度/8。

※常见的图像文件格式有JPG/JPEG、PNG、GIF和BMP等。其中,BMP格式是由于未经压缩,占用的存储空间通常会比较大。视频画面是由以一定的速度连续播放的一组静态图像形成的,这些静态图像被称为帧。当连续的图像变化超过24帧/s时,根据视觉暂留原理,就会形成比较流畅的视频画面了。

※常见的视频文件格式有AVI、WMV、MP4/MPEG、MKV和RMVB等。

1.普通人肉眼能区分的灰度约为256种,计算机中至少要用几位的二进制数表示灰度图像中的灰度值(

A.8

B.9

C.7

D.256

E.16

2.位图,又叫光栅图,是由许多像小方块一样的“像素”组成的图像。一张1024×640分辨率的图片,假定每个像素用24位色彩表示,用位图文件(bitmap)格式存储,则这张图片文件需要占用多大的存储空间(

A.1920B

B.1.875MB

C.1.25MB

3.为制作校园宣传片,小明搜集了很多文件,其中属于图像文件格式的是(

A.PNG

B.WAV

C.AVI

D.WMV

E.ZIP

F.JPEG

G.RMVB

H.GIF

I.MP3

J.WMA

K.MID

L.HTML

解析:正确选项分别为A、B、(A|F|H)。第1题,256为2的8次幂;第2题,按照微视频中讲解的图像所占的存储容量计算公式计算即可。第3题中,ZIP是压缩文件格式,MID是音乐指令文件,HTML是网页格式。

4.在计算机中,图片、声音、视频通常是以文件的形式存储的,可以转换为JPG文件格式的是BMP、PNG、TIF、GIF。

5.将书法、油画等作品采集到计算机中,可使用设备数码相机、扫描仪、数码摄像机、摄像头、有拍照功能的手机。

2.4数据压缩

常用的数据压缩方法分为无损压缩和有损压缩。

1)无损压缩指对压缩后的数据进行还原后,得到的数据与压缩前完全相同。常用的无损压缩算法有zip压缩算法和7z压缩算法等;有损压缩指在压缩过程中会损失一定的信息,压缩后的数据无法还原成压缩前的样子。

2)有损压缩广泛应用于语音、图像和视频数据的压缩,常见的有损压缩格式有MP3、JPEG和MPEG等;无损压缩一般用于文本数据、程序和特殊应用场合的图像数据(如指纹图像、医学图像等)的压缩。

三、大数据及其应用

3.1大数据特征:巨量性、多样性、迅变性、价值性。

3.2大数据技术:大数据采集技术、大数据预处理技术、大数据存储与管理技术、大数据分析与挖掘技术、大数据可视化与应用技术。

3.3大数据应用:生活服务、智慧城市、医疗健康、社区管理。

关键能力

1.小刘准备制作一个有关海洋生态环境的宣传短片,他已准备好必需的文本、图片、音乐、视频等素材,要将以上素材集成在一起,最合适的工具软件是(

A.Premiere

B.画图

C.记事本

2.小王要制作一个主题为“丰富的校园生活”的多媒体作品,需要对声音素材进行处理,可使用下列哪种软件(

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论