版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数据与计算一、数据、信息与知识1.数据及其特征数据是信息的符号表示,可用于描述事物,是现实世界事物的客观描述。表现形式:数字、文字、图形、图像、声音和视频等形式。数据处理的过程一般包括数据的采集、加工、传输、存储、检索和输岀六个环节。数据处理的目的是把数据转化成有用的信息以满足用户的需求。数据的特征有普遍性、孤立性、客观性和可处理性等。2.信息及其特征信息是数据的内涵,是对数据的语义解释。信息的特征有载体依附性、价值性、时效性和共享性等。3.知识知识是信息经过加工提炼后形成的抽象产物。知识是一类高级的、抽象的,具有普遍适应性的信息。知识是人类求知活动的结晶。4.数据、信息与知识的关系。数据、信息与知识可以看作人类对客观事物感知的三个不同阶段。数据是对事物属性的客观记录;信息是经过组织的有结构的数据;知识是经人的思维整理过的信息、数据、形象、价值标准以及社会的其他符号化产物。5.数据的来源:权威网站、利用搜索引擎检索、从相关数据公司购买等。按照获取数据的渠道,可以将数据分为直接数据(一手数据)和间接数据(二手数据)。6.数据收集方法直接数据的收集方法有调査法、访谈法、观察法、实验法等。间接数据的收集方法有査阅文献资料、关注媒体资源、浏览权威网站、利用搜索引擎检索、从相关数据公司购买等。二、excel基本知识1.公式和函数:首先输入等号“=”,然后输入相应的数学公式或利用函数进行计算。常用的函数有SUM(求和)、AVERAGE(求平均值)、COUNT(计数)、MAX(求最大值)、MIN(求最小值)等。2.数据排序:依据关键字对表格中的数据进行升序或降序排序。WPS表格允许用户对工作表中的数据按主要关键字、次要关键字等多个条件进行排序操作。3.数据筛选:依据条件显示需要的数据,隐藏不满足条件的数据。4.分类汇总:首先要对分类字段进行排序.然后依据汇总方式计算选定汇总项。三、数据编码1.釆样和量化采样:根据输入的模拟信号按适当的时间间隔得到各个时刻的样本值。量化:把经釆样得到的各个时刻的样本值用二进制码来表示。2.模拟信号和数字信号按照取值特征,可以将信号分为模拟信号和数字信号。模拟信号是指用连续变化的物理量所表达的信息,如温度、湿度、压强等(用传感器获得)。我们通常又把模拟信号称为连续信号,它在一定的时间范围内可以有多个不同的取值。模拟信号的值是随时间连续变化的,波形光滑。数字信号随时间的变化是非连续的,即取值上是离散的、不连续的信号。数字信号可以由模拟信号转换得来,即在模拟信号的基础上经过采样、量化和编码而形成。3.声音的数字化声音信号是通过采样和量化实现模拟量的数字化的,这个过程称为模数转换(A/D转换)。音频釆样:按一定的时间间隔,测得模拟信号的模拟量值。每秒采样的次数称为釆样频率,单位是赫兹(Hz)。如CD的采样频率为44.1kHz,即每秒采样44100次。音频量化:将信号波形的纵轴划分为若干个区间,把落到某个区间的釆样点按四舍五入的规则取整数值。4.容量单位计算机中的信息是使用二进制数(即0和1)来表示的;计算机中存储数据的最小单位是二进制位,用比特(bit)表示;计算机存储数据的基本单位为字节(Byte),8比特构成1个字节。1Byte=8Bits1KB=1024Bytes1MB=1024KB1GB=1024MB1TB=1024GB5.数制与数制转换数制基数进位规则位权数码表示十进制10逢十进一100,1.2,3,4,5,6,7,8,9D/int()二进制2逢二进一20,1B/bin()八进制8逢八进一80,1,2,3,4,5,6,7O/oct()十六进制16逢十六进一160,l,2,…,8,9,A,B,C,D,E,FH/hex()数制转换:(1)非负整数转换成R进制数(R大于等于2)采用“除R取余法”,即用整数部分不断去除以R,并记下每次的余数,直到商为0为止,反向取余即为最终的转换结果;(2)把R进制非负整数转换成十进制数可用“按权展开求和法”。6.文本数据的编码计算机要处理文本,就必须将其转换为计算机能识别的二进制数才能处理,该过程称为文本数据编码。常见的文本数据的编码方案有ASCII码和Unicode码。ASCII(AmericanStandardCodeforInformationInterchange),即美国信息交换标准码。用7位(标准ASCII码)或8位(扩展ASCII码)的二进制数表示一个字符,共有128个字符,每个字符用一个字节来存储,具体如下表所示。ASCII码(十进制)表示的字符0~31控制字符或通信专用字符(不可见)32空格48〜57数字0〜965~90大写英文字母A〜Z97〜122小写英文字母a〜z其他英文标点符号、运算符号、括号等Unicode是为了解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符设定了统一并且唯一的二进制编码.以满足跨语言、跨平台进行文本转换、处理的需求。Unicode通常用两个字节表示一个字符,原有的英文编码要从单字节变成双字节,只需把高位字节全部填0即可。四、数据结构1.数据结构数据结构是存在特定关系的数据元素的集合。常见的数据結构有集合结构、线性结构、树结构和图结构等。2.数据结构类型数据结构有线性结构与非线性结构之分。在线性数据结构中,除首元素没有前趋元素、尾元素没有后继元素外,其他元素都只有一个前趋元素和一个后继元素,如队列、栈。非线性数据结构有树和图等。3.队列队列是一种先进先出的线性表,它的数据元素只能在队列的一端依次添加(入队),在另一端依次删除(出队)。4.栈:先进后出。只在表的尾部进行删除和插入操作5.树结构树结构是一种具有层次关系的非线性结构。在树结构中,每一个节点只有一个前趋节点,称为父节点,没有前趋的节点只有一个,称为树的根节点。每个节点可以有多个后继节点,它们称为该节点的子节点。没有后继的节点称为叶子节点。在树结构中,数据元素之间是一对多的关系。6.图结构图结构是由一组节点(称为顶点)和一组节点间的连线(称为边或弧)构成的一种非线性数据结构。图结构中的每个顶点都可以与其他顶点有边相连,图结构中数据元素之间是多对多的关系。队列、树结构和图结构笑关系如下表所示。结构类型数据(节点)之间的关系生活中相应结构应用举例队列(线性)一对一上车、过马路、付款时排的队、医院就诊时电子牌上的就诊队列栈一对一洗餐盘树结构一对多行政区划、书的目录结构、磁盘文件存储结构、注册表结构图结构多对多全国航运图、铁路运输图、高速公路网五、数据处理1.图形用户界面(GUI)又称图形用户接口,是指采用图形方式显示的计算机操作用户界面。在Python语言中,tkinter是实现图形用户界面的模块,可以用来快速创建GUI应用程序。例如,导入tkinter模块后,就可以运用代码创建矩形容器(Frame)、文本框(Entry)、命令按钮(Button)、文本标签(Label)等交互对象。2.文件:存储在外存储设备中的相关数据的集合。3.在Python语言中,用open函数把外存储器里的文件打开;用write方法将内存中的数据存储到外存储器的文件中;文件操作结束时,用close方法关闭文件。4.数据库是以一定的组织方式存储在计算机中的相互关联的数据集合。在数据库中,数据是以二维表的形式组织存储的,称为表。表中的一列称为一个字段,每个字段都有一个名字,称为字段名;表中的一行称为一条记录。5.数据库管理系统(DBMS)是定义、创建、维护数据库的一种工具,它允许用户管理和控制数据库中的数据。常见的数据库管理系统有Sybase、ORACLE、MySQL、Access等。6.数据库系统是由数据库、数据库管理系统(及其应用开发工具)、数据库应用系统、救据库管理员和用户组成的存储、管理、处理和维护数据的系统。六、数据保护1.数据安全的威胁有人为因素,也有非人为因素。主要的威胁有计算机病毒、黑客攻击、数据存储介质损坏和个人失误等。 2.数据安全有数据备份和数据加密两方面的含义。3.数据备份是将需要备份的数据从应用主机的硬盘或磁盘阵列复制到其他的存储介质或不同位置存储空间的过程。其目的是在设备发生故障或发生其他威胁数据安全的灾害后,利用备份进行恢复,从而达到保护数据的目的。常见的数据备份方法有可移动存储设备备份和网络备份等。4.云备份的优点是成本低、管理方便和可扩展性高,缺点是安全性不足等。5.密码是指用来核对用户ID以验证用户是否是本人的一组字符。6.一般来说,创建安全密码有以下几个技巧。(1)使用长度不少于8个字符的密码,密码越长越不容易被破解。(2)在可能的情况下,尽量使用字母、数字和特殊符号相结合的密码。(3)不要使用号码、身份证号或生日作为密码。(4)不要使用整个用户ID或用户ID的一部分作为密码。(5)不要使用字典中能找到的词语作为密码,即使是字母顺序颠倒过来的常用词语也不可以。7.加密就是将原始信息(数据)隐匿起来,使之在缺少特殊信息(数据)时不可读。原始信息(数据)称为明文,加密后的信息(数据)称为密文。将密文还原成明文的过程称为解密(或解码)。8.加法密码又称为移位密码。在加法密码算法中,明文中的所有字母都在字母表上向后或向前按照一个固定数目进行偏移后被替换成密文。恺撒密码只是简单地将明文中的每一个字母用字母表中该字母后的第3个字母替换。例如,将明文中的A用D替换,B用E替换.……,以此类推,X用A替换,Y用B替换,Z用C替换。像恺撒密码这样,明文中的所有字母都在字母表上向后(或向前)按照一个固定数目进行偏移后被替换成密文,这种加密方法使用的密码就是加法密码。六、Python基本知识1.算法概念:解决问题的方法和步骤。2.算法特征:有穷性、确切性、输入项(0个或多个输入)、输岀项(算法一定要有输出)、可行性(或有效性)。3.算法分析是对一个算法需要多少计算时间和存储空间做定量的分析。4.通常从正确性、易读性、健壮性和高效性等4个方面评价算法;主要从时间复杂度和空间复杂度两个方面来考虑。5.算法的常用描述方法:自然语言、流程图和伪代码。用自然语言描述算法,通常是我们理解算法的第一步。流程图也称程序框图,它是算法的一种图形化的表示方法,与用自然语言描述算法相比,它更加形象、直观,更容易理解。常见的流程图符号及其含义如下图所示。起止框输入/输出框处理框 判断框流程线连接符起止框:表示一个算法的开始和结束。输入/输出框:表示从外部输入数据到计算机内部或者从计算机内部输岀数据到计算机外部。处理框:表示运算和处理等操作的内容。判断框:表示判断的条件。6.算法的基本结构:顺序结构、分支结构和循环结构。7.程序设计语言的发展:从低级到高级,分别是机器语言、汇编语言和高级语言。机器语言:由二进制的0、1代码指令构成,能被计算机直接识别。汇编语言:是符号化的机器语言,仍属于低级语言。高级语言:更接近自然语言,程序可读性强,修改、维护方便。常见的高级语言有Java、C/C++以及Python等。8.常量与变量常量是指在程序运行过程中值始终保持不变的量。变量是指在程序运行过程中值允许改变的量。在Python中,变量名必须以字母或下划线开头,后面可以是字母、数字或下划线;变量名区分大小写,同时不能使用系统保留字。9.数据类型Python提供了整数(int)、浮点数(float)、字符串(str)、布尔(bool)、列表(list)等常见的数据类型。部分数据类型之间可以进行转换,如“int(x)”表示将“x”转换为整型数据。10.运算符(1)算术运算符:加(+)、减(一)、乘(*)、幂(**)、除(/)、整除(//)、取模(%)(2)关系运算符:等于(==)、大于(>)、大于等于(>=)、小于(<)、小于等于(<=)、不等于(!=)(3)逻辑运算符:可以对关系式或布尔值进行逻辑运算,结果仍为布尔值"True”或“False”。常用的逻辑运算符有与(and)、或(or)、非(not)等。11.表达式(1)算术表达式:由一个或多个操作数通过运算符组合而成的式子。(2)关系表达式:用关系运算符连接起来的式子,结果为布尔值。如分支语句中的条件表达式,当条件成立时值为真(True),不成立时值为假(False)。(3)逻辑表达式:用逻辑运算符连接起来的式子,结果为布尔值。当逻辑表达式成立时值为真(True),不成立时值为假(False)。如逻辑表达式“(2<3)or(3>4)”的值为“True”。12.赋值语句将赋值号右边表达式的值赋给左边变量的语句。基本格式为:变量=表达式。13.输入和输岀语句。在Python中,使用“input()”语句从键盘输入获取数据;使用“print()”语句在屏幕上输出数据。如有多项数据输岀,用“,”分隔需要输出的内容。七、循环结构1.列表。列表可以包含多个数据元素,它是一个有序的容器。列表中的元素允许是不同的数据类型,其索引下标从“0”开始。允许对列表中的元素进行赋值、删除(remove)、插入(Insert)、添加(append)等操作。用list()函数可以将集合或字符串类型的数据转换成列表类型的数据。2.计数循环。循环次数一定时,常使用计数循环(for语句)来实现。for语句的基本格式为:for循环变量in序列:语句或语句组缩进的语句或语句组称循环体。Python规定循环体必须相对关键词for有缩进。in后面也可以是range(a,b)函数,它可以生成指定范围[a,b)的数字序列;如果只有一个参数a,则表示生成范围[0,a)的数字序列。3.条件循环。条件循环(while语句)一般用于循环次数未知的情况。while语句的基本格式为:while表达式:语句或与剧组当表达式成立时,执行循环体。Python允许表达式为数字,如果该数字为“0”则表示表达式为假(即不成立),为非0数字则表示为真(即成立)。4.循环嵌套。一个循环结构的内部也可以包含另一个循环,这样的结构称为循环嵌套(也称为多重循环)。常用的循环嵌套是二重循环,外层循环称为外循环,内层循环称为内循环。内循环是外循环的循环体,外循环每执行一次,内循环则执行一次完整的循环。以计数循环for语句为例的二重循环格式如下:for循环变量1in序列1: #外循环for循环变量2in序列2: #内循环,注意缩进语句或语句组 #循环体,注意缩进5.break语句和continue语句break语句用于终止某个循环,使程序跳到循环体以外的第一个可执行语句;continue语句用于终止本次循环进入下一次循环,即跳过循环体内还未执行的语句,进入下一次循环的判定。八、函数模块1.代码复用。程序中多处用到功能相似或相同的代码时可以用代码复用的方法来提高程序的效率。通常使用“函数”和“模块”等方法实现。代码复用可以减少重复编写代码的工作量,也可以使程序的结构更加清晰。2.函数。函数分为系统函数和用户自定义函数。系统函数即函数库里的标准函数,是程序设计语言或操作系统提供给用户的一系列已经编写好的程序。如print()函数和input()函数等。用户自定义函数是用户自己编写的程序代码。一般包括函数名、参数、返回值和函数体等四个部分。定义的格式如下:def函数名(参数):语句或语句组return返回值需要说明的是:(1)函数名和函数体必不可少;(2)参数是用来向函数传递值的,可以省略(空括号不能省略);参数也可以有多个,中间用“,”分隔;(3)函数执行完毕,由return语句将值返回给调用者;如果没有返回值,该语句可以省略;(4)采用函数名(参数列表)的方式调用函数。3.发布代码。将定义的函数发布成模块可以让更多人受益于你的劳动。4.模块的导入。无论是用户定义的模块还是第三方模块,在使用前都必须先导入程序中才可以使用。常见的模块导入方法有以下两种。方法1:import模块名as别名,as别名可以省略方法2:from模块名import方法名,如果方法名为*,表示导人该模块的所有方法使用方法1导入模块时,调用其内置函数的方法是“模块名.方法名(参数)”;使用方法2导入模块时,调用其内置函数的方法是“方法名(参数)”。十、解决问题的方法1.解析法:通过找出解决问题的前提条件与结果之间关系的表达式,再计算表达式来实现问题的求解。在生活中,我们可以利用已经成熟的数量关系和公式、定理来解析各种问题,如利用开根公式求根、利用海伦公式求三角形面积等。数据的图形化表达使信息显得更加直观和便于理解,有助于我们挖掘规律。2.枚举法也称为穷举法,是利用计算机运算速度快,精确度高的特点把所有可能的答案一一列举,合适就保留,不合适就丢弃。枚举法解决问题的一般结构:循环+判断。枚举法需要逐一验证所有的可能情况,运算量比较大,解决问題的效率不够高。因此,使用枚举法解决问题时,需要考虑优化算法,选择恰当的枚举对象,尽量分析出问题中的隐含条件,缩小枚举范围,以提高解决问题的效率。3.迭代法也称辗转法,是一种不断用变量的旧值递推新值的过程。选代算法是用计算机解决问题的一种基本方法,它利用计算机运算速度快、适合做重复性操作的特点,让计算机对一组指令(或一定步骤)进行重复执行,在每次执行这组指令(或这些步骤)时,都从变量的原值推出它的一个新值作为新一轮计算的输入。例如,利用欧几里得辗转相除法求最大公约数,利用牛顿迭代法求方程的近似根等。迭代法求解问题的三个步骤:(1)确定迭代变量;(2)建立迭代关系式;(3)控制迭代过程。4.二分查找即折半查找。就是一种通过不断地排除不可能的数据区间,最终找到需要的数据的一种算法。缺点是要求待查内容为有序的。因此,二分查找法适用于不经常变动而查找频繁的有序序列。二分査找的效率非常高,在最坏的情况下,其最大査找次数为log2n向下取整加1次(n为序列中数字的个数)。5.分治策略是将一个难以直接解决的大向题分割成一些比较小的同类问题,各个击破,最终达到解决问题的目的。如“二分查找法”就是典型的分治策略应用实例。分治策略解决问题的基本步骤如下。(1)分:将原问题分解为k个规模较小、与原问题形式相同的子问题。(2)治:若子问题规模不够小,则再将其分解,直到问题足够小时,直接求出子问题的解。(3)合:将各个子问题的解合并为原问题的解。6.递归,顾名思义,分为递推和回归。指一种通过重复将问题分解为同类的子问题,从而解决问题的方法。递归算法通过调用程序自身来实现。使用递归算法需确定的两个条件:(1)递推关系;(2)边界条件(即递归退出的条件)。递归与迭代:(1)递归与送代算法都需要重复执行某些代码;(2)递归是重复调用函数自身,遇到满足终止条件时逐层返回;迭代是重复反馈过程的活动,其目的是通近所需目标或结果,通常使用计数器结束循环。十一、数据分析与人工智能1.数据分析是指用恰当的统计分析方法对收集来的大量数据进行分析,提取有用信息,并形成结论的过程。主要用于现状分析、原因分析和预测分析。数据分析的一般过程为根据分析的目标提出假设,然后收集有关数据,选用恰当的分析方法进行分析,验证假设是否正确,继而得出相应的结论。数据分析的基本方法有对比分析和平均分析等。2.对比分析是指将两个或两个以上的数据进行比较、分析它们的差异,从而揭示这些数据所代表的事物的发展变化情况和规律。对比分为横向对比和纵向对比。横向对比指的是类似的事物或者同类的事物之间进行比较;纵向对比指的是将相同事物的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年新型节能水泵、风机和压缩机项目资金筹措计划书代可行性研究报告
- 2024年甲基六氢苯酐项目资金筹措计划书代可行性研究报告
- 2023-2024学年广东省深圳市罗湖区三年级(上)期末英语试卷
- 2024年多功能呼吸机项目资金需求报告代可行性研究报告
- 中班健康活动教案:有用的鼻子
- 二年级上数学教案-9的乘法口诀(练习课二)-人教新课标
- 3.4分析土壤形成的原因课件高中地理鲁教版(2019)必修一
- 腱鞘炎康复治疗
- 1.1多种多样的区域秦岭课件高中地理人教版(2019)选择性必修二
- 大声回答我在这儿(小班教案)-幼儿园语言教案
- 【疫苗接种意愿和满意度的问卷调查分析报告2000字】
- 梦想课程《去远方》(版)分享课程
- 房屋防水维修协议书
- 电网调度自动化系统运行管理规程
- 中国人民大学民商法学专业博士试题
- 电阻焊点焊标准参考七所提供资料
- 一年级家长进课堂-电的知识
- 第五章病因病理学说
- 2023年泰州实验中学教材、教辅资料征订管理制度
- 2022年南京市玄武区社会工作者招聘考试试题
- 脊髓损伤(C4C级)个案分析 刘阳改
评论
0/150
提交评论