SQL Server 2008 知识点总结(全)_第1页
SQL Server 2008 知识点总结(全)_第2页
SQL Server 2008 知识点总结(全)_第3页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、选择题物理设计逻辑设计概念设计 数据分布设计; 数据库逻辑模式调整; 文件组织与存取设计; 安全模式设计; 确定系统配置; 物理模式评估 数据库逻辑结构设计; 数据库事务概要设计; 应用程序概要设计 将具有相同属性特征的同类抽象为实体集,用一个有意义的名词或名词短语为每一个实体集命名; 系统总体框架设计,每个实体集需要有唯一名字; 目标:描述清楚数据之间的关系、属性特征;定义和描述数据的约束等 数据库逻辑模式调整,确定文件、关系模式转化为关系表的组织与存取方式、评估物理模式; 需要考虑 raid 级别、操作系统的文件管理机制、数据库管理系统支持的索引类型,不包括数据存储方式、路径的具体细节 需

2、考虑设置合理的数据库管理系统参数和操作系统相关参数; 系统数据存储安全设计、数据分布设计、索引设计、系统配置; 分析与描述目标系统对响应时间、存储容量的要求; 着眼于数据库底层的物理存储与存取,与操作系统和硬件环境及数据库管理系统密切相关; 需要合理安排不同的存储介质,索引文件根据访问频率决定存储(高速磁盘或磁带) ,日志文件可以考虑存储在磁带中;物理设计阶段活动 数据库物理结构设计 数据库事务详细设计 应用程序详细设计数据库应用系统设计物理设计阶段逻辑结构设计 在 e-r 图基础上确定关系模式,设计视图和关系模式的完整性约束; 适当降低关系模式的规范化程度,可以减少查询过程中的jion 操作

3、; 当一个表的数据量超过一定的规模时,可以采用分割表的方法提高效率;1概念结构设计 设计 e-r 图; 用概念数据模型表示数据对象特征及相互间的关联关系; 当一个表的数据量超过一定的规模时,可以采用分割表的方法提高效率; 索引视图只能引用同一数据库中的基表,不能是其它标准视图;视图返回的结果集的格式与基本表相同,所以可以在视图上再定义视图。 数据库中只存储标准视图的定义,并不存储标准视图的内容;视图、索引 在视图上创建了唯一聚集索引,数据库中将保存该视图内容;视图的说法低操作数据速度、占用过多存储空间; 很少对基表数据更改操作时,适合建立索引视图,提高查询效率,但会降 若 group by 列

4、具有高基数度的数据集合,则不适合建立索引视图 【用例图】 属于用例视图, 描绘系统与外部系统及用户之间的交互; 行为视图包含顺序、交互、状态图,描述系统的活动; 描述物理部署情况的是部署视图。视图(外模式实现的方式之一)将查询命令和结果用虚拟表(临时表)保存起来:提供安全性,表结构不允许修改;提高数据处理效率数据库性能优化数据库性能优化数据库运行环境;数据库参数、模式调整;数据库查询优化。性能优化是对数据库管理员的严峻考验, 有时候对应用程序的修改需要应用开发人员配合才能完成。数据库 【存储】 优化: 建立物化视图和聚集; 增加派生性冗余列增加负担,但减少查询时 join 操作;根据业务需要调

5、整相关查询或视图 反规范化(适当降低关系模式规范化程度), 可以减少查询过程中的jion 操作;处理后的数据表不一定满足第三范式要求, 当一个表的数据量超过一定的规模时, 可以采用分割表的方法提高效率; 修改频繁使用的 sql 语句,提高其性能,可能会大幅度降低数据库的 cpu 使用率 现阶段性能优化一般以软件为主要调优手段; 服务器磁盘 io 出现写瓶颈时,可以考虑使用高速磁盘存储常用数据,低速磁盘存储不常用数据 根据应用系统运行情况完善应用功能,提高人员工作效率;2派生性冗余列是指表中增加的列由表中的一些数据项经过计算而成,它的作用是在查询时减少连接操作,避免使用聚合函数,提高查询提高效率

6、的目的。由于增加了列,会增加存储空间,也减少了查询时间,因此说是以空间换时间的调优方法。 (增加了派生性冗余字段,破坏了规划化原则)对于 cpu、内存、磁盘等硬件设备在空闲时使用率超过 90%,说明硬件资源匮乏,cpu 资源已经严重不足应提高内存的容量和硬盘的访问效率,如果在高峰时使用率小于 90%说明硬件资源充足。 数据库架构体系监控: 空间基本信息、 空间使用率与剩余空间大小; 数据库性能的监控:数据监控工作a.数据缓冲区命中率、库缓冲、用户锁、锁与等待、回滚段;管理员职责b.临时段使用情况、索引的使用情况、等待事件和共享池。数据库是否可用,用户是否可连接。 数据库转储和回复; 数据库的安

7、全性、完整性控制; 数据库性能的监控分析和改进(监测和改善); 数据库的重组和重构(dba 都能完成, 不需要开发人员参与调试)数据库管理员(dba)日常管理工作有:系统监控与分析、系统性能优化调整、系统进化(升级) 、并发控制、存储空间管理、安全性维护、完成性维护、备份与恢复等。功能建模的内容 分析与描述目标系统需要完成的功能; 分析与描述每项功能活动需要的输入数据、 业务规则及输出数据; 分析与描述目标系统的总体结构、 功能活动及各功能活动之间的关系全局关系不相交原则:对于关系中的任意数据,不允许其不属于任何一个片段(保证数据不丢失),也不允许某些数据同时属于不同片段。划分方式3 轮转划分

8、:对关系顺序扫描,由于不知道所要查找的元组具体分布在哪个磁盘上,必须对所有磁盘进行查找, 明显降低了查询效率, 不适合点查询。 范围划分:按照关系中某个属性的取值范围将数据文件划分为n 部分子区间,分别存放到磁盘上。有利于范围查询和点查询; 散列划分:利于点查询 多维划分:同样的数据从不同维观察可能有不同结果,每个角度按粒度不同可划分为多个层次,称为维度成员分配方式uml 类图集中式:所有数据片段都安排在一个场地上;分割式:全局数据有且只有一份,被分割成若干片段,每个片段被分配在一个场地上;全复制式(镜像);全局数据有多个副本,每个场地上都有完整数据副本;混合式:全局数据被分成若干个数据子集,

9、每个子集被安排在一个或多个不同的场地上,但每个场地未必保存所有数据聚合(实线-空心菱形指向整体):整体与部分的关系,部分可以离开整体而单独存在;组合(实线-实心菱形指向整体):部分与实体共存;类(实线-空心三角形):子类对父类关系的继承;借口(虚线-空心三角形):子类对父类的多继承顺序图:用来描述对象自身及对象间信息传递顺序的视图。a.对象间的通信用对象生命线之间的水平消息线表示,横向矩形框代表对象,箭头说明消息的类型,如同步、异步或简单。b.顺序图可以表示递归过程,当一个操作调用它本身时,消息总是同步的。c.在顺序图中可以描述如何创建和销毁对象, 创建或销毁一个对象的消息一般是同步的。d.顺

10、序图中的消息可以有条件,并规定只有条件为真时才可以发送和接收消息,如果条件之间不互相排斥,则消息可能会并行发出uml 的动态建模机制 【通信图】(协作图):是交互图的一种,显示了在交互过程中各个对象之间的组织交互关系以及对象间发送和接收的消息链接。 并不侧重交互的顺序, 它没有将时间作为一个单独的维度,而是使用序列号来确定消息及并发线程的顺序。 【活动图】 :主要描述系统、用例和程序模块中逻辑流程的先后执行、 并行次序。 类图:展现一组类、接口和协作以及它们之间的关系的一种静态视图。 状态图: 主要目的在于陈述系统中有关事件的状态转移, 用于展示该实体处于不同状态时对不同事件做出响应后的状态变

11、化情况。 只能有一个起始状态, 可以有多个结束状态。 【部署图】配置图,描述系统中硬件和软件的物理配置情况和系统体系结构。在 uml 中, 用例模型通过对系统参与者及其重要行为的描述, 表达系统的 【功能】需求,即用户的期望。用例用椭圆形表示,用例位于系统边界的内部。排它锁:只能读和写,其它任何事务不能再加任何类型锁,直到释放才行;共享锁:只能读,不能修改数据,可加共享锁,但不能加排它锁,等事务没其它访问时,才能加排它锁系统升级改造中,既包括应用系统及相关数据库对象,也包括数据管理系统及操作系统环境。4dbas 系统设计阶段dbas 工作 进行数据库的备份与恢复等日常维护; 考虑分析 dbas

12、 运行过程中备份数据库策略,如备份时间点和周期; 事务和应用程序的编码及测试 检测实务等待图并撤销回路中的某个事务; 考虑分析 dbas 运行过程中备份数据库策略,如备份时间点和周期; 事务和应用程序的编码及测试事物按同一顺序访问资源(就不存在两个同时访问);应用程序设计将大事务切分成若干个小事务;中采取的措施使用绑定连接 数据操作:表里插入、删除记录; 数据结构: 建表, 组建客观描述数据对象本身和数据对象数据模型三要素之间的关联关系,对系统静态特征描述; 完整性约束保护:正确性、一致性、相容性、 有效性规则关系代数语言;共同特点: 非过程化的集合操作语言关系数据数据语言关系演算语言;兼备两

13、者的语言,如 sql主码:不能为空且具有唯一性;外码:取值可能为被参照关系中已存在的主码值或空值;候选码:某一组属性,可以唯一标识一个元组,不可重复也不可为空。3nf:除主码和外码,不应有其它重复字段后触发型触发器:不能在视图上定义,只有在引发的sql 语句中,指定for 或者 after的操作都已经成功执行,并且所有的约束检查也成功完成后,才执行触发器;前触发型触发器:指定执行触发器而不是执行引发触发器执行的 sql 语instead of句,从而代替触发语句的操作触发器(适用于完整性控制) :用于保护业务规则和数据完整性,优点是用户可用编程来实现复杂的处理逻辑和业务规则,增强了数据完整性约

14、束的功能。静态转储方法:系统能运行其它事务,因为会降低数据库的可用性;动态转储方法:克服了静态转储的一些缺点,但可能造成数据库的不一致性,使数据有效性得不到保障。5软件开发模型名称瀑布模型: 基于严格的、 明确的需求作为软件系统开发基础的软件开发模型;螺旋模型: 将瀑布模型的系统化与快速模型的可修改性结合起来, 引入风险评估活动。快速原型: 一种快速开发方法, 其指导思想是不必把前期各阶段的活动做得尽善尽美后才启动下阶段的活动;知识点 分析用户应用请求,与用户充分沟通,形成文档化需求描述; 需要确定出整个应用系统的功能、 性能特征和约束,并形成需求规范说明文档; 数据操作响应时间、系统吞吐量、

15、最大并发用户数都是性能需求分析的重要指标 功能需求分析:需求分析阶段规定好不同用户所允许访问的视图 标识问题; 建立需求模型,用 dfd 和 idef0 描述需求; 描述需求:用 idef2 建立系统模拟,建立动态模型; 确认需求。数据处理需求分析:从数据组织与存储的设计角度,辨识应用领域所管理的各类数据项和数据结构,与数据处理需求分析结果(可以表示为事务规范)一起组成数据字典,形成数据规范说明书;需求分析分析主要针对 dbas 应具有的功能进行分析, 是dbas 需求分析的核心环节。总体上可分为数据处理需求分析与业务规则需求分析。数据处理需求分析从数据访问和处理的角度, 功能需求分析明确对各

16、数据项所需要进行的数据访问操作(在系统规划与分析阶段,dbas 开发者已经明确了各类用户视图。因此数据处理需求分析阶段可以从这些视图出发,针对每个用户视图进行数据处理需求分析,然后汇总各个视图的分析结果得到对系统的完整分析结果) 性能需求分析: 性能需求则描述了系统应当做到什么程度, 分析 dbas应具有的性能指标。 其他需求分析。a.存储需求分析:存储需求分析是指估计 dbas 系统需要的数据存储量,如 db 所存储的数据总量;b.安全需求分析: 主要用于数据库安全设计, 避免被非法使用和攻击。6a.数据库备份与恢复设计; 日常维护运行管理与维护的主要工作内容 监控与分析b.数据的安全性、完

17、整性维护;c.存储空间管理与并发控制等a.数据库系统建立的自动监控机制;b.管理员手动实施的监控机制。 系统性能优化调整、数据转储; 系统进化(升级)等工作数据库运行维护a.数据库的转储和恢复;b.数据库的安全性和完整性控制;c.数据库性能的监控分析和改进;d.数据库的重组和重构。 系统应长期稳定运行;运行与维护阶段 对进行系统升级、优化,扩展硬盘空间,数据库服务器增加内存以提升服务器性能; 定期实施数据库完整备份,并将备份数据传送到远端容灾中心; 定期检查数据文件的存储空间占用情况,分配存储空间; 分析数据库中各种操作,以发现潜在性能问题; 将数据库中历史数据转储到离线存储介质中长期保存;数

18、据库管理员、 管理员应根据不同应用制定不同备份计划(备份时间、周期、方式及应用系统日常维护内容等); 管理员应监控数据库中各种锁的使用情况, 出现锁不能及时解除时可能需要手动解锁; 需要定期检查 cpu、内存使用情况和操作系统相关日志,防止数据库运行环境故障导致数据库出现问题主要目的是保证数据库系统正常和高效的运行。例如:新建用户、安装补丁、调整索引以提高查询速度。尽可能使用行锁(操作哪一条就限制哪一条);提高事务并发度设定较低的事务隔离等级;将大事务切分成若干小事务从功能角度数据库应用系统可以划分为四个层次。 表示层:用于显示数据和接受用户输入的数据(人机界面设计); 业务逻辑层(包括构件、

19、 存储过程设计): 表示层和数据访问层之间通信的桥梁,负责数据的传递和处理;应用系统设计(功能上分) 数据访问层(事务设计): 与 dbms 交互以获取应用系统所需数据, 实现对数据的保存和读取工作, 可以访问关系数据库、 文本文件或 xml文档; 数据持久层(完整性维护):负责保存、管理应用数据统数据,以程序为媒介把表现层或服务层的数据持久化,梳理dbas 的业务活动,将其表示为各种系统架构。它位于物理层和数据访问层之间。7 查询代价需要考虑站点间数据传输的通信代价, 一般来说导致数据传输量大的主要原因是数据间的连接和并操作; 分片透明性(位于全局概念模式与分片模式之间) 是最高级别的透明性

20、,这种透明性保证用户在编程时只考虑数据分片情况, 而不用关心分片在各场地的分配情况; 事务管理包括恢复控制合并发控制, 恢复控制一般采用基于两阶段提交协议; 目标:本地自治、非集中式管理、高可用性、位置独立性、数据分片分布式数据库独立性; 具有分布式透明性的主要因素: 位置独立性、数据分片独立性和数据复制独立性。 查询优化的主要目标:是查询执行时通信代价最省。 多个数据库分别存储在不同服务器里,网速慢的话,会影响数据读取。 有着不同的分片和副本,一个场地完成提交,虽完成某片数据更新,没有完成全局数据更新。 全局数据库管理系统是分布式数据库管理系统的核心, 它为终端用户提供分布透明性,协调全局事

21、务在各个场地的执行, 为全局应用提供支持。 局部数据库管理系统负责创建和管理局部数据库,提供场地自治能力,执行全局应用以及全局查询的子查询。 若数据分布不合理,并行数据库仅仅依靠多处理器、 共享资源等手段是无法实行真正意义上的并行处理的,也无法使其性能最优化; 无共享内存结构(顶层,每个处理机拥有独立的主存储器和磁盘,不并行式数据库共享任何资源)通过最小化共享资源来降低资源竞争, 因此具有很高的可扩展性,适合银行,出纳,民航售票等oltp类应用; 主要目的:提高数据库系统的吞吐率和减少事务响应时间; 目标: 高性能和高可利用性, 通过多个处理节点并行执行数据库任务,提高整个数据库系统的性能和可

22、用性。 水平分片(数据分布策略) :是在关系中从行(元组)的角度依据一定条件划分为不同的片段,关系的每一行必须至少属于一个片段, 以便通过在需要时重构关系。 垂直分片: 是在关系总从列的角度(属性)依据一定条件分为不同的片分片类型段, 各片段中应该包含关系的主码属性, 以便通过连接方法恢复关系; 【导出】分片:又称为导出水平分片,即水平分片的条件不是本关系属性的条件,而是其他关系属性的条件; 混合分片:以上三种方法的混合。可以先水平分片再垂直分片,或先垂直分片再水平分片, 或其他形式的分片, 但他们的结果是不相同的。8(物理上分散、逻辑上集中)复制数据库文件使用复制数据库向导;使用 backu

23、p 和 restore transact sql语句 避免或简化排序的目的是实现查询优化; 保证数据库一致性的前提下, 将频繁操作的多个可以分割的处理过程放在多个存储过程中,这样可以大大提高系统的响应速度; 使用游标会占用较多的系统资源,尤其是对于大规模并发量的情况下,很容易是的资源耗尽而崩溃; 相关子查询的使用不可以加速查询内模式(物理模式);外模式/模式:逻辑独立性模式(逻辑模式);模式/内模式:物理独立性外模式(用户模式)是一种支持对 xml 格式文档进行存储与查询等操作的数据库管理系统。xml文档自身带有标记(对文档本身的描述),需要 xml 数据库对文档进行解析,才能达到具体用途;

24、在数据本身具有层次特征时, xml 文档能够清晰地表达数据的层次特征。 水平分割后,增加复杂度,得到的子表结构相同,存储的数据不同;大部分情况是局部使用,只有很少情况才全局查询时适合使用此方法。 水平分割后,查询表中所有数据时需要使用 union(并)操作,垂直分割使用 join(连接)操作; 垂直分割后,所有表中均需保留原有表的主码; 除了都含有主码列外其余列都不相同,其查询时会减少i/o 次数;当查询表中所有数据时,分割表方法会增加查询表达式的复杂度。addnew,创建一条新记录;cancel,撤销一次执行;优化查询三级模式结构xml 数据库分割表ado 对象模型close,关闭一个 re

25、cordset;delete,删除一条或一组记录;movenext,记录指针移动到下一记录利用存储过程封装频繁使用的sql 语句;不要随意使用游标;逻辑结构调整:重新安排数据存储,整理回收碎块合理使用相关子查询物理结构调整:调节表结构定义 数据响应操作时间,数据访问响应时间; 数据吞吐量, 指系统在单位时间内可以完成的数据库事务或者查询数优化 sql 语句执行效率方法dbas 性能指标量; 允许并发访问量最大用户数; 每 tps(price per tps)代价值9 dbas 体系结构;应用系统总体设 软硬件选型和配置设计;计主要内容 应用软件总体设计; 业务规则初步设计将数据处理功能分解并分

26、布在三个层次上。表示层:位于客户端,由web 浏览器实现;三层 b/s系统结构应用层: 位于 web 应用服务器, 实现面向具体应用领域的业务规则;数据层:位于数据库服务器(事务处理)通过 dbms 完成具体的数据存储和数据存取等数据管理功能。数据库服务器接收应用服务器提出的数据操作请求,按照事务逻辑对数据库进行查询和修改,并将数据访问结果返回给应用服务器。 原子性:事务中包括的诸多操作,为了保持一致性,要么都做,要么都不做;事务性质 一致性:即在和用户的交互过程中,保证数据的一致性(事务执行结果从一个一致性到另一个一致性变化) 隔离性: 持久性: oltp安全性要求比 olap 高,实施起来

27、也较为困难; olap 访问数据量大,oltp则相反; oltp要求系统必须具有较高响应速度,olap 较为宽松;oltp和 olap oltp 需处理大量并行事务,执行的事务内容比较简单且重复率高。若采用共享内存会引起大量数据冲突将 oltp系统中数据利用抽取程序抽取出来的最主要原因: 解决 oltp应用与分析型应用之间的性能冲突。按数据粒度划分标准可将数据仓库中数据划分详细数据、轻度总结、高度总结三级、更多级。粒度越小,细节程度越高,数据量比较大,综合程度越低,空间代价也大。唯一聚集索引(索引视图、物化视图):uniqueclustered 更适合范围查询,可将视图的结果集保存到数据库中。

28、(索引项的顺序与表中记录的物理顺序一致的索引组织)索引的说法唯一非聚集索引:uniquenonclustered用法:create unique clustered index 索引名 on 视图名。主索引:在数据文件的主码属性集上建立的索引。主索引可以是聚集索引,也可以是非聚集索引。聚集索引的键值可以重复。稀疏索引属于有序索引,所以所指向的数据文件一定是有序的。model 数据库是数据库管理系统自动创建的;model 数据库用户创建的数据库都自动包含model 数据库中的内容;用户数据库的大小不能小于model 数据库的大小。10实线对查询结果集的逐行操作。insensitive 用于创建该

29、游标使用数据的临时复本。fetch_status全局变量“等于 0”时, 表明提取语句成功; “等于-1”语句失败或行不在结果集中;“等于-2”提取的行不存在。由于fetch_status 对于在一个连接上的所有游标是全局性的,不管是 对哪 个游标 ,只要 执行 一次 fetch 语句, 系统 都会 对fetch_status赋一次值,以表明该 fetch 语句的执行情况。next:返回紧跟在当前行之后的数据行,并且当前行递增为结果行。如果 fetch next 为对游标的第一次提取操作,则返回结果集中的第一行。next 为默认的游标提取选项;prior:返回紧邻当前行前面的数据行,并且当前行

30、递减为结果行。如果 fetch prior为对游标的第一次提取操作,则没有行返回并且游标置于第一行之前;first:返回游标中的第一行并将其作为当前行;last:返回游标中的最后一行并将其作为当前行;a.n 或nvar 为正,则返回从游标头开始向游标机制后的第 n 行,并将返回行变成新的当前行。b.n 或nvar 为负,则返回从游标末尾开始absoluten|nvarc.向前的第 n 行, 并将返回行变成新的当前行。如果 n 或nvar 为 0,则不返回行。n 必须是整数常量,并且nvar 的数据类型必须为 smallint、tinyint 或 int。a.n 或nvar 为正:返回从当前行开

31、始向后的第 n 行,将返回行变成新的当前行。b.n 或nvar 为负,返回从当前行开始向前的第 n 行,将返回行变成新的当前行。relativen|nvarc.如果 n 或nvar 为 0,则返回当前行。在对游标进行第一次提取时,如果在将n或nvar 设置为负数或 0 的情况下指定fetchrelative,则不返回行。 n 必须是整数 常 量 , nvar 的 数 据 类 型 必 须 为smallint、tinyint 或 int。通过对当前数据表进行照相,记录当前的数据表信息相片,然后快照将当前的相片与以前的数据表相片进行比较, 如果不一致将通过一定的方式传到数据仓库,从而实现数据的一致性

32、,它反映的是某个时间点内的数据,具有不可以改变性。这种方式适合于更新频率较低的数据表。11数据库强制存取控制方法的规则仅当主体的许可证级别不低于客体的密级时,主体才能读取相应的客体;仅当主体的许可证级别不高于客体的密级时,主体才能写相应客体完全备份:不仅可以备份整个数据库文件和日志文件,包含所有数据库对象,一周备份一次;差异备份: 备份从最近的完全备份之后有变化的数据、 日志文件以及数据库中其它被修改的内容等,优点是存储和恢复速度快,每天备份一次;a.不允许对大容量操作日志备份进行时点恢复;b.结尾日志备份在出现故障时进行,用于防止丢日志备份失数据,可以包含纯日志记录或者大容量操作日志记录。c

33、.纯日志备份只包括一定时间间隔内的事务日志,不包含大容量操作日志记录;d.日志文件占用空间小,但备份比完整备份频繁,因此保留时间比完整备份短;e.仅用于完整恢复模式和【大容量】日志恢复模事务日志备份式,它并不备份数据库本身,只备份日志记录,而且只备份从上次备份之后到当前备份时间发生变化的日志内容。主键上创建索引;经常用于连接的列上创建索引;经常需要根据范围进行搜索的列上创建索引;在 where 查询子句中引用效率高的列上创建索引;在 orderby 子句、groupby子句中出现的列上建立索引。备份类型(不能还原数据库物理损坏的情况)使用索引的原则在组合(多属性)索引中,索引属性的顺序是按照其

34、区分度进行排序。在插入、删除和更新操作中,索引可能会增加系统开销。又因为在某一个范围内频繁搜索的属性,只有在当使用索引的查询结果不超过记录总数的20%时,索引才会有明显效果。散列索引根据 hash 算法构建索引,所以检索速度很快,适用等值查询,但不能用于范围查询。 check 指定列值满足的条件,只涉及对一列的约束,放该列后面; 涉用户定义完整性及两列或以上,对整个数据表的约束,放在表最后面; 触发器约束,通过服务器激活,对数据进行完整性控制源自不同数据源的数据,经过 etl 工具(主要技术)填充更新数据仓库的数据抽取、转换、清洗、 【装载】等操作载入数据仓库的过程,才能对数据仓库中的数据进行

35、报表分析、多维分析和数据挖掘等,而并不是把企业里的所有数据集成到数据仓库中。12数据集成重组并不修改数据库原有设计的逻辑结构和物理结构。数据库重组按照系统设计要求对数据库存储空间进行全面调整。(如调整磁盘分区方法和存储空间、重新安排数据的存储、整理回收碎块、重建索引等,以提高数据库查询速度、性能)重构则不同,它可以部分修改数据库的模式和内模式。数据库的重构由于数据库应用环境的不断变化,原有的数据库设计不能满足新的需求,此时需要调整数据库的模式和内模式。不是简单的集中在一起,充分利用企业信息系统生成的各种数据,是以面向主题、集成的、非易失的、随时间变化的数据集合,解决企业业务应用和数据分析应用的

36、性能冲突。更新与时间间隔有关,所以不会实时更新。又因为对用户进行推荐时要结合以往的历史数据而不是仅通过当前数据分析。a.概念模型:也就是业务模型,由企业决策者、商务领域知识专家和 it 专家共同企业级地跨领域数据仓库业务系统需求分析的结果;b.逻辑模型:用来构建数据仓库的逻辑模型。根采用三级数据模型的方式c.据分析系统的实际需求决策构建数据库逻辑关系模型,定义数据库物理结构及其关系。它关联着数据仓库的逻辑模型和物理模型这两头;物理模型:构建数据仓库的物理分布模型,主要包含数据仓库的软硬件配置,资源情况以及数据仓库模式。使用记录级别的锁(行锁)来代替表级锁;行级锁冲突少,但速度慢。表级锁速度快,

37、但冲突多;各个事务按同一顺序访问共享资源,将大的、复杂事务分解成多个、预防死锁(防止多个用户同时对某一数据库操作)小的简单事务;降低事务隔离性级别;隔离级别越高,越能保证数据的完整性和一致性,但是对并发性能的影响也越大。使用绑定连接;避免事务中的用户交互;尽量缩短事务的长度,减少占有锁的时间;灵活使用显示加锁技术等。指的是一台服务器处于某种业务的激活状态(即active 状态) ,另一主-备方式(active-standby方式)13台服务器处于该业务的备用状态(即standby 状态)。特点:两台服务器之间使用专用网络进行检查,当运行服务器出现故障的时候,由备份服务器接管数据库,通过软件诊断

38、将 standby 机器激活,保证系统在最短时间内恢复正常使用。双主机方式(active-active 方式)指 两 种 不 同 业 务 分 别 在 两 台 服 务 器 上 互 为 主 备 状 态 ( 即active-standby 和 standby-active状态)优点:两台服务器切换速度快,连接不中断,应用不受影响。主要基本元素组成包括:a.外部实体(外部项)圆角框或者平行四边形框表示;b.数据流箭头表示,不能表示控制流和约束;c.处理(对数据的加工)矩形框表示;d.数据存储组成圆角矩形框表示。dfd(数据流图)外部实体(外部项)指系统之外又和系统有联系的人或者事物,说明了数据的外部来

39、源和去处;数据流是指处理功能的输入输出数据存储表示数据保存的地方,它用来存储数据;处理指对数据逻辑处理,也就是数据变换,它用来改变数据值,至少有一个输入流和一个输出流。每个数据库有且仅有一个主要数据文件(推荐扩展名是.mdf),可有多个次要数据(日志)文件(推荐扩展名是.ndf)。数据库中只有一个主文件组,但是可以有多个用户定义的文件组。每个数据库必须至少有一个日志文件,也可以有多个日志文件;一个文件不可以是多个文件组的成员。 日志文件不包括在文件组内,数据库文件组日志文件和数据文件是分开管理的;主(primary)文件组是系统定义好的一个文件组, 它包含主要数据文件和任何没有明确分配给其它文

40、件组的其它数据文件。如果次要数据文件没有分配给其它文件组,也是可以放在主文件组中的。主要和次要数据文件、日志和数据文件可以放在相同的磁盘上,也可以分开放置。将一个数据集中的数据进行分组,使得每一组数据尽可能相似,而不同组间数据尽可能的不同。强调同一个组中的对象有较高的相似度,不同组中对象之间差别很大。分类事先知道有哪些类别可以分,例子或数据对象均有类别标记。聚类事先不知道,例子则没有标记,需要由聚类算法自动确定。备份设备可以是磁带也可以是磁盘;备份设备可以为本地设备,也可以使用远程网络设备;a.永久备份设备:先建立备份设备,然后再将聚类(无监督学习)分类与聚类区别数据库备份设备两种备份方式数据

41、库备份到备份设备上;b.临时备份设备:直接将数据库备份到物理文件上。创建备份设备的 t-sql 存储过程为 sp_addumpdevice。14完全转储是对数据库中所有数据进行转储,此种方式占用较多的时间和空间。差量转储是对最近一次数据库完全转储以来发生的数据库变化进行转储。增量转储只复制上次转储后发生变化的文件或数据块。数据转储(数据备份)增量转储所需的时间和空间都比较短,但增量转储数据只能和完全转储配合,才能对数据库进行恢复。增量转储的恢复时间比完全转储要长。差量转储和增量转储相比,速度慢,占用空间较多,但恢复速度比增量转储快。在制定备份策略时,除考虑使用备份恢复时丢失的数据量外,还需考虑

42、数据库备份所需的时间;检查点技术大幅减少了数据库完全恢复时所必须执行的日志部分。分区表是否创建分区表本质:把符合不同标准的数据子集存储在某个数据库的一个或多个文件组中,通过元数据来表述数据存储的逻辑地址。主要取决于表当前的数据量大小以及将来的数据量大小,同时还取决于对表中的数据如何进行操作。步骤:创建分区函数、分区方案、使用分区方案创建表;创建分区表目的:告诉数据库管理系统以什么方式对表进行分区;作用:将分区函数生成的分区映射到文件组中;不同的分区可以映射到相同的数据库文件组中。散列文件:利用散列存储方式组织的文件,亦称为直接存取文件。优点:文件随机存放,记录不需进行排序;插入、删除方便;存取

43、速度快;不需要索引区,节省存储空间。缺点:不能进行顺序存取,只能按关键字随机存取,且询问方式只限于简单询问,并且在经过多次插入、删除后,也可能造成文件结构不合理,需要重新组织文件。不适合下属情况:基于散列域值的非精确查询(如模糊查询、范围查询);基于非散列域进行的查询。不能提高查询效率。文件结构【堆文件】 :一个基本表的数据量很少,查询以整表扫描为主,并且插入、删除、更新等操作非常频繁,该基本表可以采用。优点:无需建立索引,维护代价非常低;虽然堆文件的数据访问效率较低,但在数据量很少时,定位文件记录的时间非常短。顺序文件:指的是文件信息存放在若干连续的物理块中。适用用户的查询条件定义在查找码上

44、。优点:支持顺序存取和随机存取,顺序存取速度相对较快;缺点:文件不能动态增长,不利于文件插入和删除。聚集文件:将不同关系表中有关联关系的记录存储在一起。从而减15少数据库多表查询操作时的磁盘访问次数连接操作, 提高系统 i/o 速度和查找处理速度(用户频繁对两个表进行关联查询,符合聚集f文件的特性)数据库下的一个逻辑命名空间,可以存放表、视图等数据库对象。可以包含一个或多个架构,架构由特定的授权用户所拥有。a.同一个数据库的架构名必须唯一,不同架构下表名可以相同;b.在创建架构时,如果没有指定架构名,则架构名隐含为用户名, ,也架构(schema)可以是由 dbms 提供默认名。c.创建架构的

45、用户必须具有数据库管理员的权限,或者是获得了create schema的权限;d.在删除架构时,如果使用 cascade 选项,则会将该架构中的所有架构对象一全部删除;如果使用 restrict 选项,如果被删除的架构中包含架构对象,则拒绝删除此架构。简单恢复:无日志备份。自动回收日志空间以减少空间需求,实际上不再需要管理事务日志空间。最新备份之后的更改不受保护。在发生灾难时,这些更改必须重做。只能恢复到备份的结尾。只用于测试和开发数据库,或用于主要包含只读数据的数据库(如数据仓库)并不适合生产系统。完整恢复:需要日志备份。数据文件丢失或损坏不会导致丢失工作。可以恢复到任意时点(例如应用程序或

46、用户错误之前) 。大容量日志恢复:需要日志备份。是完整恢复模式的附加模式,允三种恢复模式许执行高性能的大容量复制操作,不支持时点恢复。通过使用最小方式记录大多数大容量操作,减少日志空间使用量,如果在最新日志备份后发生日志损坏或执行大容量日志记录操作,则必须重做自该上次备份之后所做的更改。否则不丢失任何工作。可以恢复到任何备份的结尾。不支持时点恢复。其中,如果符合下列任一要求,则使用完整恢复模式:您必须能够恢复所有数据;数据库包含多个文件组,并且您希望逐段还原读/写辅助文件组(以及可选地还原只读文件组) ;您必须能够恢复到故障点;您希望可以还原单个页;您愿意承担事务日志备份的管理开销。16结构设

47、计阶段:分析与描述目标系统涉及的数据范围、数据的属性特征及数据之间的关系。实现与部署(实施)阶段:建立数据库结构、数据加载、事务和应用程序的编码及测试、系统集成、测试与试运行、系统部署。(数据初始化)测试阶段:对应用程序从功能上进行扩充和完善数据库备份和恢复工作主要需要数据库管理员设计,设计好后会自动执行,不需要开发人员配合。三级模式结构提供了数据独立性, 使得数据的定义和描述与应用程序相分离,简化了数据库应用程序的开发,所有数据存取由 dbms 管理,不必考虑细节,故减小的代价。对于数据量极大的中大型系统,先导入一部分数据,测试调试结果符合要求时,再批量导入全部数据。数据不完整,进行完整或差

48、异备份无意义。数据库文件所在磁盘损坏,日志文件未损坏,执行结尾日志备份,根据上次完整和新备份的结尾日志文件,找到上次备份时间点,重新执行时间点之后的事务操作。空间管理:不同的数据库管理系统,有着不同的逻辑实现结构,因此,空间管理方法随数据库管理系统不同而不同。数据库产品选型:不同的数据库产品提供不同的应用程序接口,一般的应用程序和数据库接口会失败,需要重新修改程序。count(*)返回表的行数,它不会过滤 null 和重复的行。count(表达式)会过滤掉 null 值,所以值null 行不会加入到计数当中。如果不在“表达式”前加上 distinct 关键字,将会过滤掉重复行。sqlserve

49、r 支持对数据库中的一个数据文件进行还原的操作, 在还原过程中数据库自动处于脱机状态,其它的都将文件不能进行读写操作,因此将受到一定的影响。groupby 子句的作用是将查询的结果按照指定的字段进行分组,set 语句主要作用是给变量赋值,且一个变量只有一个值。create partition function pf1(int)as rangeleft for values(n):(n)用于指定分区值的数目,创建的分区数等于 n+1。left 关键字,在指定分区间隔值是由数据引擎按升序从左到右排列时,指定边界值处于左侧(左开,右闭区间)。17活动需要的数据控制影响整个活动执行的事件或约束条件产生

50、的结果及信息功能活动名称机制实施该活动的物理手段或完成活动需要的资源idef0 图的基本元素default(缺省约束):不能实现自定义完整性,只能表示实体或参照完整性。与#temp建立连接,才可以访问到表。文件备份对数据文件备份,不对日志备份。【unique】是对表属性约束条件不同,与位置无关。存储过程不存在判断,某一参数写好放入,反复使用,可以有【多个输入输出参数】函数依赖:指原关系模式含有属性之间的隐含关系在分解后不能丢失。查询数据表时 sql不会检查数据的完整性约束。架构与用户:一对多关系,一个用户只对应一个架构,多个用户可共享一个。元数据:描述数据的数据,在关系数据中,对对象的定义。索

51、引设计包含于数据持久层(数据组织与存储等物理设计内容)结构图组图:类图、对象图、组件图、部署图、用例图。记录包括多个域,元组的每个属性对应文件记录中的一个域数据仓库不用做日常查询,也不做汇总和统计,主要用提取数据中的潜在信息。oltp技术为提高处理效率,仍使用dbms 存取数据。事务日志用于保存对数据更新(删除、插入、修改)操作,可达到恢复功能。数据字典一般由数据库管理系统本身管理和维护。概括关系(泛化关系) :父类与子类的关系。不属于信息系统需求分析的建模方法是dfd(采用自顶向下逐步细化的结构化分析方法)ods(operationaldatastore)是仓库体系结构中的一个可选部分,具备

52、数据仓库和oltp的部分特征。数据库镜像,需要额外存放数据空间,会增加应用成本。内联表值函数:通过select语句填充函数返回的表值。公共云:以即用即付的方式提供给公众。主要数据文件的大小最小可以是3mb除了 guest 外,每个数据库用户都必须有对应的登录账户。raid1 提高了读写速度,加强了系统可靠性,磁盘利用率低。raid5 写入数据的速度比对raid1 慢,但是磁盘的利用率比raid1 高,存储成本相对较低。除了删除和创建索引、非聚簇和聚簇索引的相互转换外,重建索引也可以改进系统性能。18需求分析阶段规定好不同用户所允许访问的视图,属于数据库应用系统的功能需求分析。备份日志的语法:b

53、ackuplogdatabase_name(数据库名)tobackup_device(备份的地方)在 t-sql 中,能够实现分情况显示不同类型数据的函数是【case】 。用 read,write原语表达事务操作不属于数据库物理设计活动。创建视图以向用户屏蔽他不需要访问的数据设计阶段内容idef1x数据建模侧重分析、抽象和概括应用领域中的数据需求,被称为数据建模方法。非确定联系又称为多对多(m:n)关系。sa 是系统定义的一个数据库登录账户。数据库默认备份方式是完整数据库备份方式,如果使用 with differential 关键字则表明采用差异备份。创建新的索引应用系统优化内容日志文件不包括

54、在文件组内,日志文件和数据文件是分开管理的。with grant option语句:某用户可以将授予他的权限再转授给其他用户。guest 是 sql server 中一个特殊的数据库用户数据库应用系统正式投入运行标志着开发任务的基本完成和维护工作的开始。聚集函数的并行化计算可以采取先分后合的方法。和完整性定义相关的是:check、unique、notnull双机热备属于数据库恢复技术内容,当介质被破坏后能够保证数据的完整性。一张表上同一种操作可以建立多个后触发器;在一个表上针对同一个数据操作只能定义一个前触发器。分离数据库时不仅分离数据文件,还要一起分离日志文件。日志文件是附加数据库的重要组成

55、部分。调试和试运行阶段,使用开发人员提供的sql 语句初始化数据库中的表检查点应当由数据库恢复子系统自动的定期或者不定期的建立,而不应当由数据库管理员手动建立。sql server 支持对数据库中的一个数据文件进行还原的操作,在还原过程中数据库自动处于脱机状态,其它的都将文件不能进行读写操作,因此将受到一定的影响。混合式数据分配是一种介于分割式和全复制式的分布方式。局部【数据模型】透明性位于分配模式与局部概念模式之间,指用户编写应用程序不但要了解全局数据的分片情况,还要了解各片段副本复制、存储的场地情况,但不需要了解场地上的数据模型。分离数据库时需要停用被分离的数据库,但不需要停用sql se

56、rver服务。windows 用户只有系统管理员组成员才有权限登录到 sql server。事务故障:包括预期内的事务故障和非预期的事务故障,两种事务故障的恢复都是由系统自动完成的,对用户是透明的。19分类联系是指两个或者多个实体集之间的联系。反规范化是为了减少表间的连接,提高查询性能,并非都是高效的与实际的应用有关。由于可能存在多人并列的情况,所以查询结果是个集合,故要用谓词in。如果未在声明游标时指定scroll,则next是唯一支持的提取选项。系统默认查询结果按升序排列,因此只需要对需要降序的列使用关键字desc 即可。若在定义数据文件时没有指定其所属的文件组,则新建数据文件将被分配到默

57、认文件组。sql server 实例的作业信息存储在msdb数据库中。 作业是在 sqlserver 中定义的自动执行的一系列操作的集合,作业的执行不需要任何人工干预。创建分区方案时指定的文件组数不得少于分区函数生成的分区数,否则会返回错误信息。通用安全性分级模式:a 类提供验证保护,b 类提供强制保护,c 类提供自主保护,d 类提供最小保护。使用开发人员提供的 sql 命令初始化数据库中的表数据库实现阶段数据完整性检查数据库安全性和完整性控制阶段的内容对于复合索引,在查询使用时,最好将where 条件顺序作为索引列的顺序,效率最高。系统规划和定义的具体内容包括:任务陈述、确定任务目标、确定系

58、统范围和边界、确定用户视图。foreign key 和 primary key 应用于关系级别约束;not null、unique 应用于列级约束;check 应用于行级约束。元元模型层组成了 uml 的最基本的元素“事物” ,代表要定义的所有事物标量函数的返回值可以是除了timestamp类型以外的所有数据类型。由于使用 count(*)函数得到的是一个集合,因此不能使用“=”一个数据库的日志文件的大小和数据文件的大小之间没有联系修改数据大小的语法:其中的“文件容量”必须大于原有的容量。alter database数据库名 modifyfile(name=数据文件名,size = 文件容量)

59、授权语句:grant 被受的权限to被授予用户或角色。sql server 2008 支持在备份数据库的过程中,可以对数据进行增、删、改等操作,因此,备份并不影响用户对数据库的操作,而且在备份过程中所发生的操作也全部备份下来。noinit 表示将该次备份内容追加到指定的媒体集上,以保留原有的备份集。决策支持系统一般指企业中以数据为基础对重要业务或事务实施辅助决策的信息系统。k-means 算法是典型的基于距离的聚类, 采用距离作为相似性的评价指标, 即两个对象的距离越近,其相似度就越大。如果连接操是一个表与其自己进行连接,称为表的自身连接。语法格式:select 查询内容 from 表名表别名

60、 1(inner,可省略)joinon语法格式:需要连接的表1 join,需要连接的表 2 on 连接的条件。20在数据量比较小但是更改非常频繁的数据库中,一般采用减少完整数据库备份次数。增加差异备份和日志备份次数的策略,这样进行数据备份时备份和恢复的速度都比较快,而且当系统出现故障时,丢失的数据也非常少。因cpu 繁忙而引起的数据库变慢,可以为服务器适当:增加cpu 的数量;终止需要许多资源的进程来提高查询速度。tempdb 用于存放临时信息,用户创建的局部和全局临时表均被自动放置在该数据库中。拥有 update权限的用户不一定拥有select 权限。sql server 2008 支持数据

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论