版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第一层次型数据库的最大问题:没有科学的抽大数据量、高况下提高数据库性NoSQL:放宽对一第一层次型数据库的最大问题:没有科学的抽大数据量、高况下提高数据库性NoSQL:放宽对一致性的要求提高吞吐关系代数对SQL 有何帮助?通过代数变换进行查询优化视图的两种用途:1. 权限(不;2. 视:掩盖了复杂性,潜在的性能问范式:尽量降低冗余。冗余数据的一致性需要进操反范式/逆范式:一定程度上,打破范式,提高性能有现有的最佳实践,不要打着性能的幌子随意打破范1NF: 字段只被当成一个值来使用(可拆分,但不拆分进行验证第二常用DBMS 单CPU 最大并发用户大约是 但,仅限于用户相同数据的情对于同一数据仍是
2、串数据库并发的最小单元块(物理视图质量和设计相关,和测试无关性能很重要!必须在设计完成之前试SQL的直接影响数据库的性能直接或间接影响查询优化器的决DBA 的职责份恢复开的职责的一(设计表结构索引缓存“创造追不上开发的步伐使用经验而非创数据语义属于DM灵活的数据库设计往往导致更低的性能同步/异步、集中/分布影响第三集中的最大问题:单点故障(复杂的保分布式不是“切而”性上一致性难度增一般用NoSQL道理是很难解释的;积累经验自然有更好的方一知半解是非(Abstraction不同方数据库的速度SQL尽可能将逻辑放入查询中,而不是宿主语言中进攻式假定:正常的操作是大多数(经验阀值80%)让数据库检查
3、错误(更新行数多应用不作需要进行交互的有效性检和鲁莽的限界很模原则都是有例外的,否则就是公理了查询优化器在 3 表以下查询时基原则都是有例外的,否则就是公理了查询优化器在 3 表以下查询时基本可以遍历所有路径,在 3 表以上时需要对其进行暗SQL 语句部分的执行顺序:from/where/select/order 在单一语句中,order by 总是最后做的,因为它不是关系操查询优化器针对不同大小的表的优化结果可能会完全不整体优化好于分步优化使用大的查询而非多个小查优化时的考:表的大过滤条件的好坏(强的条件导致更小的中间表,减少和系统的交互分类:select、通过join 约束表的连接并发用户
4、数据库并发的最是数据块不存在行块越大,整体的并发性能越行迁2 个数据一只出现一次,需要第二次迁移时,会将整写入新的数据块第四慎用DISTINCT:去重是容易的,发现错误是很难使用*的两个合理场景:COUNT(*)或嵌套查询中EXISTSSELECT* EXISTS 和IN 就是为了解决DISTINCTEXISTS 嵌套不需要计算出结果集,也未必会执行在运行时将外部关联数据逐一带入后运行单独优化,有自己的l,然后将外部的数据带入优点:只进行一次优化;减少了一次表连接(叉乘缺点:需要代入多次唯一适用情况:位于和 EXISTS 同一 WHERE 查询中的过滤条件非常强时=产生的间结果集很小=带入次数
5、少=带入的成本小于表连接的成IN嵌套只优化一次,同时也只执行一次,但一定会执行绝大部分情况下,IN 的优化效果好于EXISTS 和指定顺序的 查询优化器只知道优化的好坏,不知道条件的强弱查询优化器不可能减少表连接操作,表连接的减少必须由人完成。降低表的使用次数:在FROM 中使用嵌套表查询优化器只知道优化的好坏,不知道条件的强弱查询优化器不可能减少表连接操作,表连接的减少必须由人完成。降低表的使用次数:在FROM 中使用嵌套表精确的经验随条件而转移,不要去轻信第五默方式:堆文件,随(提高并发性,多进程并发时随机挑选空闲块写入当一个数据块约有30%空闲时,则认为该块是可以找不到?新增一个块,提高
6、“高水平位数据的“空闲)不“空闲因是个随机的过程,所以的顺序不一定和逻辑顺序相等RowID数据块的方式,快;物理实现,无法在 SQL 中使很大(单一字段很大或字段很多,一个块中能容纳多;相将直接从硬盘一个块定义为一次 I/O 操作,I/O 操作次数影响性能B 树的特殊之处:叶节点之间是“连续”的块之间有指针连接水平遍使用索引可能降低查询性. (10%;2. . 基本. . 用索引可能需要150%-200%的时间)索引更适合读密集型事务,而不适合写密集型事务复合键索引的操作方式:index(x,y)实际仍以 x 为索引,y 的顺序是散索引只是提供了另数据的方式,并不保证提高查询任何DBMS 中,
7、主键索引是自动加目录是区方法,索引是点索引不适合大数据库中区的方式:分区既然只查询索引字段只需要使用索引,为何不在整个表上建索引1. 不利于并发,基于堆的基本表利用随有利于并2. 索引是层次式的,只有第一个字段是有序的,其他字段是无数据:数据和数据分之间想读得快,希望数据集中,减想写得快,希望数据分散,方次死锁的本质:占有资源时间过既然无法避免,解决方案是:降低事务粒度,提高事务的执行效率死锁的机率降给外键加上索引是常见做法。例外:不容易改变的表(比如代码表)的外键可以不字段顺序可能会影响索引个数(外键索引容易导致这个问题,多索第六在实际应用中,为性能,可能不作外键冗余,多处第六在实际应用中,
8、为性能,可能不作外键冗余,多处修时需要进行检反向索引:解决数的“热点”问题(将12345 存成54321,增强并争议:毫无意义的系统生成字段是否有意义合理性理论上的唯一性不代表事实上的唯一性大部分人不喜欢非数值型字段作为主)数值型快时判定唯一性物理结构和SQL 无关,使用SQL 的好坏却受物理结构影响:数据紧凑vs 数据分数据的紧凑度和查询的效率正相数据分散有利于并查询vs更任何提高查询效段,都会导致其他操作效率降注重整体的效率,提高频繁事务的效中庸不是找中间点,而是找平衡索引组织表在索引中增加额外字段,提高某个频繁运行的查询的速度“索引组织表(IOT)不仅数据,还可为表建立的索引。索引组织表
9、的数据根据主键排序后的顺序进行排列就提高的速度。但是这是由和更性能为代价的(每次写入和更新后都要重新进行重新排序)仅 Oracle 提供,其他数据库中的不同机制:聚簇数据分区典型例子Motivation:主要的查询是按月份(当月)和年份(当年)为日期范围13 个区12 过去 12 个月的数据,最后一所有以往数进入新的月份,增加新的分区,并将原来第 12 区和 13 区合并滑动窗数据更密集,查询效率更高;潜在的并发性能可以区分,例如数据存在高速硬第七分区是管理数据量小(几百数据更密集,查询效率更高;潜在的并发性能可以区分,例如数据存在高速硬第七分区是管理数据量小(几百万、几千万)时使用分区的意义
10、不大,甚至带来并发性能降低;数据量大时分区带来的查询性超过并发性能的降低分区健的修改会引起数据的移动避实例:有T1、T2、Tn 种类型的事务,每种事务有 W、P、D 三种状按事务类型分区保证n 个并发 每个分区中寻找特定状态的事务需要轮按状态分状态转变有跨分区的移即删除,写入即新增)没有资源的并移动虽然有性能降低,但带来了额外好使用堆文件之外的低都会带来复杂错误方式会带来大幅度的性能计算机的本质是对现实的简化,而这种简化就是模型树状结数据库中保存树状结构的模型邻接模型保存id 物化路径模型将层次路径作为ID,如 嵌套集合模型任意节点的位置通过和共同第八第二次作业如何在数据库中实现区票?如 A、
11、B、C、D 四个站点,乘客可以任两站之的票,如何查询特定时间 C、D 间有多少剩票如何查询车次的实例?如 G7000 次列车,有一辆车每隔一天开,还有一辆车每逢 10 的天开,如这些规则?如何查一次发车配一个车组,包括驾驶员,乘务长,乘务员,乘警等,但一个车组不一定配套一车,如何查询某一天某一车次的车组晚点了如?树状结构物化路径模型可兄弟节点间的顺序2Oralce 中,由于使用了非关系的操作方式,即使使用 DISTINCT 也无法去除重复的祖先节自顶向下查自底向上查邻接模使用数据库提供的递归查询仍用递归查询性能上来看邻接模型+connect by,自顶向下和自底向上的效率几乎相同=过程式而非关
12、从多个节点出发嵌套集合两性能上来看邻接模型+connect by,自顶向下和自底向上的效率几乎相同=过程式而非关从多个节点出发嵌套集合两种查询的效率差不多结论:SQL 查询的效率还同数据库的设计相关LIKE 无法使用些数据库提供额外的特性解决这个问比index的第九数据库方法方法学只是对过去成功经验的总结,不保证开发的成数据库over 文件系统处理并发修改的最好方关联类空值多的列作为特殊属性分正常是数据库设计完成之后,可以开始逆范式和反范式的设合并11关1 对多关系冗余一些非主键字段,减少查询时的 JOIN 操作(最常使用UI 级别的一致性控制,而非数据库级别控1 对多关系冗余外键,减少 多对多关系冗余字段,减少查询时 针对多值属性,引入重复组,减少表连多表连接变为更少的表连比如,一个用户有多个号码,正常方法是建立一个号码表,外键到用户解决方法:在用户表中存常用号码,其他号码还是存号码使用提取表,将表展开(多,提高效更新只放在更新表中,检索只放在检索
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024城市基础设施建设项目业主方与施工方之间的施工合同
- 2024年教育资源共享与许可合同
- 2024年房产购买合同样本
- 厨师个人工作计划书5篇范文
- 2023年高考押题预测卷02(上海卷)-语文(考试版)A4
- DB4106T 115-2023 芦笋病虫害防控技术规程
- 2024年房屋析产合同
- DB4106T 25-2020 病死畜禽肉鉴别技术规范
- 2024年技术开发合同:双方在技术研发过程中的责任、权益和保密条款
- 关于读书计划集合(12篇)
- 2023年天津公务员已出天津公务员考试真题
- 2025年高考数学专项题型点拨训练之初等数论
- 上海市浦东新区2024-2025学年六年级上学期11月期中数学试题(无答案)
- 教科版三年级科学上册《第1单元第1课时 水到哪里去了》教学课件
- 通信技术工程师招聘笔试题与参考答案(某世界500强集团)2024年
- 国际贸易术语2020
- 国网新安规培训考试题及答案
- 2024至2030年中国节流孔板组数据监测研究报告
- 黑龙江省哈尔滨市师大附中2024-2025学年高一上学期10月阶段性考试英语试题含答案
- 第六单元测试卷-2024-2025学年统编版语文三年级上册
- 【课件】Unit4+Section+B+(Project)课件人教版(2024)七年级英语上册
评论
0/150
提交评论