毕业设计（论文）-数据库SQL查询处理及其优化方法的研究.doc

上传人：机*** IP属地：安徽上传时间：2020-01-10 格式：DOC 页数：25 大小：598KB 积分：30 举报 版权申诉

已阅读5页，还剩20页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

本科毕业论文设计 I 数据库数据库 SQL 查询处理及其优化方法的研究查询处理及其优化方法的研究摘要摘要随着计算机技术的发展和各种应用软件的广泛使用各种应用数据也随着日常工作而迅速增长数据管理的重要性也日益显著各种基于数据库的联机事务处理以及联机分析处理已经成为数据管理中最重要的部分大量的数据管理应用软件中针对数据库的各种操作查询操作所占的比重最大如果在查询过程中使用高效的查询策略往往可以减少查询代价缩短查询时间提高查询效率论文基于 SQL 语言和对数据各种操作分析的基础上探讨了数据库 SQL 查询处理的内容和过程详细的研究了基于 SQL 查询优化的一些策略其中主要包括索引查询 SQL 语句优化其他一些常用优化方法关键词关键词数据库查询优化索引 SQL 语句本科毕业论文设计 II The research of database SQL query processing and optimized method Abstract With the development of computer technology and various application software widely used various application data also grow rapidly the importance of data management increases markedly too various processes based on database online transaction processing and on line analytical processing have become the most important parts of data management Among a lot of data management application software pointing at various operations in the database the proportion of the query operation is the biggest if using efficient query execution it can reduce cost decrease query time and improve the query efficiency Based on the SQL language and the analysis of various operations in database this paper probes into the database SQL query processing and details some strategies which based on the content and process of SQL query optimization these strategies mainly include index inquiry SQL optimization and other common optimization methods Key words database Query optimization index SQL statements 本科毕业论文设计 III 目目录录 1 绪论绪论 1 2 关系数据库查询处理关系数据库查询处理 2 2 1 查询处理步骤 2 2 2 实现查询操作的算法示例 4 2 2 1 选择操作的实现 4 2 2 2 连接操作的实现 5 3 SQL 查询处理优化方法查询处理优化方法 6 3 1 基于索引的优化 6 3 2 SQL 语句优化 9 3 2 1 WHERE字句优化 9 3 2 2 避免相关子查询 11 3 2 3 优化表的连接条件 11 3 2 4 其他 SQL 语句优化 12 3 3 其他优化方法 12 3 3 1 避免或简化排序 13 3 3 2 使用临时表 13 3 3 3 优化表中数据类型 14 3 3 4 用排序来取代非顺序存取 14 3 3 5 数据服务器存储 14 4 实例分析实例分析 14 4 1 实验环境 14 4 2 案例数据库 15 4 3 具体实例 16 结束语结束语 20 致谢致谢 21 参考文献参考文献 22 本科毕业论文设计第 1 页 1 绪论绪论到如今几乎所有应用系统的开发都离不开数据库通过查询数据库就可以有效的得到想要的数据但是现实中许多数据库开发人员在利用一些前端数据库开发工具开发数据库应用程序时只注重用户界面的华丽并不注重查询效率导致所开发出来的应用系统中查询时间长响应速度慢甚至查询结果不够准确等系统工作效率低下资源浪费严重究其原因一是硬件设备如 CPU 磁盘的存取速度跟不上内存容量不够大另一方面是数据查询方法不适当抑或是没有进行数据查询优化许多数据库开发人员认为查询优化是 DBMS 数据库管理系统的任务与程序员所编写的 SQL 语句关系不大这是不对的一个好的查询方法往往可以使程序性能提高数十倍在实际的数据库产品如 Oracle Sybase SQL Server 2000 等的高版本中都是采用基于代价的优化方法这种优化能根据从系统字典表中所得到的信息来估计不同的查询方法代价然后选择一个较优的规则虽然现在的数据库产品在数据查询优化方面已经做得越来越好但由于用户提交的 SQL 语句是查询优化的基础因此用户所写语句的优劣至关重要 2 关系数据库查询处理关系数据库查询处理要研究查询优化就必须知道数据库查询处理过程本节阐述了关系数据库 RDBMS 的查询处理步骤并介绍了查询处理的任务是把用户提交给 RDBMS 的查询语句转换为高效的执行计划 2 1 查询处理步骤查询处理步骤 RDBMS 查询处理过程可以分为四个阶段查询分析查询检查查询优化和查询执行如图 2 1 所示 1 查询分析查询分析是查询处理的第一个阶段主要任务是对查询语句进行扫描词法分析和语法分析从查询语句中识别出语言符号 SQL 关键字属性名和关系名等并且进行语法检查和语法分析即判断查询语句是否符合 SQL 语法规则 2 查询检查查询检查是根据数据字典对合法的 SQL 查询语句进行语义检查即检查语句中的数据库对象如属性名关系名是否存在和是否有效等还要根据数据字典中的用户权限和完本科毕业论文设计第 2 页整性约束对用户的存取权限进行检查如果该用户没有相应的访问权限或违反了完整性约束就拒绝执行该查询操作检查通过后便把 SQL 查询语句转换成等价的关系代数表达式 RDBMS 一般都用查询树 query tree 也称为语法分析树来表示扩展的关系代数表达式这个过程中要把数据库对象的外部名称转换为内部表示词法分析语法分析语义分析符号名转换安全性检查完整性检查查询树 query tree 代数优化物理优化等执行策略描述代码生成查询计划的执行代码数据库数据字典查询语句查询分析查询检查查询优化查询执行图 2 1 查询处理步骤 3 查询优化每个查询语句都会有很多可供选择的执行策略和操作算法查询优化 query optimization 就是选择一个高效的查询处理策略查询优化有许多种方法按照优化的层次一般可以分为代数优化和物理优化代数优化是指关系代数表达式的优化即按照一定的规本科毕业论文设计第 3 页则改变代数表达式中操作的次序和组合使查询执行更高效物理优化则是指存取路径和底层操作算法的选择选择的依据可以是基于规则的也可以基于代价的还可以基于语义的实际 RDBMS 中的查询优化器都综合了运用了这些优化技术以获得最好的查询优化效果 4 查询执行查询执行就是依据优化器得到的执行策略生成查询计划由代码生成器 code generator 生成执行这个查询计划的代码 2 2 实现查询操作的算法示例实现查询操作的算法示例选择操作和连接操作是查询操作的两个典型操作每一种操作有多种执行这个操作的算法下面探讨实现这两种操作的几个主要算法 2 2 1 选择操作的实现选择操作的实现众所周知 SELECT 语句功能十分强大有许多选项因此实现的算法和优化策略也很复杂下面以简单的选择操作为例讲述典型的实现方法例 1 Select from student where 考虑的几种情况 C1 无条件 C2 Sno 200215121 C3 Sage 20 C4 Sdept CS AND Sage 20 1 简单的全表扫描方法对查询的基本表顺序扫描逐一检查每个元组是否满足选择条件把满足条件的元组作为结果输出对于小表这种方法简单有效对于大表顺序扫描十分费时效率很低 2 索引或散列扫描方法如果选择条件中的属性上有索引例如 B 树索引或 Hash 索引可以用索引扫描方法通过索引先找到满足条件的元组主码或元组指针再通过元组指针直接在要查询的基本表中本科毕业论文设计第 4 页找到元组例 1 C2 以 C2 为例 Sno 200215121 并且 Sno 上有索引则可以通过使用索引得到 Sno 为 200215121 元组的指针然后通过元组指针在 student 表中检索等到该学生例 1 C3 以 C3 为例 Sage 20 并且 Sage 上有 B 树索引则可以使用 B 树索引找到 Sage 20 的索引项以此为入口在 B 树的顺序集上得到 Sage 20 的所有元组指针然后通过这些元组指针到 student 表中检索所有年龄大于 20 的学生例 1 C4 以 C4 为例 Sdept CS AND Sage 20 如果 Sdept 和 Sage 上都有索引一种算法是分别用上面的两种方法分别找到 Sdept CS 的一组元组指针和 Sage 20 的另一组元组指针求这两组指针的交集再到 student 表中检索就得到计算机系年龄大于 20 的学生另一种算法是找到 Sdept CS 一组元组指针通过这些元组指针到 student 表中检索并对得到的元组检查另一些选择条件是否满足把满足条件的元组作为结果输出 2 2 2 连接操作的实现连接操作的实现连接操作是查询处理中最耗时的操作之一不失一般性本文只讨论等值连接最常用的实现算法例 2 SELECT FROM Student SC WHERE Student Sno SC Sno 1 嵌套循环方法这是最简单可行的算法对外层循环 student 的每一个元组 s 检索内层循环 SC 中的每一个元组 sc 并检查这两个元组在连接属性 sno 上是否相等如果满足连接条件则串接后作为结果输出直到外层循环表中的元组处理完为止 2 排序合并方法这也是最常用的算法尤其适合连接的诸表已经排好序的情况用排序合并连接方法的步骤是如果连接的表没有排好序首先对 Student 表和 SC 表按连接属性 Sno 排序取 student 中的第一个 Sno 依次扫描 SC 表中具有相同的 Sno 的元组把它们连接起来当扫描到 Sno 不相同的第一个 SC 元组时返回 Student 表扫描它的下一个元组再扫描 SC 表中具有相同的 Sno 的元组把它们连接起来重复上述步骤直到 Student 表扫描完这样 Student 表和 SC 表都只要扫描一遍当然如果 2 个表原来无序执行时间要加上本科毕业论文设计第 5 页对两个表的排序时间即使这样对于 2 个大表先排序后使用 sort merge join 方法执行连接总的时间一般仍会大大减少 3 索引连接方法用索引连接方法的步骤是在 SC 表上建立属性 Sno 的索引如果原来没有的话对 Student 中的每一个元组由 Sno 值通过 SC 的索引查找相应的 SC 元组把这些 SC 元组和 Student 表中的元组连接起来循环执行直到 Student 表中的元组处理完为止 4 Hash Join 方法属性作为 hash 码用同一个 hash 函数把 R 和 S 中的元组散列到同一个 hash 文件中第一步划分阶段对包含较少元组的表进行一遍处理把它的元组按 hash 函数分散到 hash 表的桶中第二步试探阶段也称为连接阶段对另一表 S 进行一遍处理把 S 的元组散列到适当的 hash 桶中并把元组与桶中所有来自 R 并与之相匹配的元组连接起来 3 SQL 查询处理优化方法查询处理优化方法查询优化在关系数据库系统中有着非常重要的地位关系数据库系统和非过程化的 SQL 之所以能取得巨大的成功关键得益于查询优化技术的发展关系查询优化是影响 RDBMS 性能的关键因素查询优化既是 RDBMS 实现的关键又是关系数据库的优点所在它减轻了用户选择存取路径的负担用户只要提出干什么不必指出怎么干对比一下非关系系统中的情况用户使用过程化的语言表达查询要求执行何种记录级的操作以及操作的序列是由用户而不是由系统来决定的因此用户必须了解存取路径系统要提供用户选择存取路径的手段查询效率由用户的存取策略决定如果用户做了不当的选择系统是无法对此加以改进的这就要求用户有较高的数据库技术和程序设计水平下面介绍几种常用的查询优化方法 3 13 1 基于索引的优化基于索引的优化 1 索引定义索引是一个单独的物理的数据库结构它是根据表中一列或若干列按照一定顺序建立的列值与记录行之间的对应关系表索引是依赖于表建立的它包含索引键值及指向数据所在页面和行的指针一个表的存本科毕业论文设计第 6 页储是由两部分组成的一部分用来存放表的数据页面另一部分存放索引页面索引就存放在索引页面上通常索引页面相对于数据页面来说要小得多当进行数据检索时系统先搜索索引页面从中找到所需数据的指针然后再直接通过指针从数据页面中读取数据索引可以提供对一个表中的数据的有效访问它可以用于加速数据的检索和强制唯一性限制但是不应该在每一个列上都建立索引因为构造索引需要占用一定的系统资源降低更新的速度而且插入删除或更新一个索引列中的数据比非索引列中的数据要花费更长的时间 2 索引的作用索引是加快数据检索的一种数据库结构使得数据查询时不必扫描整个数据库就能迅速查到想要的数据具体如下 5 个方面通过创建唯一性索引可以保证数据库表中每一行数据的唯一性可以大大加快数据的检索速度这也是创建索引的最主要的原因可以加速表和表之间的连接特别是在实现数据的参考完整性方面特别有意义在使用分组和排序子句进行数据检索时同样可以减少查询中分组和排序的时间通过使用索引可以在查询的过程中使用优化器隐藏提高系统的性能 3 索引的类型如果一个表没有创建索引则数据行不按任何特定的顺序存储这种结构称为堆集在 SQL Server 2000 的数据库中按存储结构的不同将索引分为两类簇索引 Clustered Index 和非簇索引 Nonclustered Index 1 簇索引簇索引对表的数据行的键值进行排序然后再存储有用的数据记录由于簇索引对表中的数据一一进行了排序因此用簇索引查找数据很快但由于簇索引将表中的所有数据完全重新排列了它所需要的空间也就特别大大约相当于表中数据所占空间的 120 表的数据行只能以一种排序方式存储在磁盘上所以一个表只能有一个簇索引 2 非簇索引非簇索引具有完全独立于数据行的结构使用非簇索引不用对表的数据行的键值进行排序非簇索引的 B 树叶节点存储了组成非簇索引的键值和行定位器从索引行指向数据行的指针称为行定位器行定位器的结构和存储内容取决于数据的存储方式如果数据是以索引方式存储的则行定位器中存储的是簇索引的索引键如果不是以索引方式存储的这种方式称为堆存储方式 Heap Structure 则行定位器中存储的是指向数据行的指针非簇索引将行定位器的键值用一定的方式排序这个顺序与表的行在数据页中的排序是不匹配的本科毕业论文设计第 7 页由于非簇索引使用索引页存储因此簇索引需要更多的空间且检索效率较低但一个表只能建一个簇索引当用户需要建立多个索引时就需要使用非簇索引了从理论上讲一个表最多可以建 248 个非簇索引对于何时使用簇索引何时使用非簇索引如表 3 1 所示表 3 1 使用簇索引或非簇索引的时机动作描述使用簇索引使用非簇索引列经常被分组排序应应返回某范围内的数据应不应一个或极少不同值不应不应小数目的不同值应不应大数目的不同值不应应频繁更新的列不应应外键列应应主键列应应频繁修改索引列不应应 4 索引的建立与删除一般来说建立与删除索引由数据库管理员 DBA 或表的属主 owner 即建表的人负责完成系统在存取数据时会自动选择合适的索引作为存取路径用户不必也不能显式地选择索引 1 建立索引在 SQL 语言中建立索引使用 CREATE INDEX 语句其一般格式为 CREATE UNIQUE CLUSTER INDEX ON 其中是要建索引的基本表的名字索引可以建立在该表的一列或多列上各列名之间用逗号分隔每个后面还可以用指定索引值的排列次序可选 ASC 升序或 DESC 降序缺省值为 ASC UNIQUE 表明此索引的每一个索引值只对应唯一的数据记录 CLUSTER 表示要建立的索引是聚簇索引例 1 CREATE CLUSTER INDEX Stusname ON Student Sname 这条语句是在 Student 表的 Sname 姓名列上建立一个聚簇索引而且 Student 表中的本科毕业论文设计第 8 页记录将会按照 Sname 值的升序存放例 2 CREATE UNIQUE INDEX Stusno ON Student Sno CREATE UNIQUE INDEX Coucno ON Student Cno CREATE UNIQUE INDEX SCno ON Student Sno ASC Cno DESC 这三条语句是为学生课程数据库中的 Student Course SC 3 个表建立索引其中 Student 表按学号升序建唯一索引 Course 表按课程号升序建唯一索引 SC 表按学号升序和课程号降序建唯一索引 2 删除索引索引一经建立就由系统使用和维护它不需用户干预建立索引是为了减少查询操作的时间但如果数据增删改频繁系统会花费很多时间来维护索引从而降低了查询效率这时可以删除一些不必要的索引在 SQL 中删除索引使用 DROP INDEX 语句其一般格式为 DROP INDEX 例 3 删除 Student 表的 Stusname 索引 DROP INDEX Stusname 删除索引时系统会同时从数据字典中删去有关该索引的描述 3 2 SQL 语句语句优化优化使用索引可以有效的提高查询速度但是 SQL 语句是对数据库操作的唯一途径程序的执行最终都归结为 SQL 语句的执行所以 SQL 语句的执行效率对数据库系统的性能起了决定性的作用所以我们不但要会写 SQL 语句还要写出性能优良的 SQL 语句对于优化 SQL 语句本论文主要就避免相关子查询 where 字句的优化以及几个表的连接条件这几个方面进行阐述 3 2 1 where 字句优化字句优化在 where 子句中优化 SQL 语句是 SQL 语句优化的重要部分它包括很多内容这里只介绍几种常用的优化原则 1 应尽量避免在 where 子句中对字段进行 null 值判断否则将导致引擎放弃使用索引而进行全表扫描如 select id from t where num is null 可以在 num 上设置默认值 0 确保表中 num 列没有 null 值然后这样查询本科毕业论文设计第 9 页 select id from t where num 0 2 应尽量避免在 where 子句中使用或操作符否则将引擎放弃使用索引而进行全表扫描优化器将无法通过索引来确定将要命中的行数因此需要搜索该表的所有行 3 应尽量避免在 where 子句中使用 or 来连接条件否则将导致引擎放弃使用索引而进行全表扫描如 select id from t where num 10 or num 20 可以这样查询 select id from t where num 10 union all select id from t where num 20 4 in 和 not in 也要慎用因为 IN 会使系统无法使用索引而只能直接搜索表中的数据如 select id from t where num in 1 2 3 对于连续的数值能用 between 就不要用 in 了 select id from t where num between 1 and 3 5 应尽量避免在 where 子句中对字段进行表达式操作这将导致引擎放弃使用索引而进行全表扫描如 SELECT FROM T1 WHERE F1 2 100 应改为 SELECT FROM T1 WHERE F1 100 2 SELECT FROM RECORD WHERE SUBSTRING CARD NO 1 4 5378 应改为 SELECT FROM RECORD WHERE CARD NO LIKE 5378 SELECT member number first name last name FROM members WHERE DATEDIFF yy datofbirth GETDATE 21 应改为 SELECT member number first name last name FROM members WHERE dateofbirth 2005 11 30 and createdate 10 GROUP BY OrderID 可改为 SELECT DISTINCT OrderID FROM Details WHERE UnitPrice 10 2 能用 UNION ALL 就不要用 UNION UNION ALL 不执行 SELECT DISTINCT 函数这样就会减少很多不必要的资源 3 尽量不要用 SELECT INTO 语句 SELECT INOT 语句会导致表锁定阻止其他用户访问该表 4 IN OR 子句常会使用工作表使索引失效如果不产生大量重复值可以考虑把子句拆开拆开的子句中应该包含索引 5 SET SHOW PLAN ALL ON 查看执行方案 DBCC 检查数据库数据完整性 DBCC DataBase Consistency Checker 是一组用于验证 SQL Server 数据库完整性的程序本科毕业论文设计第 12 页 6 慎用游标在某些必须使用游标的场合可考虑将符合条件的数据行转入临时表中再对临时表定义游标并进行操作这样可使性能得到明显提高上面我们讲述的是一些基本的提高查询速度的方法但是在更多的情况下往往需要反复试验比较不同的语句以得到最佳方案最好的方法当然是测试看实现相同功能的 SQL 语句哪个执行时间最少但是如果数据库中数据量很少是比较不出来的这时可以用查看执行计划即把实现相同功能的多条 SQL 语句拷到查询分析器按 CTRL L 查看所利用的索引以及表扫描次数这两个对性能影响最大总体上看成本百分比即可 3 3 其他优化方法其他优化方法数据库的查询优化方法除了索引和优化 SQL 语句还有其他的方法其他方法的合理使用同样也能很好的对数据库查询起到优化作用我们就来列举几种简单实用的方法 3 3 1 避免或简化排序避免或简化排序应当简化或避免对大型表进行重复的排序当能够利用索引自动以适当的次序产生输出时优化器就避免了排序的步骤以下是一些影响因素索引中不包括一个或几个待排序的列 group by 或 order by 子句中列的次序与索引的次序不一样排序的列来自不同的表为了避免不必要的排序就要正确地增减索引合理地合并数据库表尽管有时可能影响表的规范化但相对于效率的提高是值得的如果排序不可避免那么应当试图简化它如缩小排序的列的范围等 3 3 2 使用临时表使用临时表临时表中的行比主表中的行要少而且物理顺序就是所要求的顺序减少磁盘的 I O 操作查询工作量可以大幅减少在表的一个子集进行排序并创建临时表也能实现加速查询在一些情况下这样可以避免多重排序操作但所创建的临时表的行要比主表的行少其物理顺序就是所要求的顺序这样就减少了输入和输出降低了查询的工作量提高了效率而且临时表的创建并不会反映主表的修改本科毕业论文设计第 13 页但是对临时表的使用也要有一些规则主要有 1 尽量使用表变量来代替临时表如果表变量包含大量数据请注意索引非常有限只有主键索引 2 避免频繁创建和删除临时表以减少系统表资源的消耗 3 临时表并不是不可使用适当地使用它们可以使某些例程更有效例如当需要重复引用大型表或常用表中的某个数据集时但是对于一次性事件最好使用导出表 4 在新建临时表时如果一次性插入数据量很大那么可以使用 select into 代替 create table 避免造成大量 log 以提高速度如果数据量不大为了缓和系统表的资源应先 create table 然后 insert 5 如果使用到了临时表在存储过程的最后务必将所有的临时表显式删除先 truncate table 然后 drop table 这样可以避免系统表的较长时间锁定 3 3 3 优化表中数据类型优化表中数据类型对表中数据最好使用兼容的数据类型因为数据类型的不兼容可能使优化器无法执行一些本来可以进行的优化操作例如 float 和 int char 和 varchar binary 和 varbinary 是不兼容的下面用例子来阐述 SELECT name FROM employee WHERE salary 60000 在这条语句中如 salary 字段是 money 型的则优化器很难对其进行优化因为 60000 是个整型数我们应当在编程时将整型转化成为钱币型而不要等到运行时转化 3 3 4 用排序来取代非顺序存取用排序来取代非顺序存取磁盘存取臂的来回移动使得非顺序磁盘存取变成了最慢的操作但是在 SQL 语句中这个现象被隐藏了这样就使得查询中进行了大量的非顺序查询降低了查询速度对于这个现象还没有很好的解决方法只能依赖于数据库的排序能力来替代非顺序的存取有些时候用数据库的排序能力来替代非顺序的存取能改进查询效率 3 3 5 数据服务器存储数据服务器存储尽量将数据的处理工作放在服务器上减少网络的开销如使用存储过程存储过程是编译好优化过并且被组织到一个执行规划里且存储在数据库中的 SQL 语句是控制流语言的集合速度当然快本科毕业论文设计第 14 页 4 实例分析实例分析第三章研究了数据库查询处理过程以及一些 SQL 优化方法本章将在第三章研究的基础上利用案例数据库进行对上述三类 SQL 查询优化的有效性进行实验验证并对实验结果分析 4 1 实验环境实验环境操作系统 Windows XP 数据库管理软件 SQL Server 2000 内存 2G CPU Intel R Pentium R Dual CPU E2160 1 80GHz 4 2 案例数据库案例数据库为了进行实验分析本文建立了案例数据库包括 Company House Sale 三张表如表 4 1 4 2 4 3 所示案例数据库的数据概况如表 4 4 所示表 4 1 Company 数据表定义列名数据结构长度说明 Company IDInt4编号主键 Company NameNvarchar255公司名称 Company Distrisct IDint4公司所在行政区域编号外键 Company Attribute IDint4公司所在性质类别编号外键表 4 2 House 数据表定义列名数据结构长度说明 House IDInt4编号主键 House NameNvarchar255楼盘名称 Occupy Areafloat8楼盘占地面积 Afforest Areafloat8楼盘绿化面积 Build CostMoney8楼盘建筑成本 Sum Areafloat8楼盘建筑面积 Sale Able Areafloat8楼盘可售面积 Company IDint4楼盘公司编号外键 Section IDint4楼盘所在地理区域编号外键 Type IDint4楼盘类型编号外键 Distrisct IDint4楼盘所在行政区域编号外键本科毕业论文设计第 15 页 Sum Build CostMoney8楼盘总建筑成本表 4 3 Sale 数据表定义列名数据结构长度说明 Sale IDInt4编号主键 House IDInt4楼盘编号外键 Time IDInt4楼盘销售时间编号外键 Sale Areafloat8楼盘销售面积 Sale Pricefloat8楼盘销售价格案例数据的数据该库如表 4 4 所示表 4 4 数据库数据量概况数据表名数据量 Company91 House300 Sale3590 4 3 具体实例具体实例 1 基于索引优化实验索引优化是数据库 SQL 查询优化的重要方法为了证明其有效性本实验在 Company 和 House 表的 Company ID 列上建立了索引以下面 SQL 语句为例比较索引建立前后执行时间的变化 SQL 语句 select getdate select from Company House where Company Company ID House Company ID select getdate 此语句的功能是先获取系统的当前时间然后查询 Company 和 House 表中公司编号 Company ID 相等的元组并把两表中这些元组的信息连接起来返回最后再获取系统当前时间两次时间相减就是 SQL 语句执行时间在 Company ID 列上未建立索引时系统执行情况如图 4 1 所示本科毕业论文设计第 16 页图 4 1 未建立索引系统执行情况图由图 4 1 可知 SQL 语句执行前的系统时间为 19 29 36 013 SQL 语句执行后的系统时间为 19 29 36 030 两次时间相减就是 0 017s 故 SQL 语句执行时间为 0 017s 在 Company ID 列上建立索引时系统执行情况如图 4 4 所示图 4 2 建立索引系统执行情况图由图 4 2 可知 SQL 语句执行前的系统时间为 19 45 01 060 SQL 语句执行后的系统时间为 19 45 01 060 两次时间相减就是 0 000s 由上实验可以知道建立索引时 SQL 语句执行时间约为 0 000s 而未建立索引时系统的查询时间为 0 017s 很明显建立索引可以显著的提高系统执行效率但是要是建立了不适当的索引不但会浪费系统资源还会降低查询性能 2 嵌套优化实验本科毕业论文设计第 17 页由第三章的理论研究可知当查询语句中包括嵌套查询时会降低查询效率本实验分别用嵌套的 SQL 语句和没有嵌套的 SQL 语句来实现相同的功能比较这两者的执行时间用 in 的嵌套 SQL 语句查询 SQL 语句为 select getdate select from Company House where Company Company ID in select House Company ID from House select getdate 此语句的功能是先获取系统的当前时间然后查询 Company 和 House 表中公司编号 Company ID 相等的元组并把两表中这些元组的信息连接起来返回最后再获取系统当前时间两次时间相减就是 SQL 语句执行时间系统执行情况如图 4 3 所示图 4 3 嵌套 SQL 查询系统执行情况图由图 4 3 可知 SQL 语句执行前的系统时间为 19 54 40 513 SQL 语句执行后的系统时间为 19 54 41 230 两次时间相减就是 0 717s 故 SQL 语句执行时间为 0 717s 没有嵌套的 SQL 语句查询 SQL 语句 select getdate select from Company House where Company Company ID House Company ID select getdate 此语句的功能如系统执行情况如图 4 4 所示本科毕业论文设计第 18 页图 4 4 嵌套 SQL 查询系统执行情况图由图 4 4 可知 SQL 语句执行前的系统时间为 19 55 56 043 SQL 语句执行后的系统时间为 19 55 56 060 两次时间相减就是 0 017s 故 SQL 语句执行时间为 0 017s 由上实验可以知道用 in 实现嵌套查询时 SQL 语句执行时间约为 0 717s 而不采用嵌套查询时系统的执行时间为 0 017s 由其可见不使用 in 可以提高查询性能因为用 in 实现嵌套查询时会使系统无法使用索引只能对表中的数据全部搜索这将导致系统效率降低 3 表达式优化实验由第三章可知在 where 子句中对字段进行表达式操作会降低查询性能本实验分别在 where 字句中进行表达式操作和不进行表达式操作比较两者的执行时间在 where 字句中未进行表达式操作 SQL 语句 select getdate select from Sale House where Sale Sale Area 1500 And House House Id Sale House Id select getdate 该语句的功能是在 House 和 Sale 两个表中找到 House Id 相等的元组然后再在这些元组中找出楼盘销售面积大于 1500 的元组系统执行情况如图 4 5 所示本科毕业论文设计第 19 页图 4 5 未进行表达式操作的系统执行情况图由图 4 5 可知 SQL 语句执行前的系统时间为 20 40 08 640 SQL 语句执行后的系统时间为 20 40 08 780 两次时间相减就是 0 140s 故 SQL 语句执行时间为 0 140s 在 where 字句中进行表达式操作 SQL 语句 select getdate select from Sale House where Sale Sale Area 2

人人文库> 全部分类> 教育资料 > 毕业论文

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

毕业设计（论文）-数据库SQL查询处理及其优化方法的研究.doc

文档简介

温馨提示

最新文档

评论

毕业设计（论文）-数据库SQL查询处理及其优化方法的研究.doc

文档简介

温馨提示

最新文档

评论

相关文档