数据结构与算法

上传人：我*** IP属地：北京上传时间：2020-04-14 格式：PPTX 页数：138 大小：4.18MB 积分：18 举报 版权申诉

已阅读5页，还剩133页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

C Net架构师蜕变营 Eleven 朝夕教育 Net架构班VIP 数据结构与算法 Array ArrayList List Stack Queue结构解读冒泡选择插入排序算法顺序自组织二叉查找算法链表手写单链表实现栈Hash存储二叉树查找树时间复杂度和空间复杂度希尔排序归并排序堆排序快排AVL树红黑树跳跃表数据结构与算法 1大厂高薪工作面试必备内容方便阅读源码和理解设计思想写代码封装框架的性能保障增加内功持续竞争力不变锻炼逻辑思维能力怎么学理解写一遍思考总结源码解读C 数据结构算法能写写锻炼动手能力不能写就解读锻炼逻辑思维数组 Array 连续的节约空间查找也快增删慢定长多维数组矩阵数组图锯齿数组动态数组 ArrayList 连续的节约空间查找也快增删慢变长Capacity TrimToSize超出长度时是x2 开辟全新空间 copy数据ListCapacity TrimExcess Stack Stack FILO可以用链表实现 C 用的是数组Capacity TrimExcessStack实际上是对数组的一个封装 Queue Queue 当然也是数组Capacity TrimExcess尾巴进头部出 BCL源码基类库BCL之前是练习1 栈队列 Stack进制转换回文检测语法检测器公式解释器顺序日志任务异步计算优先级队列数据结构小结学会适当且高效地使用数据结构是进步的开端先抽象数据然后来思考问题解决方案会更容易得到好方案封装封装封装算法Algorithm 算法 Algorithm 是指解题方案的准确而完整的描述是一系列解决问题的清晰指令算法代表着用系统的方法描述解决问题的策略机制存储数据最普遍的两种操作就是排序和查找许多数据结构的主要设计目的就是为了使排序或查找更加简单基础排序算法冒泡排序两两交换直到找出最大值摆在最后面2层循环选择排序找出最小值直接跟头部交换 2层循环插入排序先放一个数据到位置0 再放第2个需要比较前面的数据决定放在左边还是右边依次类推跟数据级别分配都有关选择排序是最好的是冒泡的1 2插入是最慢的冒泡排序算法循环2轮比较基础查找算法顺序查找 foreach最大值 foreach保存最大值最小值 foreach保存最小值完全无序查找是重复N次自组织查找查找顺便有序二八原则自组织查找算法冒泡式每查1次数据前移一个位置二八原则就是多了个判断在后80 才移动其实就是想办法把热门数据移到前面去长期运行有效率二叉查找就是先排序再查找 1到100元猜个数字猜对就给他502537迭代模式递归模式递归的效率比循环低但是很cool 练习2 基础算法把三种基础排序改造成从大到小顺序查找自组织查找改造成从尾部开始查找二叉查找的集合里面如果是倒序的该如何改造如果集合是无序的会发生什么情况链表单链接链表实现在内存上不连续可以从头遍历到尾巴不能索引找查询慢一些增删快一些双链表 LinkedList内置双链接链表其实链表就是一个类属性指向其他实例然后串起来就是的循环链表头尾连起来链表实践自定义简易链表完成StackFILO单链表即可 Node NodeListStack Push Pop Peek TotalNodeList 小练习3 链表实现Queue 实现Stack点兵点将点到谁就是谁 50人谁是最后安全的0到49100人呢 1000人呢应用较少 Hash存储 key valueHash 散列哈希把任意长度的输入通过散列算法变换成固定长度的输出该输出就是散列值哈希冲突使用一个下标范围比较大的数组来存储元素可以设计一个函数哈希函数使得每个元素的关键字都与一个函数值即数组下标相对应于是用这个数组单元来存储这个元素哈希函数的目标是尽量减少冲突但实际应用中冲突是无法避免的双重散列法 DoubleHashing Hashtable 线程安全实现层支持对象装箱拆箱增删改查速度都快空间换时间相对数组和链接字典Dictionary 泛型Key Value集合增删查改都很快有序的数组存储Entry数据Whyhash 快速定位 SortDictionary 排序字典插入时找好位置 SortedList 排序的key value数组没有hash插入时排序集合集合是特殊元素们的一种聚合有两个最重要的属性1集合成员都是无序的集合的成员不会出现超过一次去重交叉并补投票避免一个ip多次无序可以做随机 HashSet实现 C 用的是数组数组也可以用hashtable源码解读树结构树是由边连接的一系列节点一种非线性的数据结构可以把数据按照等级模式存储起来根节点父节点子节点叶节点二叉树每个节点最多拥有不超过两个子节点的树定义为二叉树完全二叉树若二叉树中最多只有最下面两层结点的度小于2 并且最下面一层的结点叶子结点都依次排列在该层最左边的位置上具有这样结构特点的树结构称为完全二叉树二叉查找树排序树 1若它的左子树不为空则左子树上的所有结点的值均小于根结点的值2若它的右子树不为空则右子树上的所有结点的值均大于根节点的值3二叉排序树的左右子树也都是二叉排序树 C 构建树数据结构就是为了提升效率降低思考难度组合模式 CustomTreeNode1对多 1对2 排序树二叉查找树遍历中序遍历 Sequentialtraversal 从小到大先序遍历 PreTraversal 自身在前后序遍历 PostTraversal 自身再后二叉查找树查找 Min Max Find value 封装数据结构就是为了操作的高效小练习4 二叉树随机生成10个GUID 找出其中的数字和字母从10开始算保存到二叉查找树并统计出现的次数计算公式解析 3 4 5 6 2 2 3 没有括号转化到二叉树结构去并基于二叉树完成计算二叉树的边数和节点数有什么关系提供一个获取边数的方法时间复杂度空间复杂度数据结构和算法本身解决的是快和省的问题如何让代码运行更快时间复杂度如何让代码更省存储空间空间复杂度事后统计法很准确但是没有类比性时间复杂度理解所有代码的执行时间T n 与每行代码的执行次数n成正比T n O f n T n 表示代码执行的时间 n表示数据规模的大小 f n 表示每行代码执行的次数总和大O描述的是算法的运行时间和输入数据之间的关系不是为了算出是多少时间大O表示法推导就是考量的复杂度都是以大数据为标准 T n 2n 2 T n O 2n 2 T n O n 2是常量是没有意义的倍数2也没有意义要的是时间和N的关系T n 2 n 2 2n 3 T n O 2 n 2 2n 3 T n O n 2 2 n n 2n 2n n 1 2n n n nT n Log2n 1 T n O Log2n 1 T n O Log2n O Logn 时间复杂度分析方法 1只关注循环执行次数最多的的一段代码2加法法则总复杂度等于量级最大的那段代码的复杂度3乘法法则嵌套代码的复杂度等于嵌套内外代码复杂度的乘积大O分类 O 1 O logn O n O nlogn O n 2 O n O一般是计算最坏的结果数据结构操作的复杂性常规数据结构操作复杂性最好最坏复杂度 1 最好情况时间复杂度代码在最理想情况下执行的时间复杂度 2 最坏情况时间复杂度代码在最坏情况下执行的时间复杂度 3 平均时间复杂度用代码在所有情况下执行的次数的加权平均值表示 4 均摊时间复杂度在代码执行的所有复杂度情况中绝大部分是低级别的复杂度个别情况是高级别复杂度且发生具有时序关系时可以将个别高级别复杂度均摊到低级别复杂度上基本上均摊结果就等于低级别复杂度数组排序算法的复杂性常见算法复杂度二元复杂度 O m n O m n 空间复杂度空间复杂度全称就是渐进空间复杂度 asymptoticspacecomplexity 表示算法的存储空间与数据规模之间的增长关系 O 1 O n O n 2 像O logn O nlogn 这样的对数阶复杂度平时都用不到高级排序算法前面都是基础排序算法下面来高级的希尔排序算法希尔排序是对插入排序的改进核心思路是分组造就有序数组后插入排序效率高插入排序算法依次对比插入合适位置有序的数组特别省事儿扑克牌希尔排序算法希尔排序是先分组比对大致有序之后再插入排序效率高希尔排序解读选择增长系数按系数分组排不断缩小系数 increment 1时就是插入排序一样的代码希尔排序解读 1思路简单实现方便性能不错数据量影响不大2复杂度不稳定跳跃式归并排序算法归并排序 MERGE SORT 是利用归并的思想实现的排序方法分治 divide and conquer 策略将问题分 divide 成一些小的问题然后递归求解而治 conquer 的阶段则将分的阶段得到的各答案修补在一起即分而治之归并排序算法分而治之分久必合归并排序算法归并排序算法归并排序是稳定排序它也是一种十分高效的排序利用二叉树特性O N logN 堆排序算法堆排序是一种选择排序基于堆数据结构堆完全二叉树完全二叉树若二叉树中最多只有最下面两层结点的度小于2 并且最下面一层的结点叶子结点都依次排列在该层最左边的位置上具有这样结构特点的树结构称为完全二叉树数组结构也可以Node 大顶堆小顶堆选择排序算法每次找出剩余里面最小放在最前面的位置构建堆之后效率更高堆分析与构建完全二叉树分析大顶堆 arr i arr 2i 1 arr i arr 2i 2 大顶堆 arr i arr 2i 1 arr i arr 2i 2 最后包含叶节点枝节点Length 2 1如何构建堆中间状态构建后就是拿堆顶和尾部交换剩下再排个堆堆排序算法构造一个大顶堆头尾交换找出最大值剩下的构建堆循环以上过程堆排序算法满足大顶堆的约束排序第二快快速排序算法速度最快的高级排序算法快速排序算法是实至名归的分治递归整理扑克牌黑桃A K 乱序给你整理抽3张出来其他的就填空快速排序算法快速排序算法 Net类库的默认排序就是快排数据多才有优势分而治之最关键就是参照物选择可以头可以尾可以中 5 提升练习5 高级排序 1试试随机100 1000 10000 100000随机数组各种基础排序和高级排序需要的时间记得排除干扰快排中用头尾倒数第二个元素作为参照物高级查找算法需要组建更高级的数据结构方便更快的查找类似二叉排序树 AVL树 AVL树首先是个二叉排序树而且左右两个子树的高度差永远不可能大于1 图一AVL树图二非AVL树极端情况下二叉排序树的时间复杂度O n AVL树是在增加Node时判断高度不断调整有代价能让复杂度变成O log n 旋转技术左左型做右旋顺时针旋转结点使双亲结点被自己的左孩子替代然后自己变成左孩子结点的右孩子结点旋转技术右右型做左旋逆时针旋转结点使自己被自己的右孩子替代然后自己变成右孩子的左孩子结点旋转技术左右型先左旋再右旋先对其左旋将其变成左左型再右旋让其平衡旋转技术右左型先右旋再左旋先对其右旋将其变成右右型再左旋让其平衡 AVL树 1准备Node2准备AVLTreeInsertNodeDeleteNode AVL树 Min Max Search O n O log n 练习6 AVL树检查代码中AVL树的实现有Bug找Bug并尝试修复AVL树删除使用逻辑删除尝试实现并考虑对其他方法的影响树结构数据是无效 AVL树出现相同数值给节点加上count 尝试实现然后再删除红黑树红黑树是自平衡的二叉查找树红黑树根据一系列规则把树上的节点指定为红色或者黑色通过对树中节点适当的染色就可以使得树处于近乎完美地平衡红黑树五大规则 1 节点是红色或者黑色2 根节点是黑色3 每个叶子的节点都是黑色的空节点 NULL 4 每个红色节点的两个子节点都是黑色的 5 从任意节点到其每个叶子的所有路径都包含相同的黑色节点红黑树优势相对二叉树是黑色完美平衡树效率要高相对AVL树只是黑色完美平衡树增删效率要高红色不影响缓冲一下旋转的概率低一点也许不一定为了更快的查找增删你懂的红黑树升级加个12毫无影响位置红色不影响红黑树升级加个21要么2个红色要么黑色深度不对想办法平衡红黑树插入处理方式旋转左旋右旋变色重新着色红黑树升级变颜色调整 21插入后只能是红色保证子节点高度22变黑红色不能是红色的子节点27变黑必须是黑色25变红因为下面多了一层黑色满足叶节点高度满足红色子节点黑色局部满足红黑树升级 17和25都是红色不对变17的颜色深度不对只能旋转了红黑树升级 17 13 15三个节点左旋13降下来15当成13的右节点跟AVL树旋转一样的红黑树升级根节点黑色13变红高度8 15都是黑色的6的深度红黑树升级 13 8 11右旋红黑树升级着色一下Done卒红黑树应用一切为了更快的查找 C 里面的TreeSetSortedDictionary实时计算图像处理等等跳跃表跳跃列表是用来替代平衡树而作为实现方法的一种数据结构跳跃列表的算法有同平衡树一样的渐进的预期时间边界并且更简单更快速和使用更少的空间有序链表多层链表类似二分法查找链表查询进化单层链表有序时间复杂度O n 双层链表数据量100w 还可以多来几层三层链表跳跃表 1由很多层结构组成 2每一层都是有序的链表排列顺序为由高层到底层都至少包含两个链表节点分别是前面的head节点和后面的null节点 3最底层的链表包含了所有的元素 4如果元素出现在某一层的链表中该层之下的链表都会出现 5链表中的每个节点都包含两个指针一个指向同一层的下一个链表节点另一个指向下一层的同一个链表节点跳跃表查询试试分别查找7213271117 数据插入从最底层开始插入定位位置确定数据插入的层数随机生成个值满足条件就插入然后自下往上一层层插入即可其中概率为1 2或者是1 4的时候整体的性能会比较好也就是所谓的抛硬币法复杂度查找复杂度O logN 插入复杂度O logN 删除复杂度O logN 空间复杂度O N 跳跃列表经常用来代替平衡树红黑树因为简单 B树 B树 B 树是一种多路搜索树并非二叉的 1定义任意非叶子节点最多可以有M个儿子节点 2且M 2 则根节点的儿子数为 2 M 3除根节点为的非叶子节点的儿子树为 M 2 M 4每个结点存放至少M 2 1 去上整且至多M 1个关键字至少为2 5非叶子结点的关键字个数指向子节点的指针数 1 6非叶子节点的关键字 K 1 K 2 K 3 K M 1 且K i K i 1 7非叶子结点的指针 P 1 P 2 P M 其中P 1 指向关键字小于K 1 的子树 P M 指向关键字大于K M 1 的子树其它P i 指向关键字属于 K i 1 K i 的子树 8所有叶子结点位于同一层 B树 B树 M 3 关键字集合分布在整颗树中任何一个关键字出现且只出现在一个结点中搜索有可能在非叶子结点结束其搜索性能等价于在关键字全集内做一次二分查找自动层次控制 B 树 B 树是B 树的变体也是一种多路搜索树 1 其定义基本与B 树同除了 2 非叶子结点的子树指针与关键字个数相同 3 非叶子结点的子树指针P i 指向关键字值属于 K i K i 1 的子树 B 树是开区间 4 为所有叶子结点增加一个链指针 5 所有关键字都在叶子结点出现 B 树 B 树 M 3 1 所有关键字都出现在叶子结点的链表中稠密索引且链表中的关键字恰好是有序的 2 不可能在非叶子结点命中 3 非叶子结点相当于是叶子结点的索引稀疏索引叶子结点相当于是存储关键字数据的数据层 B 树 B 树 1B 树定义了非叶子结点关键字个数至少为 2 3 M 即块的最低使用率为2 3代替B 树的1 2 2B 树的分裂当一个结点满时分配一个新的结点并将原结点中1 2的数据复制到新结点最后在父结点中增加新结点的指针 B 树的分裂只影响原结点和父结点而不会影响兄弟结点所以它不需要指向兄弟的指针 3 树的分裂当一个结点满时如果它的下一个兄弟结点未满那么将一部分数据移到兄弟结点中再在原结点插入关键字最后修改父结点中兄弟结点的关键字因为兄弟结点的关键字范围改变了如果兄弟也满了则在原结点与兄弟结点之间增加新结点并各复制1 3的数据到新结点最后在父结点增加新结点的指针 B 树相对于B 树空间利用率上有所提高查询速率也有所提高总结树 1二叉搜索树二叉树每个结点只存储一个关键字且值大于左子树小于右子树 2B B 树多路搜索树每个结点存储M 2到M个关键字非叶子结点存储指向关键字范围的子结点所有关键字在整颗树中出现且只出现一次非叶子结点可以命中 B 树在B 树基础上为叶子结点增加链表指针所有关键字都在叶子结点中出现非叶子结点作为叶子结点的索引 B 树总是到叶子结点才命中 B 树在B 树基础上为非叶子结点也增加链表指针将结点的最低利用率从1 2提高到2 3 练习7 树试试自己写个简单跳跃表仅实现插入和查找现有跳跃表有bug 猜猜哪里发生的试试找出来并修复图Graph 由非空的顶点 Vertex 集合和描述顶点之间的关系边 Edge 或弧 Arc 的集合组成无序图和算法图是由一组顶点和一组边构成的对有序的图被称为有向图 directedgraph 或者就叫有向图 digraph 如果图是无序的那么它就被称为无序图 unorderedgraph 或者就称为图路径 path 是图中顶点的序列所有的顶点由边连接在一起回路 cycle 是指在有向图中路径至少为1以便于初始定点也是结束定点构建图邻接矩阵 1顶点Vertex2边Edge 邻接矩阵构建图准备顶点Vertex添加边Edge遍历展示数据构建图邻接表 AdjacencyList 1顶点Vertex数组顶点包含自己和关联边邻接表是图的一种顺序存储与链式存储相结合的存储结构搜索遍历图的遍历是指从图中的某个顶点出发按照某种顺序访问图中的每个顶点使每个顶点被访问一次且仅一次图的遍历是图的一种基本操作图的许多其他操作都是建立在遍历操作的基础之上的确定从一个顶点能到达哪些顶点是在图上经常执行的一种操作地图航班等深度优先搜索 DFS 是沿着一条路径从开始顶点到达最后的顶点然后原路返回并且沿着下一条路径达到最后的顶点如此继续直到走过所有路径广度优先搜索 BFS 从第一个顶点开始尝试访问所有可能在第一个顶点附近的顶点从本质上说这种搜索在图上的移动是逐层进行的首先会检查与第一个顶点相邻的层然后逐步向下检查远离初始顶点的层最小生成树 MCST 最小生成树的得名源于覆盖每个顶点范围所必需的最少数量的构造边而且说它是树是因为结果图是非循环的一张图可能包含多个最小生成树创建的最小生成树完全依赖于初始顶点最小生成树应用铺设光缆修建铁路网等最短路径加权一个比较典型的图的应用问题例如 n个城市之间的一个公路网给定这些城市之间的公路的距离能否找到城市A到城市B之间一条距离最近的通路呢城市用顶点表示城市间的公路用边表示公路的长度作为边的权值在网中求顶点A到顶点B的所有路径中边的权值之和最小的那一条路径这条路径就是两个顶点之间的最短路径 ShortestPath 并称路径上的第一个顶点为源点 Source 最后一个顶点为终点 Destination 在不带权的图中最短路径是指两个顶点之间经历的边数最少的路径最短路径如何计算 A H A F 狄克斯特拉Dijkstra算法 Dijkstra算法找到了从任意指定顶点到任何其他顶点的最短路径而且证实可以到达图中的所有其他顶点使用了通常被称为贪心算法贪心算法把问题分解成小块或步骤并且在每一步中确定最优解用这些最优解合并生成最终的解拓扑排序实现一个有向图的拓扑有序序列的过程称为拓扑排序任何一个有向无环图其全部顶点都可以排成一个拓扑序列而其拓扑有序序列不一定是唯一的拓扑排序实现 1 找到一个没有后继顶点的顶点 2 把此顶点添加到顶点列表内 3 从图中移除掉此顶点 4 重复步骤1直到把所有顶点从图中移除掉拓扑排序应用找依赖顺序深度学习任务顺序练习找个公司项目有多个类库的建立下依赖关系通过拓扑找出编译顺序请构造一个加权图来模拟下周边建筑的交通用Dijkstra算法来确定从家到各个位置的最短路径如果没有权试试来个最小生成树展示下深度优先和广度优先高级算法两个高级主题即动态规划和贪心算法算法策略思路动态规划动态规划常被认为是递归的反向技术递归算法是从顶部开始把问题向下全部分解为小的问题进行解决直到解决整个问题为止动态规划则是从底部开始解决小的问题同时把它们合并形成大问题的一个完整解决方案斐波纳契数列 1 1 2 3 5 8 13

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

数据结构与算法

文档简介

温馨提示

最新文档

评论

数据结构与算法

文档简介

温馨提示

最新文档

评论

相关文档