chn10 文件组织与数据存储_第1页
chn10 文件组织与数据存储_第2页
chn10 文件组织与数据存储_第3页
chn10 文件组织与数据存储_第4页
chn10 文件组织与数据存储_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

文件管理之

文件组织与数据存储陈鹤年

2014.116.3文件组织与数据存储6.3.1文件的存储6.3.2文件的逻辑结构6.3.3文件的物理结构6.3.1文件的存储1.存储介质:通用存储介质有磁盘、磁带、光盘、U盘。2.卷:是存储介质的物理单位,一张光盘、一卷磁带、一个磁盘分区都称为一卷。3.块:是一块连续区域,也称为物理记录。块是主存与外村交换信息的单位。即:存取信息是按块进行存(写)或读(取),启动一次I/O可以完成一块或若干块信息的读写。块的大小决于用户意愿、传输速率、设备属性。不同类型的存储介质,块的长短常常各不相同;同一类型的存储介质,块的长短也可以不同。磁盘物理块一般是512B.4.缝隙:由于设备机械属性,相邻块之间留有缝隙,不能存储数据。

6.3.1文件的存储5.内存里的文件与磁盘文件文件逻辑示意图

6.3.2文件的逻辑结构

(1)文件组织:指文件中信息的组织配置和构造方式。分为文件的逻辑结构和组织和文件的物理结构组织。(2)文件的逻辑结构和组织:是从用户观点出发,研究用户概念中的信息组织方式,这是用户能观察到,不考虑设备属性可对独立对数据集合进行处理。(3)文件的逻辑结构基本形式有:①流式文件;②记录文件;1.流式文件和记录文件(4)流式文件:是一串有序的字节信息集合,在流文件里,每个字节建立一个索引,从0开始编号,打开文件是读取位置是首字节。根据具体情况,每次读取如干字节。①流文件是无结构文件,数据不再组成记录,但可以看成是只有一个记录的记录式文件。

②文件常按长度来读取所需信息,也可用插入特殊字符作为分界。

③文件系统提供read、write和seek结构进行读取定位。6.3.2文件的逻辑结构

1.流式文件和记录文件(5)记录式文件:文件由若干记录构成,包含若干逻辑记录,逻辑记录是文件中按信息在逻辑上的独立含意划分的信息单位。记录大小是各字段取值之和;记录是记录文件的最小信息单位,每次只能进行一条记录的操作;记录文件是有结构文件,记录按照记录差生顺序编号。(6)记录文件的组织方法:①记录式顺序文件:②记录式索引顺序文件:6.3.2文件的逻辑结构

下面是一个典型的记录式文件中的内容:090601010罗小宁女1988年5月江苏连云港090601011王朔男1989年8月江苏南京……

……

……

……

……1.流式文件和记录文件2.

成组和分解:解决记录是如何存储在磁盘上以及逻辑记录和磁盘块的关系是什么?(1)成组操作:为了节约空间和减少I/O启动次数。逻辑记录是按信息在逻辑上的独立划分的单位,块是存储介质上连续信息所组成的区域。一条逻辑记录被存放到文件存储器的存储介质上时,可能占用一块或多块,也可以一个物理块包含多个逻辑记录。(2)成组:若干记录合并在一起写入在一个块中。成组过程在缓冲区里完成,缓冲满了就启动一次I/O,完场写一次。6.3.2文件的逻辑结构

逻辑记录1逻辑记录2逻辑记录3物理记录即物理块逻辑记录用户缓冲区系统缓冲区2.

成组和分解:

(3)

块因子:每块存储记录的个数。

例题:下图表示一个物理块存放3条逻辑记录,即成块因子是3,这样启动1次I/O可以读写3条逻辑记录。6.3.2文件的逻辑结构

一块物理记录逻辑1逻辑2逻辑32.

成组和分解:(4)分解:把一个物理块读入系统缓冲区后,把该块中包含的若干记录分离出来的操作。6.3.2文件的逻辑结构

3.记录格式记录格式就是数据项在记录里的排列方式,它影响着数据读写效率。记录长度是一条记录数据项的总字节长度,也影响读写。根据记录长度把记录分为:(1)定长记录,易控制,但费空间,最后一块记录不超过成组因子。(2)变长记录:各条记录长度不一,控制难,但是省空间。读取时需要登记字节个数和相应信息。(3)跨块记录,当处理变长记录是可能产生一条逻辑记录超过物理块大小,即存储跨快。需要OS分段处理。6.3.2文件的逻辑结构

6.3.2文件的逻辑结构

•记录键,标示不同记录的关键字。主键,次键单键记录,多键记录4.记录键6.3.3文件的物理结构

1.物理文件:文件的物理结构和组织是指逻辑文件在物理存储空间中存放方法和组织关系,即文件逻辑结构在存储物理设备上形成的物理块集合。

2.文件物理存储结构影响因素:

(1)存储设备;

(2)块的划分、记录的排列、索引的组织、信息的搜索,其优劣直接影响文件系统的性能。第一类计算法:通过映射算法把逻辑记录与物理记录建立对应关系,其中能直接寻址、计算寻址、顺序等的文件都属于。常用于目录文件、顺序文件常采用此方法。第二类指针法:借用指针实现。常用于索引文件、索引顺序文件、连接文件等。文件物理结构的确定取决于用户的意图和物理设备的属性。

3.文件物理结构的构造方法6.3.3文件的物理结构(1)顺序物理文件(连续文件)文件中逻辑上连续的信息存放到存储介质的依次相邻的块上便形成顺序文件。FCB中保存第一物理块地址和文件物理总块数。用于磁带文件、打印文件等。逻辑记录顺序和物理记录顺序完全一致的文件,通常记录按出现的次序被读出或修改。顺序文件的优点/缺点有点:存取速度快、适应系统文件;缺点:要预判文件长度,以后不易插入、修改,不适应变长记录。6.3.3文件的物理结构4.文件物理结构的组织(形式)方法连续存储文件连续存储文件示意图共5个文件(2)连接文件(串联文件)结构示意图文件目录项……06.3.3文件的物理结构4.文件物理结构的组织(形式)方法连接文件存储连接文件示意图链接文件分区表

连接文件使用连接字,又叫指针来表示文件中各个记录之间的关系连接结构的优缺点:分散存储,易扩充6.3.3文件的物理结构3.2连接文件(串联文件)特点4.文件物理结构的组织(形式)方法(3)直接文件(哈希文件)记录的关键字与其地址间可通过某种方式建立对应关系,利用这种关系实现存取的文件叫直接文件。它首先把文件名转换成FCB所在磁盘地址索引,根据目录索引找到相应物理块,然后读入缓冲区;逐项比较找到需要的FCB。6.3.3文件的物理结构4.文件物理结构的组织(形式)方法(4)索引文件索引结构是实现非连续存储的另一种方法,适用于数据记录保存有随机存取存储设备上的文件。使用索引表,每个表目包含一个记录的键及其记录数据的存储地址,这类文件称索引文件。6.3.3文件的物理结构记录键数据块地址4.文件物理结构的组织(形式)方法索引文件存储索引文件示意图

索引文件索引顺序文件索引顺序文件是顺序文件的扩展,各记录本身在介质上也顺序排列,有直接处理和修改记录的能力。索引顺序文件能象顺序文件一样进行快速顺序处理,既允许按物理存放次序(记录出现的次序);也允许按逻辑顺序(由记录主键决定的次序)进行处理。多级索引文件二级索引。二级索引表的表项列出一级索引表每一块最后一个索引项的键值及该索引表区的地址,若干个记录的索引本身也是一种记录。查找时先查看二级索引表找到某键所在的索引表区地址,再搜索一级索引表找出数据记录。三级索引。多级文件索引示意图U

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论