程序访问文件的几种方式

IO

程序访问文件的几种方式

读取和写入文件 I/O 操作都调用操作系统提供的接口。因为磁盘设备是由操作系统管理的,应用程序要访问物理设备只能通过系统调用的方式来工作。读和写分别对应 read() 和 write() 两个系统调用。而只要是系统调用就可能存在内核空间地址和用户空间地址切换的问题,这也是为什么操作系统为了保护系统本身的运行安全而将内核程序运行使用的内存空间和用户程序运行的内存空间进行隔离造成的。虽然这样可以保证内核程序运行的安全性,但是也存在数据可能需要从内核空间向用户空间复制的问题。

如果遇到非常耗时的操作,如磁盘 I/O, 数据从磁盘复制到内核空间,然后又从内核空间复制到用户空间,将会非常缓慢。这时操作系统为了加速 I/O 访问,在内核空间使用缓存机制,也就是将从磁盘读取的文件按照一定的组织方式进行缓存,如果用户程序访问的是同一段磁盘地址的空间数据,那么操作系统将从内核缓存中直接取出返回给用户程序,这样就可以减小 I/O 的响应时间。

1. 标准访问文件的方式

标准访问文件的方式就是当应用程序调用 read() 接口时,操作系统检查在内核的高速缓存中有没有需要的数据,如果已经缓存了,那么就直接从缓存中返回,如果没有,则从磁盘中读取,然后缓存在操作系统的缓存中。

写入的方式是,用户的应用程序调用 write() 接口将数据从用户地址空间复制到内核地址空间的缓存中。这时对用户程序来说写操作就已经完成了,至于什么时候再写到磁盘中由操作系统决定,除非显示地调用 sync 同步命令。

标准访问文件的方式如下图所示:

这里写图片描述

2. 直接 I/O 的方式

直接 I/O 方式就是应用程序直接访问磁盘数据,而不经过操作系统内核数据缓冲区,这样做的目的就是减少一次从内核缓冲区到用户程序缓存的数据复制。此种方式通常是在对数据的缓存管理由应用程序实现的数据库管理系统中。如在数据库管理系统中,系统明确的知道应该缓存哪些数据,应该失效哪些数据,还可以对一些热点的数据进行预加载,提前将热点数据加载到内存,可以加速数据的访问效率。在这些情况下,如果是由操作系统进行缓存,则很难做到,因为操作系统并不知道哪些是热点数据,哪些数据是访问一次后再也不会访问了,操作系统就是简单的缓存最近一次从磁盘读取的数据。

但是直接 I/O 也有负面的影响,如果访问的数据不再应用程序缓存中,则每次数据的加载都需要从磁盘读取,样加载的话速度非常的慢,通常是直接 I/O 与 异步 I/O 结合使用,会得到较好的性能。

直接 I/O 的方式如下图所示:

这里写图片描述

3. 同步访问文件的方式

同步访问文件的方式就是数据的读取和写入都是同步操作的,它与标准访问文件的方式不同的是,只有当数据被成功写到磁盘时才返回给应用程序成功的标志。

这种访问文件的方式性能比较差,只有在一些数据安全性要求比较高的场景中才会使用,而且通常这种方式的硬件都是定制的。

同步访问文件的方式如下图所示:

这里写图片描述

4. 异步访问文件的方式

异步访问文件的方式就是当访问数据的线程发出请求之后,线程会接着去处理其他事情,而不是阻塞等待,当请求的数据返回后继续处理下面的操作。这种方式可以明显的提高应用程序的效率,但是不会改变访问文件的效率。

异步访问文件的方式如下图所示:

这里写图片描述

5. 内存映射的方式

内存映射的方式是指操作系统将内存中的某一块区域与磁盘中的文件关联起来,当要访问内存中的一段数据时,转换为访问文件的某一段数据。这种方式的目的同样是减少数据从内核空间缓存到用户空间缓存的数据复制操作,因为这两个空间的数据是共享的。

内存映射的方式如下图所示:

这里写图片描述

注:以上参考书籍《深入分析Java Web 技术内幕修订版》许令波,更多精彩知识还请看原书。

×

纯属好玩

扫码支持
扫码打赏,你说多少就多少

打开支付宝扫一扫,即可进行扫码打赏哦

文章目录
  1. 1. IO
    1. 1.1. 程序访问文件的几种方式
      1. 1.1.1. 1. 标准访问文件的方式
      2. 1.1.2. 2. 直接 I/O 的方式
      3. 1.1.3. 3. 同步访问文件的方式
      4. 1.1.4. 4. 异步访问文件的方式
      5. 1.1.5. 5. 内存映射的方式