Linux的基础IO:文件描述符 重定向本质

目录

前言

文件操作的系统调用接口

open函数

close函数

write函数

read函数 

注意事项

文件描述符-fd

小补充 

重定向

文件描述符的分配原则

系统调用接口-dup2

缓冲区

缓冲区的刷新策略

对于“2”的理解

小补充 


前言

        在Linux中一切皆文件,打开文件的本质是进程打开了文件,文件没有被打开时一直存放在磁盘中(进程执行时才会打开文件,文件才会从磁盘中拿出),而OS中存在很多进程,即系统中一定存在大量被进程打开的文件,对此OS会采取“先描述再组织”的原则,每个被打开的文件在OS内部都有一个类似PCB的描述文件属性的结构体。

文件 = 属性 + 内容

以w方式打开文件:

  • 文件不存在,则在当前路径下新建指定文件并写入
  • 文件存在,打开文件时会将该文件清空并写入

以a方式打开文件:

  • 文件不存在,则在当前路径下新建指定文件并写入
  • 文件存在,追加写入

>和>>:

  • > 文件 等同于 w 一个文件

  • >> 文件 等同于 a 一个文件

结论:输出重定向一定是文件操作

文件操作的系统调用接口

基本概念:文件在进程未执行时一直放在磁盘中,磁盘是硬件,向文件中写入本质就是向硬件中写入,但是用户没有权利直接向硬件中写入,需要由OS提供访问硬件的系统调用接口,而C/C++等编程语言中提供的对文件的操作接口就是对系统调用的接口的封装

open函数

函数原型: 

  • int open(const char *pathname, int flags);
  • int open(const char *pathname, int flags, mode_t mode);

包含头文件:

  • <sys/types.h>
  • <sys/stat.h>
  • <fcntl.h>

参数:

  • const char *pathname:要打开的文件绝对或相对路径
  • flags:位掩码,指定了打开方式和访问权限等信息
  • mode:指定新建文档的权限设置

flags的常见取值:

  • O_RDONLY:以只读模式打开
  • O_WRONLY:以只写模式打开
  • O_RDWR:以读写模式打开
  • O_CREAT:如若目标文档不存在则创建
  • O_TRUNC:如若目标文档存在则清空
  • O_APPEND:追加写入

返回值:操作文件成功时返回int类型的文件描述符,失败时返回 -1

功能:打开文件的系统调用函数

close函数

函数原型:int close(int fd);

包含头文件: <unistd.h>

参数:要关闭的目标文件描述符或套接字

返回值:关闭成功时返回 0,失败时返回 -1 

功能:关闭指定文件描述符或套接字,并释放与之相关联的资源

write函数

函数原型:ssize_t write(int fd, const void *buf, size_t count);

包含头文件: <unistd.h>

参数:待写入的目标文件描述符或套接字,待写入数据的缓冲区指针,待写入的字节数

返回值:写文件成功时返回实际写入到目标文件中的字节数,失败时返回 -1

功能:将buf指向的内容写入到目标文件描述符或套接字所对应对象中

read函数 

函数原型:ssize_t write(int fd, const void *buf, size_t count);

包含头文件: <unistd.h>

参数:待写入的目标文件描述符或套接字,待写入数据的缓冲区指针,待写入的字节数

返回值:写文件成功时返回实际写入到目标文件中的字节数,失败时返回 -1

功能:将buf指向的内容写入到目标文件描述符或套接字所对应对象中

        stat、fastat、lasta是三个修改文件属性的调用接口,上面的read、write等是对文件内容修改的调用接口

注意事项

1、文件的权限掩码的采用就近原则,默认为0002,uamsk(0)设置为0后就为0

2、O_RDONLY等位掩码都是类似于下列形式的宏定义(了解)

3、位掩码不同的组合有不同的效果

  • O_WRONLY | O_CREAT | O_TRUNC:实现fopen函数w打开文件时的效果
  • O_WRONLY | O_CREAT | O_APPEND:实现fopen函数a打开文件时的效果
  • O_WRONLY | O_CREAT:实现fopen函数wa打开文件时的效果

文件描述符-fd

问题一:open函数的返回值是文件描述符,我们创建四个文件并打印它们的文件描述符发现它们分别是3、4、5、6,怎么没有见0、1、2?

原因:C语言在运行时会默认打开三个流,而0、1、2就分别是标准输入流stdin(键盘)、标准输出流stdout(显示器)、标准错误流stderr(显示器)

问题二:为什么可以向1中写?fd的本质是什么 

结论:文件描述符的本质是内核的进程的文件映射关系数组的下标

        struct file处理的是用户与操作系统间的关系,而文件系统中的struct inode处理的是操作系统与硬件设备之间的关系,OS可以依据struct file中存放的信息找到struct file对应的struct inode

小补充 

       程序的本质确实是对数据进行处理,并且这些处理过程和结果需要与人类用户进行交互。在Unix/Linux系统中,0、1、2三个文件描述符分别代表标准输入、标准输出和标准错误输出。它们被默认打开并与终端设备关联,以便程序可以通过它们与用户进行交互

问题三:read和write函数如何进行读写文件?

解释:read时将文件存放在内核级缓存中的数据拷贝至上层,如果内核级缓存中没有文件的数据,就将要read的进程挂在磁盘的等待队列中,等待磁盘将相应的文件的数据放入内核级缓存后再唤醒该进程并进行拷贝,write时也是针对文件内核级缓冲区中的数据进行修改,修改后再刷新至磁盘中,因而无论读写都要在合适的时候,让OS将文件的数据读取到文件内核级缓冲区中,读写的对象都是文件内核级缓冲区中的数据,而不是磁盘级的文件数据

问题四:open函数在干什么?

解释:

  1. 创建文件
  2. 开辟内核级文件缓冲区的空间,加载文件数据(有延后性)
  3. 查看进程的文件描述符表(struct file_struct)
  4. 获取文件地址,并填入文件描述符表中
  5. 返回该文件在文件描述符表中的下标

问题五:为什么0、1、2在程序启动时默认打开?它们对应不应该是硬件吗?

补充: 硬件设备也有的struct_file,但是它们的struct_file中除了有硬件设备相关的属性外,还都包含一张指向底层操作方法(对硬件设备的操作接口)的函数指针表(每张表都一样),该表中的函数指针指向的是由硬件生产厂商的开发人员在驱动层已经写好的硬件调用接口,并且一个函数指针可以指向多个不同的硬件操作接口从而产生不同的结果(多态,write函数指针可以指向键盘、鼠标等硬件的write接口,这一功能由厂商实现的)

解释:因为在进程执行时就会将三个硬件的struct_file的地址信息放入进程struct files_struct中,数组下标0、1、2就是它们的文件标识符,而它们的struct_file中又有指向底层操作方法的函数指针,在进程尝试使用硬件设备时会通过它们的文件标识符访问到它们的struct_file进而访问到驱动层的k_read()等硬件设备操作接口

注意事项:普通文件类型的 struct file 中并不包含指向底层设备接口的函数指针表

        struct_file中的文件属性就是类中的数据,操作底层方法的指针表中的函数指针就是类中的方法,所以struct_file也可以视为C语言实现的类,多个struct_file构成了OS中的virtual file system

问题六:如何理解C语言通过FILE* 访问文件?

解释:FILE是一个由文件描述符等内容封装成的结构体,C语言中所有文件操作函数,都是对系统调用接口的封装,fopen函数是对调用接口open的封装,该函数隐式返回了文件描述符给FILE结构体,而fwrite、fread等又是对write、read调用接口的封装,fwrite等可以通过FILE中的fd访问文件

好文章:文件操作的底层原理(文件描述符与缓冲区) - 知乎 (zhihu.com)  

重定向

文件描述符的分配原则

基本概念:查自己的文件描述表,分配最小的没有被使用的fd

尝试为一个普通文件分配fd = 1,并调用printf和fprintf函数向显示器上打印内容:

现象: 本来应该打印到显示器上的内容,却打印到了一个指定的文件中,这种技术叫重定向

结论:重定向的本质就是在内核中改变文件描述符表特定下标的内容,与上层无关,重定向也可以视为对open和dup2接口的封装:

int fd = open("output.txt", O_WRONLY | O_CREAT | O_TRUNC, 0644);
dup2(fd, STDOUT_FILENO); //原 > 目标

如果想要实现追加重定向>>,那么就只需更改open函数的参数:

int fd = open("output.txt", O_WRONLY | O_CREAT | O_APPEND, 0644);
dup2(fd, STDOUT_FILENO); //原 > 目标

接着尝试注释fflush,注释fflush和close、注释close:

解释:stdin、stdout、stderr的struct_file中除了有_fileno还有语言级别的文件缓冲区,printf和fprintf函数会先将要打印的内容放入stdoutd的struct_file中的文件缓冲区中,由fflush(stdout)指令将该缓冲区中的数据刷新至log.txt的内核文件缓冲区中(因为此时fd = 1指向的是log.txt),最后由OS定期将log.txt内核级文件缓冲区中的数据刷新至磁盘中:注释fflush就会导致stdout的struct_file中的文件缓冲区数据无法刷新至内核级的文件缓冲区并且文件描述符还被关闭了即使在最后操作系统想要帮助刷新也不可能了(如果你没有显式地刷新 stdout 缓存或关闭该进程所占据的资源,则操作系统可能会自动地执行这些操作以确保程序正常结束并释放相关资源,跟\n没关系,即使你这里将\n去除也不会刷新缓冲区只有stdout与显示器关联时才能刷新,\n在这里只有换行作用,本质是行刷新和全缓冲刷新的不同,刷新策略中有解释)

结论:fflush(stdout)是为了将stdout的语言级文件缓冲区中的内容刷新至内核级文件缓冲区中

系统调用接口-dup2

函数原型:int dup2(int oldfd,int newfd);

包含头文件:<unistd.h>

参数:源文件描述符,目标文件描述符

返回值:成功返回目标文件描述符,失败返回-1

功能:使得目标文件描述符共享源文件描述符所对应的 数据

缓冲区

基本概念:缓冲区分为用户级(语言级)缓冲区和内核级缓冲区,是一段内存空间

优点:缓冲区的分级有利于解耦、提高使用者的效率、提高刷新IO效率

问题:为什么C语言可以通过调用接口直接向内核级缓冲区写数据,还要提供对调用接口重新封装后的接口并先将数据写到语言级缓冲区呢?

解释:调用系统接口是有成本的,多次频繁的使用write等系统调用接口向内核级缓冲区中写一些很少的数据会造成资源浪费,而使用了封装后的fwrite接口就可以先将这些内容放入语言级缓冲区中,放入之后就可以结束fwrite进行下一步操作等语言级的缓冲区中的数据达到一定程度时仅调用一次系统调用接口,就可以将多次写入的少量数据一次性的放入内核级缓冲区中并且写入后向磁盘刷新的操作也有OS自行完成不需要用户管,这样就即提高了使用者的效率(把快递交给快递员而不是亲自去送,交给后就不用管了可以去干其它内容),又提高了刷新IO的效率(将一段时间内的所有接收到的快递装车一块去配送,而不是接受一件配送一件,并且应该由专门的快递配送员配送,相比于寄件人他们知道配送的流程,寄件人了乐于有人帮自己干活)

缓冲区的刷新策略

对于用户 / 内核级的缓冲区都适用,但是这里我们只关心用户级的

立即刷新(近似于无缓冲)

1、用户级接口:fflush(stdout)强制刷新用户级的缓冲区至内核级缓冲区

2、内核级接口:int fsync(int fd)强制刷新内核级的缓冲区至磁盘

行刷新

显示器的行刷新是为了便于用户观看数据

全缓冲

缓冲区写满才刷新,一般是普通文件(此时\n只起到换行作用)

特殊情况

1、进程退出,系统会自动刷新

2、强制刷新

注意事项:

1、不同平台的刷新策略不同

2、子进程不会继承父进程在用户级缓冲区中刷新过的内容

关于完善shell中重定向的内容在22的2:30处,一小时左右

对于“2”的理解

基本概念:1和2中的内容都是显示器文件的struct file

问题一:为什么要有2?

解释:分离程序中出现的正确和错误的消息,正确的信息向1中打,错误的信息向2中打,再通过重定向建立存放正确和错误信息的两个文件

问题二:>是标准输出重定向,只会更改1号fd中的内容,如何将2和1定向至同一文件中?

解释:. / a.out 1>all.log 2>&1,先将1获取到的正确内容放入all.log文件中,然后将2获取到的错误的内容放入1放入的文件中(由取地址&实现)

小补充 

perror函数本质上是向2中打印,printf本质上是向1中打印的:

~over~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/608551.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

springcloud服务间调用 feign 的使用

引入依赖包 <!-- 服务调用feign --><dependency><groupId>org.springframework.cloud</groupId><artifactId>spring-cloud-starter-openfeign</artifactId></dependency>创建调用外部服务的接口 需要使用的地方注入 使用 启动类增…

CTFHUB-技能树-Web题-RCE(远程代码执行)-eval执行

CTFHUB-技能树-Web题-RCE&#xff08;远程代码执行&#xff09; 文章目录 CTFHUB-技能树-Web题-RCE&#xff08;远程代码执行&#xff09;eval执行解题方法&#xff1a;构造网址&#xff0c;查找当前目录文件并没有发现flag,接着查看上一级目录接着查看上一级接着查看上一级目录…

luceda ipkiss教程 66:金属线的钝角转弯

案例分享&#xff1a;金属线的135度转弯&#xff1a; 所有代码如下&#xff1a; from si_fab import all as pdk import ipkiss3.all as i3 from ipkiss.geometry.shape_modifier import __ShapeModifierAutoOpenClosed__ from numpy import sqrtclass ShapeManhattanStub(__…

一种快速H.264 NALU快速搜索算法

1. 引言 在播放H.264码流的时候,进行NALU的搜索的效率高低影响着系统的性能。有采用普通逐字节搜索的算法,有利用cpu的simd的单指令多数据操作的并行功能进行搜索的算法,今天要介绍的是一个非常简单而且高效的快速搜索算法,而且不需要利用simd指令,搜索的速度甚至快于我之…

Spring-依赖来源

依赖来源 1 Spring BeanDefinition&#xff08;xml,注解&#xff0c;BeanDefinitionBuilder, 还有API实现的单例对象&#xff09; 2 Spring 内建BeanDefinition 3 内建单例对象 依赖注入和依赖查找的区别 Context.refresh() 的时候会调用这个方法&#xff1a;prepareBeanF…

如何通过wifi网络将串口数据发送到多个设备

摘要&#xff1a;当lora电台的速率无法满足高速传输时&#xff0c;可以考虑用“串口服务器”。本文介绍一下如何使用TP-LINK的TL-CPE300D实现一对多的数据发送。 当前也有使用lora电台的&#xff0c;但是lora电台支持的速率有限&#xff0c;可能最大支持到9600&#xff0c;甚至…

[虚拟机+单机]梦幻契约H5修复版_附GM工具

本教程仅限学习使用&#xff0c;禁止商用&#xff0c;一切后果与本人无关&#xff0c;此声明具有法律效应&#xff01;&#xff01;&#xff01;&#xff01; 教程是本人亲自搭建成功的&#xff0c;绝对是完整可运行的&#xff0c;踩过的坑都给你们填上了 视频演示 [虚拟机单…

【电路笔记】-Twin-T振荡器

Twin-T振荡器 文章目录 Twin-T振荡器1、概述2、Twin-T振荡器3、Twin-T放大4、Twin-T 振荡器示例5、总结Twin-T 振荡器是另一种 RC 振荡器电路,它使用两个并联的 RC 网络来产生单一频率的正弦输出波形。 1、概述 Twin-T 振荡器是另一种类型的 RC 振荡器,它产生正弦波输出,用…

PTP 对时协议 IEEE1588 网络对时 硬件基础

前言 在很多应用场景有精确对时的需求&#xff0c;例如车载网络&#xff0c;音视频流&#xff0c;工业网络。本文档将会阐述对时的硬件需求。 协议 流行的协议为 IEEE1588 标准指定的对时方法&#xff0c;名为 PTP 对时协议。 网卡硬件要求 找到某型网卡的特性描述&#x…

Antd Table组件,state改变,但是render并不会重新渲染

背景 在table上面&#xff0c;当鼠标放在cell上面的时候&#xff0c;需要去请求接口拉取数据&#xff0c;然后setList(res.result)后&#xff0c;希望render中的traceIds也能够实时更新渲染。 const [traceIds, setTraceIds] useState() // 需要展示在popover上面的数据&…

基于STM32F401RET6智能锁项目(环境搭建)

工程搭建 MDK&#xff0c;固件库&#xff0c;芯片包下载 下载keil5&#xff0c;stm32f4xx的固件库以及stm32f4的芯片包 keil官网&#xff1a;https://www2.keil.com/mdk5/ stm32中国官网&#xff1a;https://www.stmcu.com.cn/ 创建工程 1、新建一个工程文件夹&#xff0c;…

漫威争锋Marvel Rivals怎么搜索 锁区怎么搜 游戏搜不到怎么办

即将问世的《漫威争锋》&#xff08;Marvel Rivals&#xff09;作为一款万众期待的PvP射击游戏新星&#xff0c;荣耀携手漫威官方网站共同推出。定档5月11日清晨9时&#xff0c;封闭Alpha测试阶段将正式揭开序幕&#xff0c;持续时间长达十天之久。在此首轮测试窗口&#xff0c…

加速科技突破2.7G高速数据接口测试技术

随着显示面板分辨率的不断提升&#xff0c;显示驱动芯片&#xff08;DDIC&#xff09;的数据接口传输速率越来越高&#xff0c;MIPI、LVDS/mLVDS、HDMI等高速数据接口在DDIC上广泛应用。为满足高速数据接口的ATE测试需求&#xff0c;作为国内少数拥有完全自研的LCD Driver测试解…

Facebook消息群发脚本的制作思路!

在数字化社交日益盛行的今天&#xff0c;Facebook作为全球最大的社交平台之一&#xff0c;为企业和个人提供了广阔的交流与合作空间。 然而&#xff0c;手动向大量用户发送消息既耗时又低效&#xff0c;因此&#xff0c;开发一款能够自动群发消息的脚本成为了许多人的需求&…

JavaWeb之Servlet(上)

前言 1. 什么是Servlet (1) Servlet介绍 (2) Servlet运行于支持Java的应用服务器中。 (3) Servlet工作模式&#xff1a; 2. Servlet API 3. 第一个Servlet (1) 创建一个类实现Servlet接口,重写方法。或继承HttpServlet亦可 (2) 在web.xml文档中配置映射关系 标签的执行…

48. UE5 RPG 实现攻击伤害数字显示

在前面的文章中&#xff0c;我们实现了对敌人的攻击的受击效果&#xff0c;并且能够降低目标的血量&#xff0c;实现死亡效果。相对于正常的游戏&#xff0c;我们还需要实现技能或者攻击对敌人造成的伤害数值&#xff0c;并直观的显示出来。 所以&#xff0c;接下来&#xff0c…

电商核心技术揭秘52:数字化内容营销创新

相关系列文章 电商技术揭秘相关系列文章合集&#xff08;1&#xff09; 电商技术揭秘相关系列文章合集&#xff08;2&#xff09; 电商技术揭秘相关系列文章合集&#xff08;3&#xff09; 电商技术揭秘四十一&#xff1a;电商平台的营销系统浅析 电商技术揭秘四十二&#…

通过Docker Compose部署GitLab和GitLab Runner(一)

GitLab 是一个用于版本控制、项目管理和持续集成的开源软件平台&#xff0c;它提供了一整套工具&#xff0c;能够帮助团队高效地协作开发。而 GitLab Runner 则是 GitLab CI/CD 的执行者&#xff0c;用于运行持续集成和持续交付任务。 在本文中&#xff0c;我们将使用 Docker …

虚拟机装CentOS镜像

起先&#xff0c;是先安装一个VM虚拟机&#xff0c;再去官方网站之类的下载一些镜像&#xff0c;常见镜像有CentOS镜像&#xff0c;ubantu镜像&#xff0c;好像还有一个树莓还是什么的&#xff0c;软件这块&#xff0c;日新月异&#xff0c;更新太快&#xff0c;好久没碰&#…

C程序内存分布及static变量

C程序内存分布及static变量 C语言中程序的内存分布 [&#x1f517;1](https://www.cnblogs.com/miaoxiong/p/11021827.html)[&#x1f517;2](https://blog.csdn.net/chen1083376511/article/details/54930191)c/c编译连接后二进制文件的存储动静态存储方式和存储区动态存储方式…
最新文章