C语言学习
文件操作
友情链接:C语言专栏
文章目录
前言:
在编程世界中,数据持久化是每个开发者都必须掌握的核心技能。C语言作为系统级编程语言的代表,其文件操作功能既强大又灵活。本文将带你全面了解C语言文件操作的方方面面,从基本概念到高级技巧,通过大量代码示例帮助你快速掌握文件读写的精髓。无论你是初学者还是希望巩固基础的开发者,这篇文章都将为你提供实用的知识和技巧。
一、为什么使用文件
已知,我们所写的程序的数据是存储在电脑的内存上的,如果程序退出,内存回收,数据就丢失了,等再次运行程序,是看不到上次程序的数据的。那我们该如何将数据进行持久化的保存,此时,我们就可以使用文件。
那什么是文件呢?
二、什么是文件
磁盘(硬盘)上的文件是文件。
咱们这里对硬盘和内存做个简单说明,就拿"12+512"的电脑来说吧:“12+512”=12GB(运行)内存+512GB固态硬盘。
但是在程序设计中,我们一般谈的文件有两种:程序文件、数据文件(从文件功能的角度来分类的)。
2.1 程序文件
程序文件包括源程序文件(后缀为.c),目标文件(windows环境后缀为.obj),可执行程序(windows环境后缀为.exe)。
2.2 数据文件
有时文件的内容不定是程序,而是程序运行时读写的数据,比如程序运行需要从中读取数据的文件,或者输出内容的文件。
咱们主要来说数据文件。
或许咱们以前所处理数据的输入输出都是以终端为对象的,即从终端的键盘输入数据,运行结果显示到显示器上。
其实有时候我们会把信息输出到磁盘上,当需要的时候再从磁盘上把数据读取到内存中使用,这里处理的就是磁盘上文件。
2.3 文件名
既然都说文件了,咱们就不得不了解一下文件名。
对于⼀个文件它有⼀个唯⼀的文件标识,以便用户识别和引用。
文件名包含3部分:文件路径+文件名主干+文件后缀
示例: D:\code\test.txt
D:\code\
——文件路径
test
——文件名主干
.txt
——文件后缀
平时为了方便,文件标识常被称为文件名。
三、二进制文件和文本文件
根据数据的组织形式,数据文件又分为文本文件或者二进制文件。
二进制文件:
数据在内存中以⼆进制的形式存储,如果不加转换的输出到外存的文件中,就是⼆进制文件。
文本文件:
如果要求在外存上以ASCII码的形式存储,则需要在存储前转换。以ASCII字符的形式存储的文件就是文本文件。
怎么理解呢?我们来看看⼀个数据在文件中是怎么存储的:
字符⼀律以ASCII形式存储,数值型数据既可以用ASCII形式存储,也可以使用二进制形式存储。
如有整数10000,如果以ASCII码的形式输出到磁盘,则磁盘中占用5个字节(每个字符⼀个字节),而二进制形式输出,则在磁盘上只占4个字节。 图示:
四、文件的打开和关闭
4.1 流和标准流
4.1.1 流
我们程序的数据需要输出到各种外部设备,也需要从外部设备获取数据,不同的外部设备的输入输出操作各不相同,为了方便程序员对各种设备进行方便的操作,我们抽象出了流的概念,我们可以把流想象成流淌着字符的河。
C程序针对文件、画面、键盘等的数据输入输出操作都是通过流操作的。
⼀般情况下,我们要想向流里写数据,或者从流中读取数据,都是要打开流,然后操作。
流的主要作用是将数据从一个地方传输到另一个地方,例如从文件读取数据或向文件写入数据。
4.1.2 标准流
那为什么我们从键盘输入数据,向屏幕上输出数据,我们并没有打开流呢?
那是因为C语言程序在启动的时候,默认打开了3个流:
- stdin - 标准输入流,在大多数的环境中从键盘输入,scanf函数就是从标准输入流中读取数据。
- stdout - 标准输出流,大多数的环境中输出至显示器界面,printf函数就是将信息输出到标准输出流中。
- stderr - 标准错误流,大多数环境中输出到显示器界面。
正是因为默认打开了这三个流,我们在使用scanf、printf等函数就可以直接进行输入输出操作的。
stdin、stdout、stderr 三个流的类型是:FILE*
,通常称为文件指针。
C语言中,就是通过FILE*
的文件指针来维护流的各种操作的。
4.2 文件指针
每个被使用的文件都在内存中开辟了一个相应的文件信息区,用来存放文件的相关信息(如文件的名字,文件状态及文件当前的位置等)。这些信息是保存在⼀个结构体变量中的。该结构体类型是由系统声明的,取名 FILE
。
例如,VS2013 编译环境提供的stdio.h
头文件中有以下的文件类型申明:
struct _iobuf
{
char* _ptr;
int _cnt;
char* _base;
int _flag;
int _file;
int _charbuf;
int _bufsiz;
char* _tmpfname;
};
typedef struct _iobuf FILE;
不同的C编译器的FILE类型包含的内容不完全相同,但是大同小异。
每当打开一个文件的时候,系统会根据文件的情况自动创建⼀个FILE结构的变量,并填充其中的信息,使用者不必关心细节。
⼀般都是通过⼀个FILE的指针来维护这个FILE结构的变量,这样使用起来更加方便。
下面我们可以创建⼀个FILE*的指针变量:
FILE* pf;//文件指针变量
定义pf是⼀个指向FILE类型数据的指针变量。可以使pf指向某个文件的文件信息区(是⼀个结构体变量)。通过该文件信息区中的信息就能够访问该文件。也就是说,通过文件指针变量能够间接找到与它关联的文件。图示:
4.3 文件的打开和关闭
文件在读写之前应该先打开文件,在使用结束之后应该关闭文件。也可以说打开或者关闭文件流。
在编写程序的时候,在打开文件的同时,都会返回⼀个FILE*的指针变量指向该文件,也相当于建立了指针和文件的关系。
ANSI C 规定使用fopen
函数来打开文件,fclose
来关闭文件。
函数原型:
//打开文件
FILE* fopen(const char* filename, const char* mode);
//关闭文件
int fclose(FILE* stream);
我们来看一下fopen函数中的参数mode:
mode表示文件的打开模式,打开模式如下表。
- 文本文件模式
文件使用方式 | 含义 | 如果指定文件不存在 |
---|---|---|
“r” (只读) | 为了输入数据,打开一个已经存在的文本文件 | 出错 |
“w” (只写) | 为了输出数据,打开一个文本文件 | 建立新文件 |
“a” (追加) | 向文本文件尾添加数据 | 建立新文件 |
- 二进制文件模式
文件使用方式 | 含义 | 如果指定文件不存在 |
---|---|---|
“rb” (只读) | 为了输入数据,打开一个二进制文件 | 出错 |
“wb” (只写) | 为了输出数据,打开一个二进制文件 | 建立新文件 |
“ab” (追加) | 向一个二进制文件尾添加数据 | 建立新文件 |
- 读写混合模式
文件使用方式 | 含义 | 如果指定文件不存在 |
---|---|---|
“r+” (读写) | 为了读和写,打开一个文本文件 | 出错 |
“w+” (读写) | 为了读和写,新建一个文本文件 | 建立新文件 |
“a+” (读写) | 打开一个文件,在文件尾进行读写 | 建立新文件 |
“rb+” (读写) | 为了读和写打开一个二进制文件 | 出错 |
“wb+” (读写) | 为了读和写,新建一个二进制文件 | 建立新文件 |
“ab+” (读写) | 打开一个二进制文件,在文件尾进行读和写 | 建立新文件 |
“w” (只写) 与 “a” (追加)的区别
只写会将原文本(如果存在的话)中的内容删除。而追加不会删除原来的内容。
#include <stdio.h>
int main()
{
FILE* pf;
//打开文件
pf = fopen("test.txt", "w");
if (pf == NULL)//打开失败
{
perror("fopen");
return 1;
}
//文件操作
//……
//关闭文件
fclose(pf);
pf = NULL;
return 0;
}
五、文件的顺序读写
5.1 顺序读写函数介绍
- 字符与文本行操作函数
函数名 | 功能 | 适用范围 |
---|---|---|
fgetc | 字符输入函数 | 所有输入流 |
fputc | 字符输出函数 | 所有输出流 |
fgets | 文本行输入函数 | 所有输入流 |
fputs | 文本行输出函数 | 所有输出流 |
- 格式化I/O函数
函数名 | 功能 | 适用范围 |
---|---|---|
fscanf | 格式化输入函数 | 所有输入流 |
fprintf | 格式化输出函数 | 所有输出流 |
- 二进制数据操作函数
函数名 | 功能 | 适用范围 |
---|---|---|
fread | 二进制输入 | 文件输入流 |
fwrite | 二进制输出 | 文件输出流 |
我们就来依次使用一下这些顺序读写函数吧。
- fgetc与fputc
fputc
函数原型:
int fputc(int char, FILE *stream);
解释:
参数说明
char:这是要写入的字符。该字符以其对应的 int 值进行传递。
stream:这是指向 FILE 对象的指针,该 FILE 对象标识了要被写入字符的流。
返回值
如果没有发生错误,fputc 函数返回被写入的字符。如果发生错误,则返回 EOF(-1),并设置错误标识符
使用示例:
#include <stdio.h>
int main()
{
//打开文件
FILE* pf = fopen("test.txt", "w");
if (pf == NULL)
{
perror("fopen");
return 1;
}
//写入(将26个英文字母都放入)
int i = 0;
while (i < 26)
{
char ch = 'a' + i;
fputc(ch, pf);
i++;
}
//关闭文件
fclose(pf);
pf = NULL;
return 0;
}
来看一下效果:
在这里,我们来看看文件位置指针(文件光标):
在未写入’a’之前,指向:
写入’a’之后:
文件光标的自动移动机制解析:
每次成功执行读写操作后,光标会自动向后移动;
移动的字节数取决于实际读写的数据量。
举例:
fgetc(fp); // 读取1个字符后,指针后移1字节
fgets(buf, 100, fp); // 读取一行后,指针移动到下一行开头
fread(buf, sizeof(int), 5, fp); // 读取5个int后,指针移动5*sizeof(int)字节
fgetc
函数原型:
int fgetc(FILE *stream);
解释:
参数stream是指向FILE对象的指针,该对象标识了要执行读取操作的流。如果读取成功,函数以无符号字符强制转换为int的形式返回读取的字符。如果到达文件末尾或发生读取错误,则返回EOF。
使用示例:
#include <stdio.h>
int main()
{
FILE* pf = fopen("test.txt", "r");
if (pf == NULL)
{
perror("fopen");
return 1;
}
//读出
int ch;
while ((ch = fgetc(pf)) != EOF)
{
printf("%c", ch);
}
fclose(pf);
pf = NULL;
return 0;
}
- fgets与fputs
fputs
函数原型:
int fputs(const char *str, FILE *stream)
解释:
str参数是一个字符串,包含了要写入的以空字符(‘\0’)终止的字符序列,而stream参数是指向FILE对象的指针,该FILE对象标识了要被写入字符串的流。正常写入返回一个非负值,如果发生错误则返回EOF。
使用示例:
#include <stdio.h>
int main()
{
FILE* pf = fopen("test.txt", "w");
if (pf == NULL)
{
perror("fopen");
return 1;
}
//写入
fputs("第一次写入。", pf);
fputs("第二次写入。", pf);
fclose(pf);
pf = NULL;
return 0;
}
fgets
函数原型:
char *fgets(char *str, int n, FILE *stream)
解释:
参数说明
str 是指向字符数组的指针,该数组用于存储读取的字符串。
n 是要读取的最大字符数,包括最后的空字符。
stream 是指向 FILE 对象的指针,该对象标识了要从中读取字符的流。
返回值说明:
如果读取成功,fgets 函数返回 str 参数指向的同一个字符串。如果到达文件末尾或没有读取到任何字符,str 的内容保持不变,并返回一个空指针。如果发生错误,也返回一个空指针。
使用示例:
int main()
{
FILE* pf = fopen("test.txt", "r");
if (pf == NULL)
{
perror("fopen");
return 1;
}
//读取
char str[20] = { 0 };
fgets(str, 9, pf);
//输出
printf("%s", str);
fclose(pf);
pf = NULL;
return 0;
}
- fscanf与fprintf
咱们已经对scanf与printf不陌生了,咱们对比进行学习。
fprintf使用示例:
#include <stdio.h>
struct S
{
char name[20];
int age;
float height;
};
int main()
{
FILE* pf = fopen("test.txt", "w");
if (pf == NULL)
{
perror("fopen");
return 1;
}
struct S s = { "zhangsan",20,175.0 };
//写入
fprintf(pf, "%s %d %f", s.name, s.age, s.height);
fclose(pf);
pf = NULL;
return 0;
}
结果
fscanf使用示例:
#include <stdio.h>
struct S
{
char name[20];
int age;
float height;
};
int main()
{
FILE* pf = fopen("test.txt", "r");
if (pf == NULL)
{
perror("fopen");
return 1;
}
struct S s = { 0 };
//读取(继上面代码写入的数据)
fscanf(pf, "%s %d %f", s.name, &s.age, &s.height);
printf("%s %d %f", s.name, s.age, s.height);
fclose(pf);
pf = NULL;
return 0;
}
输出:
也可以说,此时的文件就在读取、写入时相当于咱们平时经常用的键盘输入和屏幕输出。只是流不同。
- fread与fwrite
fwrite
函数原型:
size_t fwrite(const void *ptr, size_t size, size_t count, FILE *stream);
解释:
ptr是指向要写入数据的内存地址的指针
size是每个数据项的大小(以字节为单位),
count是数据项的个数,
stream是指向FILE对象的指针,该对象指定了输出流。
返回值是成功写入的数据项的个数。如果返回值与count参数不同,则表明发生了错误。
使用示例:
#include <stdio.h>
int main()
{
FILE* pf = fopen("test.txt", "wb");
if (pf == NULL)
{
perror("fopen");
return 1;
}
int arr[10] = { 1,2,3,4,5,6,7,8,9,10 };
//写入
fwrite(arr, sizeof(int), sizeof(arr) / sizeof(arr[0]), pf);
fclose(pf);
pf = NULL;
return 0;
}
成功写入,结果却是:
看不懂,因为它是二进制的形式。所以咱们调一下(VS2022):
打开之后:
这就很明显了,16进制1~10,而且还是小端字节序。
咱们也可以使用fread函数读出。
fread
函数原型:
size_t fread(void *ptr, size_t size, size_t count, FILE *stream);
解释:
参数说明
ptr:指向一个内存块的指针,该内存块至少有 size * count字节的空间。
size:每个元素的大小,以字节为单位。
count:要读取的元素个数。
stream:指向 FILE 对象的指针,该对象指定了一个输入流。
返回值
fread 函数返回成功读取的元素总数。如果返回值与 count不同,则可能发生了错误或者到达了文件末尾。
使用示例:
#include <stdio.h>
int main()
{
FILE* pf = fopen("test.txt", "rb");
if (pf == NULL)
{
perror("fopen");
return 1;
}
int arr[10] = { 0 };
//读出
fread(arr, sizeof(int), sizeof(arr) / sizeof(arr[0]), pf);
for (int i = 0; i < sizeof(arr) / sizeof(arr[0]); i++)
{
printf("%d ", arr[i]);
}
fclose(pf);
pf = NULL;
return 0;
}
输出:
函数的功能已经全部介绍完了,现在,咱们看看适用范围是什么意思
刚才咱们都是文件流进行输出输入,但是,除了二进制操作函数之外,其他的顺序读写函数都是适用于所有输入或输出流的。
所有输入流包括标准输入(stdin)、文件输入流等;所有输出流包括标准输出(stdout)、标准错误(stderr)、文件输出流等。
示例:以fprintf
函数为例,它不仅可以向文件中写入数据,也可以像屏幕上输出,区别就在于流的不同。
#include <stdio.h>
int main()
{
int a = 10;
fprintf(stdout, "%d", a);
return 0;
}
输出:
六、文件的随机读写
我们前面说的都是顺序读写,现在我们来看看随机读写函数。
6.1 fseek
fseek
函数用于设置**文件位置指针(文件光标)**的位置。
函数原型:
int fseek ( FILE * stream, long int offset, int origin );
解释:
stream:文件指针,指向你要操作的文件。
offset:偏移量,正数表示向文件尾部移动,负数表示向文件头部移动。
origin :起始位置,它有三个可能的值:SEEK_SET
(文件开头),SEEK_CUR
(当前位置),SEEK_END
(文件结尾)。在C语言中,这三个值分别对应0,1和2。
返回值是一个整数,如果成功则返回0,否则返回非零值。
使用示例:
代码一:
//未使用fseek前
#include<stdio.h>
int main()
{
FILE* pf = fopen("test.txt", "r");
if (pf == NULL)
{
perror("fopen");
return 1;
}
//第一次读取
int ch = fgetc(pf);//读取第一个字符a
printf("%c\n", ch);
//第二次读取
ch = fgetc(pf);//读取第二个字符b
printf("%c\n", ch);
fclose(pf);
pf = NULL;
return 0;
}
代码二:
//使用fseek后
#include<stdio.h>
int main()
{
FILE* pf = fopen("test.txt", "r");
if (pf == NULL)
{
perror("fopen");
return 1;
}
//第一次读取
int ch = fgetc(pf);//读取第一个字符a
printf("%c\n", ch);
fseek(pf, -1, SEEK_CUR);//fseek使用
//第二次读取
ch = fgetc(pf);//读取第二个字符b
printf("%c\n", ch);
fclose(pf);
pf = NULL;
return 0;
}
我只是举了一个简单的例子 咱们也可以再多练习练习。
6.2 ftell
ftell
函数用于获取文件流中当前文件指针的位置。它返回的是文件指针相对于文件开头的偏移量,以字节为单位。
函数原型:
long ftell(FILE *stream);
使用示例:
#include<stdio.h>
int main()
{
FILE* pf = fopen("test.txt", "r");
if (pf == NULL)
{
perror("fopen");
return 1;
}
long len;
//将文件指针移动到文件末尾
fseek(pf, 0, SEEK_END);
// 获取文件指针当前位置,即文件大小
len = ftell(pf);
printf("%ld", len);
fclose(pf);
pf = NULL;
return 0;
}
6.3 rewind
rewind函数用于将文件内部的位置指针重新指向文件的开头。它不返回任何值。
函数原型:
void rewind ( FILE * stream );
函数很简单,这里就不演示了,接着,给大家辨析一个概念。
区分「文件指针」与「文件位置指针」
我们前面提到的「移动文件指针」实际指FILE
结构体内部的位置指示器(逻辑偏移量),而非FILE* pf
指针变量本身。
例如:
fseek(pf, 0, SEEK_END); // 移动的是内部位置指针,fp的地址始终不变!
即
“文件指针”在口语中常指两种含义,但代码层面** FILE* fp 永不改变**,真正移动的是隐藏的位置指针。
七、文件读取结束的判定
对于文件读取结束的判断
- 文本文件读取是否结束,判断返回值是否为 EOF ( fgetc ),或者 NULL ( fgets )
例如:
fgetc 判断是否为 EOF
fgets 判断返回值是否为 NULL- 二进制文件的读取结束判断,判断返回值是否小于实际要读的个数。
例如:
fread判断返回值是否小于实际要读的个数
7.1 被错误使用的 feof
feof 的作用是:当文件读取结束的时候,判断是读取结束的原因是否是:遇到文件尾结束。
在文件读取过程中,不能用feof函数的返回值直接来判断文件的是否结束。
比如:
// 错误示范:用 feof() 作为循环条件
FILE* pf = fopen("test.txt", "r");
while (!feof(pf))
{ // 不可靠!
char ch = fgetc(pf);
printf("%c", ch);
}
fclose(fp);
问题:这种写法会导致多读一次末尾数据(重复输出最后一个字符或乱码)。
正确理解 feof() 的作用
feof() 是“事后检查”
它不会预测文件是否结束,而是只有当读取操作(如 fgetc/fread)已经失败后,才通过标记告诉你:“刚才的失败是因为遇到了文件末尾(EOF)”。
类似于“撞墙后才检测到墙”,而不是“预测前方有墙”。
7.2 feof与ferror
函数原型:
对于ferror:
它返回一个非零值表示发生错误,返回零表示没有错误。
对于feof:
要正确使用:在读取操作之后调用 feof(),否则可能会误判;
如果到达文件末尾,feof() 返回非零值,否则返回零。
我们知道,对于文件读取结束,有两种可能:
- 有可能遇到文件末尾(feof判断)
- 读取的时候发生了错误 (ferror判断)
而在我们打开一个流的时候,这个流上有两个标记值,分别是是否遇到文件末尾和是否发生错误,但发生对应的情况时,标记会被置为真(非0值),feof() 和 ferror() 查询这些标记的当前状态返回相应值。
使用示例:
#include<stdio.h>
int main()
{
FILE* pf = fopen("test.txt", "r");
if (pf == NULL)
{
perror("fopen");
return 1;
}
//读取
int ch = 0;
while ((ch = fgetc(pf)) != EOF)
{
printf("%c\n", ch);
}
//判断因为什么原因导致读取结束
if (feof(pf))
printf("正常读取至文件末尾\n");
else if (ferror(pf))
perror("fgetc");
fclose(pf);
pf = NULL;
return 0;
}
正常读取的话:
我们可以来看看错误代码:
#include<stdio.h>
int main()
{
FILE* pf = fopen("test.txt", "r");
if (pf == NULL)
{
perror("fopen");
return 1;
}
//以只读的形式打开文件但我们进行写入
fputc('a', pf);
//判断因为什么原因导致读取结束
if (feof(pf))
printf("正常读取至文件末尾\n");
else if (ferror(pf))
perror("fputc");
fclose(pf);
pf = NULL;
return 0;
}
输出:
对于文件操作我们就说到这里,下面我们看一下文件缓冲区的描述。
八、文件缓冲区
ANSIC 标准采用“缓冲文件系统” 处理的数据文件的,所谓缓冲文件系统是指系统自动地在内存中为
程序中每⼀个正在使用的文件开辟⼀块**“文件缓冲区”**。从内存向磁盘输出数据会先送到内存中的缓
冲区,装满缓冲区后才⼀起送到磁盘上。如果从磁盘向计算机读⼊数据,则从磁盘文件中读取数据输
⼊到内存缓冲区(充满缓冲区),然后再从缓冲区逐个地将数据送到程序数据区(程序变量等)。缓
冲区的大小根据C编译系统决定的。
我们可以来用代码看看是否有缓冲区的存在。
#include <stdio.h>
#include <windows.h>
//VS2022 WIN11环境测试
int main()
{
FILE* pf = fopen("test.txt", "w");
if(pf==NULL)
{
perror("fopen");
return 1;
}
fputs("abcdef", pf);//先将代码放在输出缓冲区
printf("睡眠10秒-已经写数据了,打开test.txt文件,发现文件没有内容\n");
Sleep(10000);
printf("刷新缓冲区\n");
fflush(pf);//刷新缓冲区时,才将输出缓冲区的数据写到文件(磁盘)
printf("再睡眠10秒-此时,再次打开test.txt文件,文件有内容了\n");
Sleep(10000);
fclose(pf);
//注:fclose在关闭文件的时候,也会刷新缓冲区
pf = NULL;
return 0;
}
我们自己要动手实操一边哦!!!可见,效果和咱们printf
中输出的是一样的。
当然,关于缓冲区还有很多知识,我们这里只是借着文件操作简单说明一下缓冲区的存在,后面有机会再来详细讲解。
总结
掌握这些文件操作技术,你将能够轻松处理各种数据持久化需求,为开发更复杂的应用程序打下坚实基础。记住,实践是学习编程的最佳方式,建议读者亲自动手尝试文中的每个示例代码。
谢谢学习至此~