1)文件的编码
什么是编码?
编码就是一种规则集合,记录了内容和二进制间进行相互转换的逻辑。
编码有许多中,我们最常用的是UTF-8编码
为什么需要使用编码?
计算机只认识0和1,所以需要将内容翻译成0和1才能保存在计算机中。
同时也需要编码, 将计算机保存的0和1,反向翻译回可以识别的内容
2)文件的读写
打开、关闭、读、写
1.open() 打开函数
open(name, mode, encoding)
open("文件路径", "打开文件的模式",encoding="编码格式")
name:是要打开的目标文件名的字符串(可以包含文件所在的具体路径)。
mode:设置打开文件的模式(访问模式):只读、写入、追加等。
encoding:编码格式(推荐使用UTF-8)
模式 | 描述 |
---|---|
r | 以只读方式打开文件。文件的指针将会放在文件的开头。这是默认模式。 |
w | 打开一个文件只用于写入。如果该文件已存在则打开文件,并从开头开始编辑,原有内容会被删除。 如果该文件不存在,创建新文件。 |
a | 打开一个文件用于追加。如果该文件已存在,新的内容将会被写入到已有内容之后。 如果该文件不存在,创建新文件进行写入。 |
read()方法
文件对象.read(num)
num表示要从文件中读取的数据的长度(单位是字节),如果没有传入num,那么就表示读取文件中所有的数据。
readlines()方法
readlines可以按照行的方式把整个文件中的内容进行一次性读取,并且返回的是一个列表,其中每一行的数据为一个元素。
readline()方法
一次读取一行内容
# 打开文件
f = open("C:/Users/Lenovo/Desktop/txt/1.txt", "r", encoding="gbk")
print(type(f))
# 读取文件 - read()
# Read = f.read(10)
# print(f"读取10个字节的结果是:{Read}")
# print(f"read()方法读取的结果是:{f.read()}")
# 读取文件 - readLines()
# lines = f.readlines()
# print(f"lines对象的类型是:{type(lines)}")
# print(f"lines对象的内容是:{lines}")
# 读取文件 - readLine()
line1 = f.readline()
line2 = f.readline()
line3 = f.readline()
print(f"第一行数据是:{line1}")
print(f"第二行数据是:{line2}")
print(f"第三行数据是:{line3}")
# for循环读取文件行
for line in f:
print(f"每一行数据是:{line}")
# 文件的关闭
f.close()
注意:文件读取完成后,要使用文件对象.close()方法关闭文件对象,否则文件会被一直占用
with open方法
# with open 语法操作文件 执行完程序后会自动的close
with open("C:/Users/Lenovo/Desktop/txt/1.txt", "r", encoding="gbk") as f:
for line in f:
print(f"with open每一行数据是:{line}")
总结:
操作 | 功能 |
---|---|
文件对象 = open(file, mode, encoding) | 打开文件获得文件对象 |
文件对象.read(num) | 读取指定长度字节 不指定num读取文件全部 |
文件对象.readline() | 读取一行 |
文件对象.readlines() | 读取全部行,得到列表 |
for line in 文件对象 | for循环文件行,一次循环得到一行数据 |
文件对象.close() | 关闭文件对象 |
with open() as f | 通过with open语法打开文件,可以自动关闭 |
例子:
"""
通过文件读取操作,统计itheima单词出现的次数
itheima itcast python
itheima python itcast
beijing shanghai itheima
shenzhen guangzhou itheima
wuhan hangzhou itheima
zhengzhou bigdata itheima
"""
f = open("F:/Vscode-project/Python_project/Word.txt", "r", encoding="utf-8")
# 方式1,读取全部内容,通过字符串count方式统计itheima单词的数量
# Read = f.read()
# print(f"文件的内容是:{Read}")
#
# count = Read.count("itheima")
# print(f"单词itheima在文件中出现的次数是:{count}次")
# 方式2:一行行读取
count = 0
for line in f:
line = line.strip() # 去除首尾的空格以及换行符
words = line.split(" ")
for word in words:
# 判断单词出现的次数累计
if word == "itheima":
count += 1
print(f"单词itheima在文件中出现的次数是:{count}次")
# 关闭文件
f.close()
单词itheima在文件中出现的次数是:6次
3)文件的写入
# 1. 打开文件
f = open('python.txt', 'w')
# 2. 文件写入
f.write('hello world')
#3.内容刷新
f.flush()
注意:
直接调用write,内容并未真正写入文件,而是会积攒在程序的内存中,称之为缓冲区
当调用flush的时候,内容会真正写入文件
这样做是避免频繁的操作硬盘,导致效率下降(攒一堆,一次性写磁盘)
# 打开文件,不存在的文件
f = open("F:/Vscode-project/Python_project/test_txt/2.txt", "w", encoding="UTF-8")
# write写入
f.write("hello world!") # 内容写到内存中
# flush刷新
f.flush() # 将内存中积攒的内容,写入到硬盘的文件中
# 关闭文件
f.close() # close的方法,内置了flush的功能
写入文件使用open函数的”w”模式进行写入
写入的方法有:
•wirte(),写入内容
•flush(),刷新内容到硬盘中
注意事项:
w模式,文件不存在,会创建新文件
w模式,文件存在,会清空原有内容
close()方法,带有flush()方法的功能
4)文件的追加
注意:
a模式,文件不存在会创建文件
a模式,文件存在会在最后,追加写入文件
# 打开文件,不存在的文件
f = open("F:/Vscode-project/Python_project/test_txt/3.txt", "a", encoding="UTF-8")
# write写入
f.write("hello world!") # 内容写到内存中
# flush刷新
f.flush() # 将内存中积攒的内容,写入到硬盘的文件中
# 关闭文件
f.close() # close的方法,内置了flush的功能
# 打开文件,存在的文件
f = open("F:/Vscode-project/Python_project/test_txt/3.txt", "a", encoding="UTF-8")
# write写入
f.write("你好,世界!") # 内容写到内存中
# flush刷新
f.flush() # 将内存中积攒的内容,写入到硬盘的文件中
# 关闭文件
f.close() # close的方法,内置了flush的功能
追加写入文件使用open函数的”a”模式进行写入
追加写入的方法有(和w模式一致):
wirte(),写入内容
flush(),刷新内容到硬盘中
注意事项:
a模式,文件不存在,会创建新文件
a模式,文件存在,会在原有内容后面继续写入
可以使用”\n”来写出换行符
5)文件操作的综合案例
例子:文件备份
# 完成文件的备份,将测试部分数据丢弃
# 打开bill.txt文件
f1 = open("F:/Vscode-project/Python_project/test_txt/bill.txt", "r", encoding="UTF-8")
# 打开bill.txt.bak文件
f2 = open("F:/Vscode-project/Python_project/test_txt/bill.txt.bak", "w", encoding="UTF-8")
# 循环读取f1的内容
for line in f1:
line = line.strip()
# 写入内容
if line.split(",")[4] == "测试":
continue
f2.write(line)
# 由于前面的内容进行了strip()的操作,需要手动的写出换行符
f2.write("\n")
# 关闭f1,f2
f1.close()
f2.close()