在实现自动化测试的时候,我们经常会使用数据驱动。所以我们经常会把测试数据单独保存在一个特定格式的文件当中,然后通过读取文件去驱动自动化测试代码。
excel、csv 和 yaml三种主流的文件格式,哪个更好呢?
1、Excel格式
excel是使用最广泛的数据文件格式。经常有人说 Excel的操作限制很多,写入和读取的速度很慢?
下面看下创建一个空的Excel文件,然后插入1000条数据,看插入数据和读取这些数据会耗费多久的时间,以下是数据结果。
在一个项目当中,1000个测试用例应该是比较合理的,所以在正常的测试场景下,使用excel管理用例数据在读取效率上是合适的。
但是当数据变得越来越大的时候,Excel的处理速度会越来越慢,读取数据消耗了7秒。这就意味着如果你有多个项目需要同时测试,excel的解析可能会对测试效率造成一定的影响。
2、csv 格式
不论是进行自动化测试还是进行数据分析,csv格式都更加合适。这种格式不像Excel,要去处理表格的样式,它更专注于数据。
而且在Python语言当中,内置了csv格式的处理模块,用法非常简单。
分别对1000行、5万行和10万行数据进行插入和读取操作,csv 的速度都比excel要快一个量级。
对于海量数据处理,csv 比 excel 要快很多,代码编写也更简单。但是,使用csv格式一定要注意对逗号的处理。在csv当中,每一行的数据默认是用逗号分割的,如果你有一个数据当中本身就包含了逗号,一定要记得把这个数据加上双引号。
而且,csv 支持的数据格式非常有限,数据被读取出来后都被当成字符串,需要自己添加额外的解析操作。
3、yaml
yaml 的优点在于丰富的数据类型支持。无论是元组、字典、数字、布尔类型都能支持,并且被 python 语言轻松解析成对应的 python 数据类型。
在少量数据的解析上,yaml 会非常的方便。但是一旦数据增加到上万组,yaml的解析速度会非常非常慢。当数据达到10万行的时候,读取速度竟然接近 1 分钟。
通过以上对比可以得出以下结论:
1、少量的用例进行测试或对格式要求较高
用yaml存储用例数据会更利于解析,但是这种场景下一般可以直接使用 postman 这些成熟的工具,没有必要自己实现。
2、使用Excel的操作
1万行以下的数据, Excel还是非常快的。
3、csv格式操作
csv格式,它的处理速度也是非常快的。其次,Python语言当中直接内置了csv的模块,它的使用方式和 open.函数非常的相似。