java 下的 json库性能比较:json.simple vs. gson vs. jackson vs. jsonp-亚博电竞手机版
json已经成为当前服务器与web应用之间数据传输的公认标准,不过正如许多我们所习以为常的事情一样,你会觉得这是理所当然的便不再深入思考了。我们很少会去想用到的这些json库到底有什么不同,但事实上它们的确是不太一样的。因此,我们运行了一个基准测试来对常用的几个json库进行了测试,看看在解析不同大小的文件时哪个库的速度是最快的。下面我会把结果分享给大家。
json通常用于传输及解析大文件。这对运行在hadoop或者是spark集群上的数据处理程序而言是个很常见的场景。在给定的文件大小下,你可以看到不同库之间的解析速度存在着明显的差别。
高吞吐量的情况下,会频繁地传输并解析小文件,因此一开始的时候可能性能的差距并不明显。但如果你需要在非常高负载下频繁地解析大量的小文件,差距就开始增大了。微服务及分布式架构经常会使用json来传输此类文件,因为这已经是web api的事实标准。
不是所有的json库都叫”特仑苏”。如何根据使用场景才选择正确的库是相当重要的。希望这个基准测试能够对你有所帮助。
json.simple vs gson vs jackson vs jsonp
我们选择了四个主流的json库来进行基准测试:json.simple, gson, jackson以及jsonp。在java中进行json解析通常都会用到这几个库,选择它们的原因是它们在github项目中的亮相频率很高。
下面便是我们所测试的json库:
- yidong fang的json.simple(https://github.com/fangyidong/json-simple)。json.simple是一个json编解码的java工具库。它旨在打造一个轻量简单且高性能的工具库。
- google的gson(https://github.com/google/gson)。gson这个java库能够在java对象和json间进行相互转换。同时它还提供了对java泛型的完整支持,而且还不需要你在类上面添加注解。无需添加注解使用起来则更为便捷,同时在无法修改源代码的情况下这还是一个必要的先决条件。
- fasterxml的jackson项目(https://github.com/fasterxml/jackson)。jackson是一个数据处理的工具套件,它的亮点是流式的json解析器及生成器。它是专为java设计的,同时也能处理其它非json的编码。从我们在github中的统计来看,它应该是最流行的json解析器。
- oracle的jsonp(https://jsonp.java.net/)。jsonp (json processing)是json处理的一套java api,从名字来看它就是用来生成及解析json串的。这是jsr353规范的一个开源实现。
基准测试
我们同时使用大文件和小文件对这些库进行了基准测试。随着文件大小的不同,处理这些文本所需要的系统资源也会随之上升。
这个基准测试主要关注两个关键场景:大文件下(190mb)的解析速度与小文件(1kb)下的解析速度。大文件取自这里:https://github.com/zemirco/sf-city-lots-json。小文件是从这里随机生成的:http://www.json-generator.com/。
不管是大文件还是小文件,我们都会用同一个库重复运行10次。对于每一个大文件,我们都会用同一个库来分别运行10次。而对于小文件,在单个库的单次运行中会重复执行10000次。在小文件测试的各次迭代中,文件内容都不会驻留在内存里,测试所运行的机器是aws的c3.large实例。
大文件的完整测试结果如下,我对小文件的结果求了个平均值。想要看完整的结果,请移步这里。如果想看小文件测试的源码,请从这里下载。
大文件结果
结果相差甚大!jackson与json.simple领跑了这轮测试,整体来看jackson又要略优于json.simple。从测试运行的平均结果来看,jackson与json.simple在大文件上的表现要优秀一些,而jsonp排名第三落后甚远,gson更是遥遥垫底。
我们再把结果换算成百分比看下。平均来看jackson要胜出一筹。下面是结果的百分比数据,可以从两个维度来进行比较:
不同库之间的性能差别着实不小。
结论:jackson以略微优势胜出。json.simple紧随其后,而剩下两个库则远远落后。
小文件结果
上表记录的是对每个文件解析10次的平均时间,总的平均时间见下方。各个库在小文件测试中夺冠的次数如下:
- gson – 14
- jsonp – 5
- jackson -1
- json.simple – 0
这个结果貌似很有说服力。然而,从所有文件的平均结果来看,gson这个冠军还是当之无愧的,json.simple和jsonp的二三名之争应该没什么悬念。jackson这轮却是垫底了。尽管json.simple没有在任何文件上夺得第一,但总体来看它的解析速度却是排名第二位的。而jsonp尽管在许多文件上都拿到了冠军,但平均来看却只拿到了第三名的成绩。
还有一个值得注意的是,尽管jackson是这轮最慢的库,但是它在所有文件中的表现都非常一致,其它三个库虽然偶然会比jackson快很多,但在另一些文件上的解析速度却是旗鼓相当甚至更差。
我们再把这些数字转换成百分比看看,还是同样的两个维度:
和大文件测试相比,这次的差距相对要小一些,但也还是不容忽视的。
结论:很不幸的是,json.simple又以微弱的劣势与冠军失之交臂,这轮gson胜。jsonp仍是千年老三而这回jackson则赶了个晚集。
总结
解析速度并非衡量一个json库的唯一指标,但它的确非常重要。通过运行这次基准测试,我们发现没有一个库能在所有文件上击败对手。大文件中表现优秀的却在小文件上栽了根头,反之亦然。
如果要从解析速度来看选择哪个库的话还得取决于你的使用场景。
- 如果你的应用经常会处理大的json文件,那么jackson应该是你的菜。gson在大文件上表现得相当吃力。
- 如果你主要是处理小文件请求,比如某个微服务或者分布式架构的初始化,那么gson当是首选。jackson在小文件上的表现则不如人意。
- 如果这两种文件你都经常会处理到,那么在两轮表现中都位居第二的json.simple对此类场景则更为适合。在不同的文件大小上jackson和gson的表现都不太好。
除非不考虑解析速度,不然jsonp完全没有什么值得称道的。它在大文件和小文件上的表现与其它库相比都很糟糕。所幸的是,java 9很快便会有原生的json实现了,相信jsonp将来的表现仍然值得期待。
终于讲完了。如果你对json库的解析速度比较敏感的话,大文件选jackson,小文件选gson,两者则json.simple。如果你对这次的基准测试有什么疑问请在下方留言。