深入理解序列化
lipiwang 2025-05-26 17:14 10 浏览 0 评论
什么是序列化?序列化到底是做什么的?
第一次听到序列化这个词,还是专门指java中的Serializable这个接口。后来随着知识不断地累积,对于序列化的理解就不止局限于某一特定的语言。
序列化的定义
序列化 (Serialization)是将对象的状态信息转换为可以存储或传输的形式的过程。在序列化期间,对象将其当前状态写入到临时或持久性存储区。以后,可以通过从存储区中读取或反序列化对象的状态,重新创建该对象。
反序列化,就是把序列化后的IO再转换到内存对象。
上诉定义,说明简单来说就是把内存中的对象信息,转换成IO流,然后这个IO流可以存储到本地,也可以通过网络传输。
目前比较常用的序列化格式有:java的Serializable、XML、JSON、protobuf、Hession、kryo、Avro等等。
JAVA序列化Serializable
java中实体类实现Serializable接口才可以做序列化。这种序列化方式目前很不推荐,主要原因如下:
1:不支持跨语言。序列化后的IO流只能用java来做反序列化。
2:序列化和反序列化效率低。
3:序列化后可读性差。Serializable序列化后用的二进制来存储的,所以不能直观的分析出对象的信息。
XML
xml作为早期的序列化方式,对于Serializable有如下几个优势。
1:支持跨语言。
2:可读性好。
3:序列化效率相比Serializable会高一些。
但是看到上图,其实xml里面包含了大量的标签,这些标签其实和数据本身关系并不大,所以还有很多优化空间。
JSON
xml格式其实有大量的特殊符号(<>等)以及各种与数据本身无关的信息,所以非常不适合在网络上传输。所以有了JSON格式。
JSON(JavaScript Object Notation, JS对象简谱)是一种轻量级的数据交换格式。它基于 ECMAScript(European Computer Manufacturers Association, 欧洲计算机协会制定的js规范)的一个子集,采用完全独立于编程语言的文本格式来存储和表示数据。简洁和清晰的层次结构使得 JSON 成为理想的数据交换语言。 易于阅读和编写,同时也易于机器解析和生成,并有效地提升网络传输效率。
{
"people": [{
"firstName": "Brett",
"lastName": "McLaughlin"
},
{
"firstName": "Jason",
"lastName": "Hunter"
}
]
}
这样格式相比xml来说,节省了很多空间。目前比较主流的json序列化工具有Jackson、FastJson和Gson。
上图中可以看出FastJson和Jackson的性能差距不大,但是个人不太建议使用(因为时不时的爆出漏洞)。Gson的性能从上图看都是相比较差的,但是Gson对与复杂对象的支持度是非常好的。
思考:其实我们看JSON格式的数据,其实还是有些地方可以继续优化的,比如:
1:字段名为什么非要用完整的字段名?为什么不考虑替换成一种约定好的符号呢?
2:属性值是否可以进行压缩呢
protobuf
对于刚才我们提到对JSON的思考,在protobuf中做出了答案。
Protobuf是Google的一种数据交换格式,它独立于语言、独立于平台。Google提供了多种语言来实现,比如Java、C、Go、Python,每一种实现都包含了相应语言的编译器和库文件,Protobuf是一个纯粹的表示层协议,可以和各种传输层协议一起使用。
我们可以简单地去理解一下,刚才的JSON如下
{
"people": [{
"firstName": "Brett",
"lastName": "McLaughlin"
},
{
"firstName": "Jason",
"lastName": "Hunter"
}
]
}
{
1: [{ //这里用1代替字符串people
2: "Brett", //这里用2 代替firstName
3: "McLaughlin" //这里用3 代替lastName
},
{
2: "Jason",
3: "Hunter"
}
]
}
以上转换明显要比Json节省了很多空间。其实protobuf对value也进行了压缩,通过使用varint和Zigazg来进行压缩的,我们先看protobuf的存储格式。
protobuf采用T-L-V作为存储方式。
简单的例子:
publicstaticvoidmain(String[]args){
UserProtos.Useruser=UserProtos.User.newBuilder().setAge(300).setName("Mic").build();
byte[]bytes=user.toByteArray();
for(bytebt:bytes){
System.out.print(bt+"");
}
以上代码是将如下JSON数据转化成protobuf
{
"age":300,
"name":"Mic"
}
其结果为 10 3 77 105 99 16 -84 2 ,一共只有8个字节。
protobuf既然这么节省空间,那么为什么不大规模推广呢?现在来看一下它的缺点:
1:protobuf是一种约定的结构,需要客户端和服务端双方约定好,如果有改动,需要两边同时改动,非常不方便。
2:可读性差。基本上单看序列化后的结果,无法看出其信息的意义,不方便开发和定位。
3:目前支持语言有限。java、js、python等,并不能保证所有语言都支持。
总结
序列化的目的就是为了传输数据或保存数据的,所以想要开发一个合格的序列化工具或格式,需要有两个指标要满足。
1:序列化和反序列化的性能。
2:序列化后数据的大小。
相关推荐
- linux实例之设置时区的方式有哪些
-
linux系统下的时间管理是一个复杂但精细的功能,而时区又是时间管理非常重要的一个辅助功能。时区解决了本地时间和UTC时间的差异,从而确保了linux系统下时间戳和时间的准确性和一致性。比如文件的时间...
- Linux set命令用法(linux cp命令的用法)
-
Linux中的set命令用于设置或显示系统环境变量。1.设置环境变量:-setVAR=value:设置环境变量VAR的值为value。-exportVAR:将已设置的环境变量VAR导出,使其...
- python环境怎么搭建?小白看完就会!简简单单
-
很多小伙伴安装了python不会搭建环境,看完这个你就会了Python可应用于多平台包括Linux和MacOSX。你可以通过终端窗口输入"python"命令来查看本地是否...
- Linux环境下如何设置多个交叉编译工具链?
-
常见的Linux操作系统都可以通过包管理器安装交叉编译工具链,比如Ubuntu环境下使用如下命令安装gcc交叉编译器:sudoapt-getinstallgcc-arm-linux-gnueab...
- JMeter环境变量配置技巧与注意事项
-
通过给JMeter配置环境变量,可以快捷的打开JMeter:打开终端。执行jmeter。配置环境变量的方法如下。Mac和Linux系统在~/.bashrc中加如下内容:export...
- C/C++|头文件、源文件分开写的源起及作用
-
1C/C++编译模式通常,在一个C++程序中,只包含两类文件——.cpp文件和.h文件。其中,.cpp文件被称作C++源文件,里面放的都是C++的源代码;而.h文件则被称...
- linux中内部变量,环境变量,用户变量的区别
-
unixshell的变量分类在Shell中有三种变量:内部变量,环境变量,用户变量。内部变量:系统提供,不用定义,不能修改环境变量:系统提供,不用定义,可以修改,可以利用export将用户变量转为环...
- 在Linux中输入一行命令后究竟发生了什么?
-
Linux,这个开源的操作系统巨人,以其强大的命令行界面而闻名。无论你是初学者还是经验丰富的系统管理员,理解在Linux终端输入一条命令并按下回车后发生的事情,都是掌握Linux核心的关键。从表面上看...
- Nodejs安装、配置与快速入门(node. js安装)
-
Nodejs是现代JavaScript语言产生革命性变化的一个主要框架,它使得JavaScript从一门浏览器语言成为可以在服务器端运行、开发各种各样应用的通用语言。在不同的平台下,Nodejs的安装...
- Ollama使用指南【超全版】(olaplex使用方法图解)
-
一、Ollama快速入门Ollama是一个用于在本地运行大型语言模型的工具,下面将介绍如何在不同操作系统上安装和使用Ollama。官网:https://ollama.comGithub:http...
- linux移植(linux移植lvgl)
-
1uboot移植l移植linux之前需要先移植一个bootlader代码,主要用于启动linux内核,lLinux系统包括u-boot、内核、根文件系统(rootfs)l引导程序的主要作用将...
- Linux日常小技巧参数优化(linux参数调优)
-
Linux系统参数优化可以让系统更加稳定、高效、安全,提高系统的性能和使用体验。下面列出一些常见的Linux系统参数优化示例,包括修改默认配置、网络等多方面。1.修改默认配置1.1修改默认编辑器默...
- Linux系统编程—条件变量(linux 条件变量开销)
-
条件变量是用来等待线程而不是上锁的,条件变量通常和互斥锁一起使用。条件变量之所以要和互斥锁一起使用,主要是因为互斥锁的一个明显的特点就是它只有两种状态:锁定和非锁定,而条件变量可以通过允许线程阻塞和等...
- 面试题-Linux系统优化进阶学习(linux系统的优化)
-
一.基础必备优化:1.关闭SElinux2.FirewalldCenetOS7Iptables(C6)安全组(阿里云)3.网络管理服务||NetworkManager|network...
- 嵌入式Linux开发教程:Linux Shell
-
本章重点介绍Linux的常用操作和命令。在介绍命令之前,先对Linux的Shell进行了简单介绍,然后按照大多数用户的使用习惯,对各种操作和相关命令进行了分类介绍。对相关命令的介绍都力求通俗易懂,都给...
你 发表评论:
欢迎- 一周热门
- 最近发表
- 标签列表
-
- maven镜像 (69)
- undefined reference to (60)
- zip格式 (63)
- oracle over (62)
- date_format函数用法 (67)
- 在线代理服务器 (60)
- shell 字符串比较 (74)
- x509证书 (61)
- localhost (65)
- java.awt.headless (66)
- syn_sent (64)
- settings.xml (59)
- 弹出窗口 (56)
- applicationcontextaware (72)
- my.cnf (73)
- httpsession (62)
- pkcs7 (62)
- session cookie (63)
- java 生成uuid (58)
- could not initialize class (58)
- beanpropertyrowmapper (58)
- word空格下划线不显示 (73)
- jar文件 (60)
- jsp内置对象 (58)
- makefile编写规则 (58)