protocol buffer应用与原理

合集下载

go语言中protocol buffer简介

go语言中protocol buffer简介
Protocol Buffer(简称protobuf)是一种语言无关、平台无关、
可扩展的序列化数据结构的协议。

它由Google开发，用于解决数据交
换和持久化存储的问题。

protobuf使用类似于XML和JSON的结构化数据表示形式，但具有更高的效率和更小的存储空间。

与XML和JSON不同，protobuf提供了更紧凑的二进制编码格式，以及自动生成的代码，用于在不同编程语言之间进行高效的数据互通。

使用protobuf，开发人员可以在定义数据结构之后，使用专门的编译
器将结构定义转换为对应的编程语言代码。

这样一来，开发人员就可
以在不同的系统中使用不同的编程语言，而不必担心数据交换的问题。

protobuf可以用于网络通信、数据持久化、配置文件等许多领域。

它支持数据的版本化，允许在不破坏旧有代码的情况下，向已定义的
结构添加新的字段。

protobuf还提供了灵活的扩展机制，允许开发人
员添加额外的字段和消息类型。

总的来说，protobuf是一种方便、高效、可扩展的数据交换格式，适用于多种应用领域。

它的简洁性和可读性使得数据传输和存储更加
高效，并且能够在不同的编程语言之间进行无缝的数据交流。

pb协议原理

pb协议原理PB（Protocol Buffer）协议原理概述PB（Protocol Buffer）是一种数据交换的编码格式，由Google公司开发。

它以二进制的形式存储和传输数据，具有高效、灵活和可扩展的特点。

本文将介绍PB协议的原理以及其在实际应用中的优势。

一、PB协议的基本原理1. 数据结构定义PB协议使用一种类似于结构体的方式来描述数据结构。

用户需要通过一个`.proto`文件来定义消息类型、字段和数据格式。

每个字段都有一个唯一的标识符和一个特定的数据类型。

2. 数据序列化PB协议将数据序列化为二进制格式进行存储和传输。

数据序列化可以分为编码和解码两个过程。

编码将结构化的数据转化为二进制流，解码则是将二进制流还原为结构化数据。

3. 数据压缩PB协议采用了Varint编码技术，将整数进行压缩存储。

Varint编码将一个整数分割成多个部分进行存储，每个部分的高位用于标识是否还有后续部分，低位则存储数值的具体内容。

这种编码方式可以有效减少存储空间。

4. 优势PB协议具有以下优势：- 数据存储紧凑：PB使用二进制格式存储数据，相比于XML和JSON等文本格式，存储空间占用更小。

- 数据解析高效：PB协议对于数据的序列化和反序列化效率非常高，可以快速地将结构化数据转化为二进制流。

- 数据兼容性强：PB协议支持字段的可选、必选和重复三种类型，可以方便地进行数据扩展和升级。

二、PB协议的应用场景1. 分布式系统通信在分布式系统中，不同节点之间需要进行数据交换和通信。

PB协议可以在不同的编程语言间进行数据传输，保证数据的一致性和准确性。

2. 数据存储和传输PB协议可以用于数据的存储和传输，例如在日志传输、网络通信、数据库存储等场景中，PB协议可以提高数据的传输效率和节省存储空间。

3. 应用接口定义PB协议可以用于定义应用程序之间的接口，确保数据传输的可靠性和一致性。

通过定义接口的消息类型和字段，不同系统之间可以进行数据的无缝对接。

protobuf协议继承协议

protobuf协议继承协议在软件开发中，数据的传输和存储是一个必不可少的环节。

为了实现高效、快速的数据传输和存储，开发者们设计了许多不同的数据序列化和反序列化协议。

其中一种被广泛应用的协议就是Google开发的protobuf（Protocol Buffers）。

protobuf是一种轻量级、高效的二进制数据序列化协议，可以将结构化的数据转换为字节流，从而实现数据的传输和存储。

与其他协议相比，protobuf具有以下几个优点：1. 高效性：protobuf使用二进制编码，相对于常见的文本协议（如XML和JSON），它的编码后的数据体积更小，传输速度更快。

2. 可扩展性：protobuf支持数据结构的版本和字段的添加、删除、重命名等操作，可以保持向前和向后兼容性。

3. 语言无关性：protobuf可以通过定义数据结构的.proto文件生成各种编程语言的代码，使得不同语言的应用程序可以无缝地交互。

4. 强类型：protobuf的编码和解码过程是强类型的，可以在编译时检查数据的合法性，减少运行时错误。

在protobuf中，协议的继承是一种重要的特性。

通过继承，可以实现数据结构的复用和扩展。

具体来说，protobuf中的继承分为单继承和多继承两种方式。

单继承是指一个消息类型可以继承自另一个消息类型，从而获得父类型的字段和方法。

在.proto文件中，使用关键字"extend"和"optional"来定义继承关系。

例如，定义一个父类型消息Person和一个子类型消息Student的.proto文件如下所示：```protobufmessage Person {string name = 1;int32 age = 2;}message Student {extend Person {optional int32 student_id = 3;}}```在这个例子中，Student消息类型继承自Person消息类型，并添加了一个额外的字段student_id。

jprotobuf原理

jprotobuf原理
jprotobuf是一种基于GoogleProtocolBuffer协议的Java对象序列化和反序列化工具。

它的原理是将Java对象序列化为二进制数据，然后使用Protocol Buffer协议进行编码和解码。

在使用jprotobuf时，需要定义一个.proto文件，该文件定义了需要序列化的Java对象所对应的字段和类型。

然后使用jprotobuf 提供的插件将.proto文件编译为Java类，这些类实现了Protocol Buffer中定义的接口，可以通过jprotobuf进行序列化和反序列化。

jprotobuf支持的数据类型包括基本类型、数组、集合、枚举、嵌套对象等。

在序列化和反序列化过程中，jprotobuf使用了缓存和对象池等技术来提高性能。

jprotobuf还提供了一些高级特性，如自定义序列化、压缩和加密等。

通过这些特性，可以灵活地处理不同的序列化场景。

总的来说，jprotobuf是一种高效、灵活和易用的Java对象序列化和反序列化工具，可以广泛应用于分布式系统、RPC和缓存等场景。

- 1 -。

protocol buffer 协议详解

protocol buffer 协议详解
Protocol Buffers（简称 Protobuf）是 Google 的一种数据交换的格式，
它独立于语言，独立于平台，可以用于分布式应用之间的数据通信或者异构环境下的数据交换。

在 Protobuf 中，数据结构由 `.proto` 文件定义，这些文件描述了你希望保存的数据结构。

`.proto` 文件中的主要元素有：
1. message：代表了实体结构，由多个消息字段（field）组成。

2. field：包括数据类型、字段名、字段规则、字段唯一标识、默认值。

其中，字段规则有以下三种：
required：必须初始化字段，如果没有赋值，在数据序列化时会抛出异常。

optional：可选字段，可以不必初始化。

repeated：数据可以重复（相当于 Java 中的 Array 或 List）。

Protobuf 的数据类型支持基本数据类型，如 int32、int64、float、double 等，同时还可以支持字符串、布尔值等其他类型。

另外，由于其结构化的特性，它还可以方便地定义更复杂的数据结构，如数组、嵌套的消息等。

使用 Protobuf 时，需要先编写 `.proto` 文件，然后通过 Protobuf 的编译器生成对应语言的代码。

生成的代码包含了序列化和反序列化的方法，可以方便地将数据结构转换为二进制格式或者从二进制格式转换回数据结构。

总的来说，Protocol Buffers 是一种高效、灵活、可扩展的数据交换格式，适用于各种需要跨语言、跨平台进行数据交换的场景。

一看看懂ProtocolBuffer（协议篇）

⼀看看懂ProtocolBuffer（协议篇）前⾔由于笔者业团队的业务对即时通讯服务有很⼤的依赖，春节结束后的第⼀天，红包没到，产品同学先到了，产品同学和我说要做⼀款IM，看到需求⽂档后和设计图后笔者⼤吃⼀⽄这不就是⼀个翻版的web qq吗？可以可以联想到最最近美团的⼤象，头条的Lark，⽤户与⽤户，商家与⽤户，企业同事的沟通，及其衍⽣的配套增值服务，真是需求旺盛的强需求啊如果我要做⼀个WebIM应⽤现在的Web应⽤通常会考虑ajax轮询或者是long polling的⽅式来实现，但是频繁的建⽴https连接，会带来多余请求和消息精准性的问题，本质上是TCP，消息边界不清晰，会有黏包的情况类似我司ios和andorid客户端，采⽤socket+PB协议来解决及时通讯问题，采⽤socket服务，依赖google的oc PB协议包来实现，socket是基于TCP协议，由通信协议和编程API组成的，原理⼀次HTTP协议握⼿成功后，与服务器建⽴双向连接，数据就可以直接从TCP 通道传输基于事件的⽅式，⼆级制传输，反编译为json或者xml笔者在查阅翻google PB开发者⽂档时，看到17年下半年google发布了官⽅的js的版本，配合websocket，可以与PB协议进⾏配合，在实现原理上，优于现有的ajax轮询或者是long polling的实现⽅式So，Let's rock !Protocol Buffer是个什么东东？Protocol Buffer是Google提供的⼀种数据序列化协议，下⾯是我从⽹上找到的Google官⽅对protobuf的定义：Protocol Buffers 是⼀种轻便⾼效的结构化数据存储格式，可以⽤于结构化数据序列化，很适合做数据存储或 RPC 数据交换格式。

它可⽤于通讯协议、数据存储等领域的语⾔⽆关、平台⽆关、可扩展的序列化结构数据格式。

为什么是Node，为何要和Protocol Buffer打交道？做为javascript开发者，对我们最好的数据序列化协议当然是JSON，pb协议相较于之前流⾏的XML更加的简洁⾼效pb属于⼆进制协议，更容易解析，解析速度⽐⽂本协议有⼆向箔级别的压制，so，在聊天场景下，udp传输明显是优于tcp的后台通信基本是基于⼆进制的，以往我们开发中⽤到的纯⽂本协议是后台同学在封装⼀层实现的，例如我司的服务，就维护了两套，⼀套⼆进制的，⼀套http接⼝的，如果可以⽤Node打通了pb，可以将维护成本降到最低，理论上只有⼀套底层⼆级制服务ps. 类似PB这样的东西，还有MessagePack和Apache Thrift说的这么热闹，⽼夫已经迫不及待了！想必你已经说，别逼逼，show me the code，怎么好的开发都么上进呢？好吧，Let's Rock & Roll!官⽅案例我们来操作⼀下安装google-protobuf2017年4⽉开始官⽅⽀持javascriptgithubdevelopsnpm install google1. -protobuf定义.proto⽂件proto⽂件 messages.proto1. package zxwj;2. syntax = "proto3";3. message helloworld4. {5. string zzuid = 123;6. string zzstatus = 0;7. }编译.proto⽂件使⽤protobuf.js命令⾏⼯具编译1. protoc --js_out=import_style=commonjs,binary:. messages.protoprotoc会编译输⼊⽂件，并且构建messages_pb，在sever中，可以以以下⽅式引⽤1. var messages = require('./messages_pb');2. var message = new messages.MyMessage();编写server.js1. var basepb = require('./messages_pb');2. console.log(basepb);3.4. var message = new basepb.SearchRequest();5. console.log(message);6.7. message.setName("TS");8. message.setPassword("123456");9.10. var bytes = message.serializeBinary(); //对象序列化11. console.log(bytes);12.13. var message2 = basepb.SearchRequest.deserializeBinary(bytes); //进制序列化14. console.log(message2);运⾏1. node sever.js总结⼀下上个案例并不具备线上产品能⼒，但是还可以能看出PB协议的优势所在快，从官⽅的测试结果来看，整体⽐較起來，ProtoBuf.js 則是⽐纯JSON 的处理快上⼀倍以上，附官⽅Github测试结果（机器配置：i7-2600K。

PB介绍

23 4 5 6 7 8 9 option java_package = "com.example.tutorial";//生成文件的包名option java_outer_classname = "AddressBookProtos";//类名message Person { //要描述的结构化数据required string name = 1;//required表示这个字段不能为空 required int32 id = 2;//等号后面的内容为数字别名10111213141516171819202122 optional string email = 3;//optional表示可以为空PhoneNumber {//内部messagerequired string number = 1;optional int32 type = 2;}repeated PhoneNumber phone = 4}message AddressBook {repeated Person person = 1;//是个集合}对以上内容的一点解释：∙PB所支持的元类型数据请参考：PB元类型数据∙修饰符required：这个修饰符应该谨慎使用，滥用会导致后续的修改容易出现兼容性问题；∙修饰符optional：对于常出现的属性，为节省空间应该取1-16的别名；∙PB是以key-value的形式来将结构化数据序列化的。

它采用了将等号后的数字别名以及属性的类型用varints编码成一个数字，来作为key。

2.1.2 使用PB编译器输入：protoc -I=$SRC_DIR –java_out=$DST_DIR $SRC_DIR/addressbook.proto其中-I指定.proto文件所在目录–java_out指定生成java文件所在的目录2.1.3 使用PB的API来写入和读取messages经过以上步骤，会在指定的$DST_DIR目录下生成一个AddressBookProtos.java的类。

protobuf协议

protobuf协议protobuf协议，即Protocol Buffers，是google开发的一种轻量级的数据交换格式，是一种语言无关、平台无关，简单，高效的结构化数据存储格式，可以被多次编码和解码，以节省计算资源。

1. protobuf协议介绍Protobuf，即Protocol Buffers，是Google开发的一种轻量级的数据交换格式，是一种语言无关、平台无关，简单，高效的结构化数据存储格式，可以被多次编码和解码，以节省计算资源。

Protobuf 可以用于非结构化的数据，如图像和声音，以及可以存储结构数据，如数据库记录、消息和文件，也可以用来定义接口，例如服务器/客户端之间的接口，通过调用它定义的接口，两端可以通过传输的数据进行交互。

Protobuf协议是高性能、高效的一种数据交换格式，它支持多种语言、多种系统间无缝交互，当数据量大时能够显著减少网络带宽。

Protobuf协议比传统的 XML式更加节省资源，使用 protobuf传输效率可以提升超过 20，且能大大提升服务器端处理效率。

2. protobuf协议优势a) 传输效率高Protobuf比几乎所有的技术都具有更快的传输效率，其合理的数据格式能够大大减少网络传输的数据量，执行序列化的消息传输效率，可以比 XML率快 10 20。

b)省带宽Protobuf议能有效地节省带宽，从而减少网络传输的流量以及降低了服务器端处理数据的负担。

c)言无关Protobuf在多种不同的语言中都很容易使用，可以在多种不同的平台使用，并可以在多种不同的系统之间无缝的交换数据，给用户提供更多的便利。

d)结构化数据支持由于protobuf是一种轻量级的数据交换格式，其可以用于非结构化的数据，如图片、声音，以及可以存储结构数据，如数据库记录、消息和文件。

3. protobuf协议在实践中的应用由于它具有上述优势，目前protobuf协议已经被应用在了很多行业，特别是在高性能计算机、移动互联网、云服务、音视频应用中，非常有用。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

B.编译
执行命令 javac -d . -classpath .;protobuf-java-2.x.0.jar AddPerson.java ListPeople.java com\example\tutorial\AddressBookProtos.java
C.执行
运行 AddPerson，在命令中执行命令 java -cp .;protobuf-java2.X.0.jar AddPerson addr.dat，按照提示输入相应的信息,将保存到 addr.dat中
原理之解析与串行化
每个ProtocolBuffer类有些方法用于读写消息的二进制数据( )。包括：
· ParseFromIstream(istream* input) ：从给定的C++ istream解析消息。
· SerializeToOstream(ostream* output) ：将消息写入到给定的C++ ostream中。
他们是成对使用的，提供二进制数据的串行化和解析。
ProtocolBuffer与面向对象设计
ProtocolBuffer类只是用于存取数据的，类似于C++中的结构体，他们并没有在面向对象方面做很好的设计。如果你想要给这些类添加更多的行为，最好的方法是包装(wrap)。包装同样适合于复用别人写好的 .proto 文件。这种情况下，你可以把ProtocolBuffer生成类包装的很适合于你的应用，并隐藏一些数据和方法，暴露有用的函数等等。你不可以通过继承来给自动生成的类添加行为。这
不足 1.不适合描述符号文本 2. 不如XML易阅读和编辑 3.需要工具预先生成序列化类
序列化反序列化对比测试
Protobuf是较优化的,跨语言；可选jackson,解析json效率高； hessian支持rpc
Protocol buffer使用
1.下载资源
下载地址为：下载protoc-2.x.0-win32.zip 和 protobuf-2.x.0.zip，前者是 protocol buffer 编译器，后者包含了三种语言的开发包。首先解压 protoc-2.x.0-win32.zip，把 protoc.exe 文件放到该目录中。编译生成的 protobuf-java-2.X.0.jar 复制到 proto_home\examples
定义
protocol buffers是一个语言中立，平台中立，可扩展的序列化结构化数据的一种方式，可用于通讯协议，数据存储等方面。二进制
与json和xml是同一个层次的东东
支持的语言Java,C++,Python三种
Protocol buffer的优劣
比json和XML 1.简单； 2.小巧：3-10倍 3.效率高：20-100倍 4.跨语言 5.有自动工具生成访问类
编译成-JAVA
protoc --java_out=. addressbook.proto
编译成-pythonp源自otoc --python_out=. addressbook.proto
C++读取
linux安装protobuf
$unzip protobuf-2.3.0.zip $cd protobuf-2.3.0 $./configure && make &&make install $vi /etc/profile export LD_LIBRARY_PATH=/usr/local/lib:/lib:/usr/lib export LD_RUN_PATH=$LD_LIBRARY_PATH export PKG_CONFIG_PATH=/usr/local/lib/pkgconfig $protoc –I. –cpp_out. ./addressbook.proto $make cpp $./list_people_cpp addr.dat Addr.dat是windows下生成的数据文件，复制到linux后可直接读取。环境变量必须设置，否则编译会出错
会破坏他们的内部工作机制。
更新proto文件时的规则
在新的proto文件中就要遵守如下规则：
对已存在的任何字段，你都不能更改其标识（tag）号。你绝对不能添加或删除任何required的字段。你可以添加新的optional或repeated的字段，但是你必须使
用新的标识（tag）号（例如，在这个protocol buffer中从未使用过的标识号——甚至于已经被删除过的字段使用过的标识号也不行）。
package lm; message helloworld { required int32 id = 1; // ID required string str = 2; // str optional int32 opt = 3; //optional field }
编译成-C++
protoc -I=. --cpp_out=. addressbook.proto
显示数据
执行命令w:\jdk6\bin\java -cp .;protobuf-java-2.3.0.j ar ListPeople addr.dat
过程1-proto文件
proto 文件，定义程序中需要处理的结构化数据，在 protobuf 的术语中，结构化数据被称为 Message。proto 文件非常类似 java 或者 C 语言的数据定义。清单 1 显示了例子应用中的 proto 文件内容。
2.使用
A.使用 protocol buffer 编译器编译 addressbook.proto 文件。打开命令行窗口，并定位到 proto_home\examples 目录中，运行命令 protoc --java_out=. addressbook.proto，执行这个命令后会在当前目录下生成一个java类.