type
status
date
slug
summary
tags
category
icon
password

什么是WebSocket

WebSocket是一种网络传输协议,可以在单个TCP连接上进行全双工通信,位于OSI模型的应用层.
特点如下:
  • 允许服务端主动向客户端推送数据
  • 在HTTP端口80和443工作,支持HTTP代理和中介
  • WebSocket使用ws:// 或者 wss:// 表示,后者是使用了TLS的WebSocket
  • 默认情况下,WebSocket使用80端口;运行在TLS上时,用的是443端口
背景是:之前要实现服务端推送,一般方法是轮询,但是轮询比较耗费资源和带宽.

握手协议

WebSocket是独立的,创建在TCP上的协议
WebSocket通过HTTP/1.1 协议的101状态码进行握手
为了创建WebSocket连接,需要浏览器发出请求,服务器响应,然后建立连接,这个过程叫做握手
只能使用HTTP GET方法

请求头

响应头

可以看到,与普通HTTP请求相比,多了下面这几个header:
服务端返回Header则多了:
其中Upgrade: websocket和Connection: Upgrade是RFC中规定写死的.
Sec-WebSocket-Version一般都是等于13

Sec-WebSocket-Key

一个客户端随机生成的base64字符串.

Sec-WebSocket-Accept

计算规则如下:
  1. 拼接 Sec-WebSocket-Key 和 WebSocket规定的GUID值(RFC中规定为258EAFA5-E914-47DA-95CA-C5AB0DC85B11)
  1. 使用SHA-1摘要算法进行加密,通常是40个16进制数
  1. 进行Base64编码
服务端响应之后,客户端会进行校验,如果状态码和Sec-WebSocket-Key/Sec-WebSocket-Accept对应上,则握手成功,后面会进行数据传递了.

数据传输

WebSocket使用Data Frame为单位进行数据传输的.由一个或者多个Data Frame组成一个完整的消息.

DataFrame

上面这个是Data Frame的格式,下面来具体看一下Data Frame的格式:
  • FIN
    • 1 bit;
      表示Frame是否为消息的最后一个片段(fragment),即是否为最后一帧.
      如果是0,表示不是最后一帧;如果是1表示是最后一帧
  • RSV1/RSV2/RSV3
    • 各占 1 bit;
      除非协商了一个extension(定义了非0值的意义),否则这三个值都必须为0;
      如果这三个中出现了非0值,但是缺少了对应的extension,websocket连接失败.
  • Opcode
    • 4 bit,最多可以表示16种操作码,但是目前并没有用到这么多;
      用于解释Payload数据,即Payload数据的类型,便于程序对不同的Payload数据做出对应的解析.
    • %x0 : 表示这是一个连续帧,当Opcode = 0时,表示本次数据采用了数据分片,档案收到的数据帧为其中一个数据分片
    • %x1 : 表示这是一个文本帧
    • %x2: 表示这是一个二进制帧
    • %x8 : 表示连接断开
    • %x9 : 表示这是一个Ping操作 (用于心跳机制)
    • %xA : 表示这是一个pong操作 (用于心跳机制)
    • 这里的“%x”表示的是16进制
  • Mask
    • 1 bit;
      表示是否要对Payload数据进行掩码操作.
      从客户端向服务端发送数据时,需要对数据进行掩码操作,如果服务端接收到的数据没有经过掩码操作,则断开连接;
      从服务端向客户端发送数据时,不需要对数据进行掩码操作;
      也就是说,所有从客户端向服务端发送的Frame的Mask都为1.
      如果这里Mask设置为1,则后面的Masking-key会有对应的数据.否则masking-key没有数据为空.
      Masking-key就是为了对Payload数据进行反掩码操作.
  • Payload len 和 Extended Payload length
    • 7 bit / 7 + 16 bit / 7 + 64 bit,即Payload len为7bit, Extended payload length 可能为0bit,16bit,或者64bit.
      Payload len的单位是字节,这是什么意思呢?
      7bit以十进制无符号整数表示最大为127, 比如这里7个bit的payload len表示十进制数 12,则表示payload数据有12byte.
      但是这里显然不是这么简单,要不然也没必要使用Extended payload length了.
      假设 x 表示 payload len 7bit数代表的无符号整数,则
    • x 在 [0,125]范围内是, payload数据长度为x字节
    • x = 126,则extension payload length为16bit,这16bit换算成一个无符号的整数为 y,则payload数据长度为y字节
    • x = 127,则extension payload length 为64未,这 64bit换算成一个无符号整数为y,则payload数据长度为y字节.
    • 如果extension payload length不为空,则二进制表达采用的是BigEndian,即大端序,一个个字节为最高位字节.
      Payload数据长度 = extension data + application data的长度,这里extension data的长度可以为0.
  • Masking-key
    • 0 或者 32 bit.
      前面说过,如果mask = 1,则这里Masking-key有值,为一个32bit的数.
      如果mask = 0,则没有Masking-key.
      这里的Masking-key就是一个随机生成的32未随机数.掩码操作不会影响payload的长度.
      掩码算法/反掩码算法如下:
      原始第x个字节,原始字节数组为A,掩码之后的字节数组为T,则有
      掩码操作并不保证安全性.
  • Payload data
    • Payload data = extension data + application data.
      拓展数据: 如果没有协商使用拓展(前面的RSV1/RSV2/RSV3),则拓展数据为0字节;所有拓展都必须告知拓展数据的长度,或者可以如何计算出拓展数据的长度.拓展数据必须在握手阶段之前就协商好.
      应用数据: 任意的应用数据,都在拓展数据之后,占据了数据剩余帧的位置.payload length - 拓展数据长度就是应用数据的长度了.

心跳机制

上述Opcode中定义的Ping/Pong,其实就是为了提供心跳机制的.
为了确认客户端和服务端之间的连接可用,需要定时发送心跳,用于确保连接可正常使用和在连接异常的时候断开连接节省资源和重新连接.
谁来发送Ping,谁来发送Pong,没有特别的限制.
如果客户端支持Ping,那么客户端发送Ping,服务端尽可能快的响应pong.
但是浏览器目前不支持Ping操作,因此由服务端发送Ping,浏览器响应Pong.
可以在两端设置超时机制,过了指定的时间如果还没收到ping/pong,则断开连接或者重新连接.

数据分片

就是将消息分割成多个数据帧.
根据上面的说明,其实就是根据FIN和Opcode进行判断.
  • 不分片
    • FIN = 1, Opcode = %x1 或者 %x2
  • 分片
    • 第一针: FIN = 0, Opcode = %x1 或者 %x2
      第二帧: FIN = 0, Opcode = %x0
      第三帧: FIN = 1, Opcode = %x0
至于为什么是这样的,如果仔细看了上面关于数据帧协议说明这部分,很容易理解.

使用场景有哪些

websocket是用于C/S双向通信的,可以想象这样的场景有哪些?
  • 推送
  • 聊天
  • 订阅
  • 多玩家游戏
  • 协同编辑
  • 数据统计
  • 股票价格实时更新
  • 体育实况
  • 基于位置的应用
  • 在线教育

客户端如何使用

Android

Javascript

服务端如何使用

Golang

测试地址

  1. http://websocket.org/echo.html

参考文章

  1. https://www.rfc-editor.org/rfc/rfc6455.txt
 
相关文章
初识SDL浅谈TLS
Loading...