为什么 ChatGPT 使用 SSE 进行流式传输

February 8, 2025

SSE 是什么

SSE 即 Server-sent events，可以翻译为服务端事件。

简单来说，SSE 是一个请求和非常长的响应。

就像这样，我们打开 ChatGPT 并与它对话，就能够看到服务端一直在返回新数据，相应地，页面上也在以数据流的形式不断显示新的文字内容：

SSE 这种服务器推送技术允许服务端在数据可用时立即推送到客户端，而无需客户端不断询问或轮询服务器以获取新数据。这允许在不需要持续请求的情况下将实时更新传递给客户端。

首先我们要清楚，客户端与服务端通信既可以通过客户端主动请求，也可以通过服务器主动推送。

若要实现 ChatGPT 中的实时通信，可以通过 SSE 或 WebSocket，为什么 ChatGPT 会选择 SSE 而不是 WebSocket 呢？

我们来仔细对比下 SSE 和 WebSocket 的不同点：

SSE 使用场景：

WebSocket 使用场景：

考虑到以下几点，ChatGPT 选择 SSE 足够：

单向通信。ChatGPT 只需要从服务端到客户端实时推送，并不需要频繁的双向通信，SSE 更符合需求。
实现和维护复杂度。SSE 简单易用，只需要服务端推送消息，客户端通过标准的 EventSource API 可以轻松接收消息，并且是基于 HTTP/HTTPS 实现，不需要像 WebSocket 那样进行复杂的连接握手和状态管理。
兼容性和可靠性。SSE 通过 HTTP/1.1 实现，能够更好的穿透代理服务器、防火墙等设施，保证了消息推送可靠性。WebSocket 需要协议从 HTTP 升级到 WebSocket 协议(WS 或 WSS)，某些网络可能会阻断这种升级过程，从而影响连接的可靠性。
自动重连和消息重发。SSE 支持自动重连功能，WebSocket 重连需要手动实现较复杂。
资源效率和性能。SSE 使用较少的资源，服务器压力小，WebSocket 性能较优但资源消耗大，对服务器来说压力更大。
使用场景的适配性。SSE 适合更低频的消息推送，WebSocket 适合高频双向通信。

在 ChatGPT 的情况下，当你发送消息时，服务器可能会立即开始使用机器学习算法生成响应。一旦服务器生成新的文本，他就可以通过 SSE 发送给客户端，这样就允许客户端在响应到达时立即渲染。

数据流效果：

可以看到response一直在变化：