消息回传与实时通信：PaiFlow的前后端实时通信SSE是如何实现的？

大家好，我是二哥呀。

一开始，我在做 PaiAgent 这个 Vibe Coding 项目时，确实是在工作流跑完的时候一次性返回结果的，Vibe Coding 尽量小版本持续迭代。但这样的话，用户就无法感知工作流的实时执行状态。如果工作流非常复杂，需要等待的时间很久，用户很容易在等的过程中失去耐心。

所以在做 PaiFlow 的时候，我就决定，每一个节点的状态都应该实时推送给前端。有了这个前提，我们再来聊，消息是怎么回传的，实时通信又是怎么做的。

第一个是事件驱动。工作流的执行本质上是一连串状态的变化过程，节点开始、节点跑完、节点失败。所以我们要在每一个关键时刻，主动把事件抛出来，通过发布-订阅的方式，让前端感知到。

第二个是消息必须标准化，不能今天是这个状态，明天又多一个状态，所有回传消息都必须是统一的结构，不管是工作流级别的事件，还是节点级别的事件，前端只需要按照同一种方式去解析和渲染就好了。

第三个，在技术选型上，我们决定使用 Server-Sent Events，也就是 SSE。这种方式非常适合单向的，服务端向前端推送状态的场景；另外就是，派聪明 RAG 我们用了 WebSocket，之前也有球友说为什么不用 SSE，那这次我们就狠狠听劝，用。

前端发起工作流执行请求，后端一边跑 Workflow，一边把节点状态和 LLM 的流式输出持续推送给前端。这个业务并不复杂，但会涉及到非常多的组件。

我们从入口开始看，WorkflowController.executeWorkflow 会先创建一个 SseEmitter 对象，然后将其作为参数创建 SseStreamCa...

34 条评论

wjq 2026年04月08日 18:18

引用原文：SSE 的本质是服务器长时间持有连接，因此不能阻塞处理请求的 Web 服务器线程（通常是 Tomcat 线程）。因此我们使用 AsyncUtil.execute 将整个工作流的执行过程提交到一个独立的后台线程池中去处理。这使得控制器可以立即返回 SseEmitter 对象，而无需等待工作流执行完毕。

线程池用的哪种

回复1 取消回复

wjq 2026年04月08日 18:20

@派聪明

云宿 2026年03月23日 17:06

引用原文：并将执行权委托给它，并将 WorkflowMsgCallback 作为参数传入。

@派聪明前面不是已经把它放在了上下文了吗？为什么你又要传入它？

派聪明 2026年03月23日 17:07

这是一个很好的问题，涉及到代码设计中的职责分离和依赖注入原则。虽然WorkflowMsgCallback已经在WorkflowEngine中创建，但需要将其作为参数传递给NodeExecutor，原因如下： 1. **职责分离**：WorkflowEngine负责工作流的整体执行流程，而具体的节点执行是由NodeExecutor负责的。将WorkflowMsgCallback传递给NodeExecutor，让节点执行器能够触发回调事件，实现了职责分离。 2. **依赖注入**：这是一种依赖注入设计模式。WorkflowEngine不直接处理节点的回调逻辑，而是将这个职责委托给NodeExecutor。通过将WorkflowMsgCallback作为参数传入，NodeExecutor获得了触发回调的能力。 3. **状态一致性**：WorkflowMsgCallback包含了工作流执行的状态信息(如streamQueue)。通过传递同一个实例，确保了所有节点共享同一个回调对象和状态，保持状态一致性。 4. **解耦设计**：这种设计降低了组件间的耦合度。WorkflowEngine不需要知道具体节点如何执行，只需将必要的回调对象传递给执行器即可。 5. **链式调用支持**：工作流执行可能形成调用链：WorkflowEngine -> executeNode -> NodeExecutor。每个环节都需要触发回调，所以WorkflowMsgCallback需要在调用链中传递。这种设计遵循了"单一职责原则"和"依赖倒置原则"，使代码更易维护和扩展。

清清 2026年03月20日 14:14

引用原文：供一个 Lambda 回调

@派聪明怎么理解“回调”二字

派聪明 2026年03月20日 14:15

“回调”（Callback）在编程中指的是**将一个函数作为参数传递给另一个函数，并在特定事件发生时由后者调用前者**。结合“提供一个 Lambda 回调”的上下文，可拆解为以下核心含义： --- ### 1. **回调的本质：函数作为参数传递** - 回调函数不是直接执行，而是**被“委托”给其他函数**，在特定时机（如异步操作完成、事件触发时）被调用。 - **示例**： ```python def process_data(callback): # 接收回调函数作为参数 result = "处理后的数据" callback(result) # 在适当时机调用回调函数 # 提供一个Lambda回调 process_data(lambda data: print(f"收到数据: {data}")) # 输出: 收到数据: 处理后的数据 ``` --- ### 2. **Lambda回调的简化作用** - **Lambda表达式**是匿名函数，用于**简化回调的定义**，避免单独声明具名函数。 - **对比传统回调**： ```python # 传统方式（需定义具名函数） def handle_result(data): print(f"收到数据: {data}") process_data(handle_result) # Lambda方式（直接内联定义） process_data(lambda data: print(f"收到数据: {data}")) ``` - **优势**：代码更简洁，尤其适合一次性使用的简单逻辑。 --- ### 3. **场景：异步操作与事件驱动** - 回调常用于处理**异步操作**（如网络请求、文件读写），主函数不等待操作完成，而是通过回调通知结果。 - **参考资料中的实例**（工作流引擎）： ```java // LLMNodeExecutor调用大模型服务，传入Lambda回调 modelServiceClient.chatCompletion(req, chatResponse -> { // 每收到一段流式数据，触发回调 callback.onNodeProcess(0, nodeId, aliasName, chatResponse.getText(), ...); }); ``` - **解释**： 1. `chatCompletion`是异步调用（不阻塞主线程）。 2. Lambda回调在收到数据时立即执行，实时更新前端状态。 3. 回调函数通过`callback`参数传递，实现解耦。 --- ### 4. **回调的核心价值** - **解耦**：调用方（如工作流引擎）不依赖具体实现，只需定义回调接口。 - **异步处理**：避免阻塞主线程，提升性能（如SSE实时推送）。 - **灵活扩展**：通过不同回调函数实现多样化逻辑（如日志记录、错误处理）。 --- ### 总结 “提供一个 Lambda 回调”意味着： > **将一个匿名函数（Lambda）作为参数传递，在异步操作或事件触发时执行该函数，实现结果处理或状态更新。** 这一机制是异步编程和事件驱动系统的核心，通过Lambda简化了回调的定义，使代码更简洁高效。

清清 2026年03月20日 14:12

WorkflowEngine 找到当前要执行的节点（如 LLM 节点），并从 nodeExecutors 中找到对应的 LLMNodeExecutor。调用 llmNodeExecutor.execute() ，并将 WorkflowMsgCallback 作为回调参数传入。这里的回调参数怎么理解，什么是回调

清清 2026年03月20日 13:38

引用原文：choices[0].finish_reason 必须是 “stop”。

@派聪明为什么前面一定要为null，这里一定要为stop

派聪明 2026年03月20日 13:39

在参考资料中，`choices[0].finish_reason` 字段在不同事件中有不同的值，这是为了标识工作流或节点的执行状态： 1. **工作流开始时为 `null`**：表示工作流正在执行中，尚未完成。前端需要继续监听后续的流式输出。 2. **工作流结束时为 `"stop"`**：明确表示工作流已执行完成，前端可以停止监听并显示最终结果。这种设计遵循了 OpenAI 的流式 API 响应格式规范： - `null` 表示事件正在进行中 - `"stop"` 表示事件已正常结束通过这种方式，前端可以根据 `finish_reason` 的值判断是否应该继续监听流式输出，或者关闭连接并显示最终结果，实现状态的精确控制。

昏睡的吐司 2026年03月19日 15:23

@派聪明另一个是 orderStreamResultQ，用来缓存那些需要在收尾阶段按顺序处理的结果。什么叫需要在收尾阶段按顺序处理的结果

派聪明 2026年03月19日 15:23

orderStreamResultQ 是一个特殊队列，用于存储工作流执行中需要在收尾阶段按特定顺序处理的关键结果。这些结果通常包括： 1. 工作流结束节点(EndNode)的最终结果 2. 需要汇总或合并的多个节点结果 3. 按业务逻辑要求必须按特定顺序返回的数据(如按节点ID、执行时间排序) 与普通流式事件队列 streamQueue 不同，orderStreamResultQ 中的消息会在工作流执行结束后，按照预设的优先级或顺序统一发送给前端，确保重要结果不被普通事件消息打乱顺序。例如，当工作流包含多个并行节点时，可能需要按照节点执行完成顺序或业务逻辑顺序返回结果，这时就会使用 orderStreamResultQ 来保证顺序性。

Ψ 2026年03月16日 16:27

引用原文：在这里， SseStreamCallback 实例会被赋值给 WorkflowMsgCallback 内部的 clientCallback 字段。

也就是说clientCallbacks是专门用来发送数据的，而chatCallBacks是用来封装节点传来的消息，放入队列的

Ψ 2026年03月09日 16:09

引用原文：ChatCallBacks 根据不同的事件类型 ( onNodeStart 等)，创建格式统一的 LLMGenerate 对象（加上时间戳、进度等）。再调用 putFrameIntoQueue() ，将 LLMGenerate 对象放入内部的 streamQueue 队列中。事件在此刻进入了缓冲状态。

这里的判断条件false写死了，所以是没有实现是吗？实际上只是用到了streamQueue队列

berlin 2026年03月20日 20:44

我也觉得是，很多地方代码写的跟讲的完全不一样

Ψ 2026年03月09日 14:25

引用原文：交给 ChatCallBacks 去创建统一的事件对象

@派聪明，这个ChatCallBacks是什么

派聪明 2026年03月09日 14:26

根据参考资料，**ChatCallBacks** 是工作流引擎中负责**事件生产**的核心组件，主要作用是将工作流执行过程中的各种节点事件（如节点开始、执行中、结束）转换为标准化的消息对象，并推送到消息队列供前端实时消费。以下是关键解析： --- ### **1. 核心职责** - **事件标准化**：监听工作流生命周期事件（如 `onNodeStart`、`onNodeProcess`、`onNodeEnd`），将原始事件转换为统一格式的 **`LLMGenerate` 对象**（兼容 OpenAI 流式响应格式）。 - **消息队列管理**：将生成的消息放入 `streamQueue`（普通流式事件队列）或 `orderStreamResultQ`（需顺序处理的特殊事件队列），解耦生产与消费逻辑。 - **业务数据封装**：封装节点执行时间、Token消耗、输入/输出等元信息，供前端展示工作流状态。 --- ### **2. 关键方法与事件处理** | 方法 | 功能 | 示例消息片段 | |--------------------|----------------------------------------------------------------------|-----------------------------------------------------------------------------| | `onNodeStart()` | 节点开始时触发，记录启动时间，生成节点开始事件。 | `{"workflow_step": {"node": {"id": "node-llm::001", "alias_name": "LLM节点"}, "progress": 0.3}}` | | `onNodeProcess()` | 节点执行中触发（如LLM流式输出），实时推增内容。 | `{"choices": [{"delta": {"content": "播客脚本第一段..."}}]}` | | `onNodeEnd()` | 节点结束时触发，统计耗时/Token，封装最终结果。 | `{"workflow_step": {"node": {"outputs": {"llm_output": "完整脚本..."}}}}` | --- ### **3. 在事件流中的位置** ```mermaid graph LR A[节点执行] --> B[AbstractNodeExecutor] B --> C{ChatCallBacks} C --> D[生成LLMGenerate对象] D --> E[放入streamQueue] E --> F[WorkflowMsgCallback异步消费] F --> G[SseStreamCallback推送到前端] ``` - **生产者角色**： ChatCallBacks 位于事件流的起点，接收来自 `NodeExecutor` 的原始事件，加工后放入队列。 - **解耦设计**：通过队列缓冲消息，避免阻塞工作流主线程，同时支持高并发场景。 --- ### **4. 为什么需要统一事件对象？** - **前端兼容性**：所有事件（工作流开始/结束、节点状态、LLM流式输出）均采用 `LLMGenerate` 格式，前端可统一解析。 - **扩展性**：若需改用 WebSocket，只需替换 `SseStreamCallback` 为 `WebSocketStreamCallback`，无需修改 ChatCallBacks 的生产逻辑。 --- ### **总结** **ChatCallBacks 是工作流引擎的“事件工厂”**，负责将分散的节点状态事件标准化为可被前端实时消费的流式消息，是实时通信架构中的关键生产者组件。

热门评论

34 条评论

目录

划线评论