etl时要做到数据不丢失,要满足如下条件

例子

  1. 从数据源读取消息A
  2. 处理消息A
  3. 将消息A的offset持久化到文件
  4. 读取消息B
  5. 程序崩溃
  6. 程序重启
  7. 读取持久化文件(读取上次完成的位置)
  8. 读取消息B
  9. 判断消息B是否处理完成
    1. 消息B处理完成,读取消息C…
    2. 消息B未处理完成,处理消息B…