mirror of
https://github.com/yyhuni/xingrin.git
synced 2026-02-01 04:03:23 +08:00
8.4 KiB
8.4 KiB
XingRin - 星环 版本管理架构
概述
XingRin - 星环 采用基于 Git Tag 的自动化版本管理系统,确保所有组件(主服务器、远程 Worker)使用一致的版本,避免兼容性问题。
核心原理
版本号来源
- 单一版本源:Git Tag(如
v1.1.0) - 版本文件:
VERSION文件由 CI 自动维护 - 环境变量:
IMAGE_TAG锁定运行时版本
版本一致性保证
Git Tag → CI 构建镜像 → VERSION 文件 → IMAGE_TAG → 所有节点统一版本
完整发布流程
graph TD
A[开发完成] --> B[git commit & push]
B --> C[git tag v1.1.0]
C --> D[git push --tags]
D --> E[GitHub Actions 触发]
E --> F[构建 5 个镜像]
F --> G[推送到 Docker Hub]
G --> H[更新 VERSION 文件]
H --> I[commit 回 main 分支]
style E fill:#e1f5fe
style F fill:#f3e5f5
style G fill:#e8f5e8
镜像构建矩阵
| 镜像 | 用途 | 标签 |
|---|---|---|
xingrin-server |
主服务器 | v1.1.0 + latest |
xingrin-frontend |
前端界面 | v1.1.0 + latest |
xingrin-nginx |
反向代理 | v1.1.0 + latest |
xingrin-worker |
任务执行 | v1.1.0 + latest |
xingrin-agent |
心跳监控 | v1.1.0 + latest |
用户部署流程
初始安装
graph TD
A[用户下载代码] --> B[sudo ./install.sh]
B --> C[读取 VERSION 文件]
C --> D[写入 docker/.env]
D --> E[IMAGE_TAG=v1.1.0]
E --> F[拉取对应版本镜像]
F --> G[启动服务]
style C fill:#fff3e0
style E fill:#e8f5e8
版本更新
graph TD
A[./update.sh] --> B[git pull 拉取新代码]
B --> C[读取新 VERSION 文件]
C --> D[更新 IMAGE_TAG=v1.2.0]
D --> E[重启服务]
E --> F[使用新版本镜像]
style C fill:#fff3e0
style D fill:#e8f5e8
任务分发架构
镜像版本管理
graph LR
A[主服务器] --> B[task_distributor]
B --> C[本地 Worker]
B --> D[远程 Worker 1]
B --> E[远程 Worker N]
F[settings.IMAGE_TAG] --> B
B --> G[yyhuni/xingrin-worker:v1.1.0]
G --> C
G --> D
G --> E
style F fill:#e1f5fe
style G fill:#f3e5f5
执行流程对比
| 场景 | 镜像拉取策略 | 说明 |
|---|---|---|
| 本地 Worker | --pull=missing |
主服务器本机执行,使用本地镜像 |
| 远程 Worker | --pull=missing |
SSH 到远程执行,使用远程本地镜像 |
镜像拉取策略
安装时预拉取
# 主服务器安装
docker compose up -d # 拉取所有服务镜像
# 远程 Worker 安装
docker pull yyhuni/xingrin-worker:v1.1.0 # 预拉取 worker 镜像
执行时策略
# 任务执行时
docker run --pull=missing yyhuni/xingrin-worker:v1.1.0
--pull=missing 行为:
- ✅ 本地有镜像 → 直接使用,不检查网络
- ✅ 本地无镜像 → 从 Docker Hub 拉取
- ✅ 版本更新后 → 自动拉取新版本
版本同步机制
主服务器更新
sequenceDiagram
participant U as 用户
participant S as 主服务器
participant H as Docker Hub
participant W as 远程 Worker
U->>S: ./update.sh
S->>S: git pull (新 VERSION)
S->>S: IMAGE_TAG=v1.2.0
S->>S: 重启服务
Note over S: 分发任务时
S->>W: SSH docker run worker:v1.2.0
W->>H: 本地无 v1.2.0,拉取镜像
H->>W: 返回 v1.2.0 镜像
W->>W: 执行任务
版本一致性保证
- 主服务器:
IMAGE_TAG锁定版本 - 远程 Worker:按需拉取对应版本
- 自动同步:update.sh 统一更新版本号
Agent 自动更新机制
概述
Agent 是运行在每个 Worker 节点上的轻量级心跳服务(~10MB),负责上报节点状态和负载信息。当主服务器更新后,Agent 需要同步更新以保持版本一致。
版本检测流程
sequenceDiagram
participant A as Agent
participant S as Server
participant H as Docker Hub
A->>S: POST /api/workers/{id}/heartbeat/
Note right of A: {"cpu": 50, "mem": 60, "version": "v1.0.8"}
S->>S: 比较 agent_version vs IMAGE_TAG
alt 版本匹配
S->>A: {"status": "ok", "need_update": false}
else 版本不匹配 (远程 Worker)
S->>S: 设置状态为 updating
S->>A: {"status": "ok", "need_update": true}
S-->>H: SSH: docker pull agent:v1.0.19
S-->>A: SSH: 重启 agent 容器
else 版本不匹配 (本地 Worker)
S->>S: 设置状态为 outdated
S->>A: {"status": "ok", "need_update": true}
Note over S: 需用户手动 ./update.sh
end
Worker 状态流转
| 场景 | 状态变化 | 说明 |
|---|---|---|
| 首次心跳 | pending/deploying → online |
Agent 启动成功 |
| 远程 Worker 版本不匹配 | online → updating → online |
服务端自动 SSH 更新 |
| 远程 Worker 更新失败 | updating → outdated |
SSH 执行失败 |
| 本地 Worker 版本不匹配 | online → outdated |
需手动 update.sh |
| 版本匹配 | updating/outdated → online |
恢复正常 |
更新触发条件
- 远程 Worker:服务端检测到版本不匹配时,自动通过 SSH 执行更新
- 本地 Worker:用户执行
./update.sh时,docker-compose 会拉取新镜像并重启
防重复机制
使用 Redis 锁防止同一 Worker 在 60 秒内重复触发更新:
lock_key = f"agent_update_lock:{worker_id}"
redis.set(lock_key, "1", nx=True, ex=60)
相关文件
| 文件 | 作用 |
|---|---|
backend/apps/engine/views/worker_views.py |
心跳 API,版本检测和更新触发 |
backend/scripts/worker-deploy/agent.sh |
Agent 心跳脚本,上报版本号 |
backend/scripts/worker-deploy/start-agent.sh |
Agent 启动脚本 |
docker/agent/Dockerfile |
Agent 镜像构建,注入 IMAGE_TAG |
开发环境配置
本地开发测试
# docker/.env 中添加(开发模式会自动设置)
TASK_EXECUTOR_IMAGE=docker-worker:v1.1.0-dev # 指向本地构建镜像
开发模式启动
# 使用本地构建镜像(自动构建并标记为 ${VERSION}-dev)
./install.sh --dev
./start.sh --dev
配置文件说明
VERSION 文件
v1.1.0
- 由 CI 自动维护
- 用户安装时读取此文件
docker/.env
IMAGE_TAG=v1.1.0 # 锁定版本
TASK_EXECUTOR_IMAGE= # 可选:覆盖镜像名
settings.py 逻辑
if IMAGE_TAG:
# 主服务器:构建镜像名
TASK_EXECUTOR_IMAGE = f'{DOCKER_USER}/xingrin-worker:{IMAGE_TAG}'
else:
# Worker 容器:不需要此配置
TASK_EXECUTOR_IMAGE = ''
Agent 自动更新机制
概述
Agent 是运行在每个 Worker 节点上的轻量级心跳服务,负责上报节点状态和负载信息。当主服务器更新后,Agent 需要同步更新以保持版本一致。
版本检测流程
版本不一致问题
症状:任务执行失败,兼容性错误
排查:
# 检查主服务器版本
cat VERSION
grep IMAGE_TAG docker/.env
# 检查远程 Worker 镜像
ssh worker_host "docker images | grep xingrin-worker"
解决:
# 主服务器更新
./update.sh
# 远程 Worker 会自动拉取新版本(下次任务执行时)
镜像拉取失败
症状:docker run 报错,无法拉取镜像
排查:
# 检查网络连接
docker pull yyhuni/xingrin-worker:v1.1.0
# 检查版本是否存在
curl -s https://hub.docker.com/v2/repositories/yyhuni/xingrin-worker/tags/
最佳实践
版本发布
- ✅ 严格遵循语义化版本(v1.2.3)
- ✅ 有改动必须更新版本号
- ✅ 通过 CI 自动构建,不手动推送
- ✅ 测试版本使用
-dev.x后缀
部署运维
- ✅ 定期执行
./update.sh获取更新 - ✅ 监控 Docker Hub 镜像拉取状态
- ✅ 备份重要配置文件(.env)
- ✅ 使用
docker system prune清理旧镜像
开发调试
- ✅ 本地测试使用
--dev模式(自动构建docker-worker:${VERSION}-dev) - ✅ 远程测试先推送测试版本到 Hub
- ✅ 生产环境避免使用
latest标签,始终使用明确版本号 - ✅ 开发环境使用
-dev后缀区分开发版本 - ✅ 版本回滚通过修改
IMAGE_TAG实现