千夜网 · 公网文档
实施与运维
本栏目用于部署拓扑、配置、监控与 Runbook,帮助运维人员快速上手千夜科技的产品和服务。
部署指南
系统要求
- 操作系统:Ubuntu 20.04 LTS 或 CentOS 7+
- CPU:至少 4 核
- 内存:至少 8GB
- 存储空间:至少 50GB
- 网络:稳定的互联网连接
部署方式
Docker 部署(推荐)
# 克隆代码仓库
git clone https://github.com/your-org/zhihui-sports-ai.git
cd zhihui-sports-ai
# 启动服务
docker-compose up -d
手动部署
# 安装依赖
npm install
# 构建项目
npm run build
# 启动服务
npm run start
部署拓扑
推荐使用以下部署拓扑:
┌─────────────────┐ ┌─────────────────┐ ┌─────────────────┐
│ 负载均衡器 │ │ 应用服务器 │ │ 数据库服务器 │
│ (Nginx/ALB) │───▶│ (Node.js) │───▶│ (PostgreSQL) │
└─────────────────┘ └─────────────────┘ └─────────────────┘
配置说明
环境变量配置
以下是主要的环境变量配置:
| 环境变量 | 描述 | 默认值 |
|---|---|---|
| NODE_ENV | 运行环境 | development |
| PORT | 服务端口 | 3000 |
| DATABASE_URL | 数据库连接 URL | - |
| TENANT_ID | 租户 ID | - |
| JWT_SECRET | JWT 密钥 | - |
监控与告警
监控指标
- CPU 使用率
- 内存使用率
- 磁盘使用率
- 网络流量
- API 请求响应时间
- 错误率
告警设置
- CPU 使用率超过 80% 时告警
- 内存使用率超过 85% 时告警
- 磁盘使用率超过 90% 时告警
- API 请求响应时间超过 1 秒时告警
- 错误率超过 1% 时告警
备份与恢复
备份策略
- 每日全量备份
- 每小时增量备份
- 备份文件保留 30 天
- 备份文件存储在异地
恢复流程
- 停止服务
- 恢复数据库备份
- 恢复应用代码
- 启动服务
- 验证服务状态
Runbook
常见问题处理
服务无法启动
检查端口是否被占用,环境变量是否正确配置。
数据库连接失败
检查数据库服务是否运行,连接字符串是否正确。
API 响应缓慢
检查服务器资源使用情况,优化数据库查询。
系统崩溃
查看日志文件,分析崩溃原因,恢复最近的备份。