核心优势
9 年+基础设施与稳定性工程经验
3 年+专注运维开发平台建设,以 Go 为核心语言主导从 0 到 1 构建 CI/CD 调度引擎、可观测性体系与自动化运维平台,推动运维从"人力驱动"向"平台驱动"转型
SRE 方法论落地
建立 SLO/SLI 指标体系与故障分级机制,推动可用性从 99.5% 提升至 99.9%(实际达成);主导跨机房容灾方案设计,RPO <5min / RTO <30min
平台工程实践
自研 Go 运维开发平台,覆盖 CI/CD 调度、日志采集、监控 SDK、运维 API 全链路,20+ 运维操作平台化,运维操作效率 ↑80%,人力成本 ↓40%
NPDP + ACP 双认证
兼具产品思维与敏捷管理能力,擅长将业务需求转化为可落地技术方案
技术输出
独立撰写《现代运维实践指南》电子书(25 篇 / 28 万字),覆盖 SRE、可观测性、混沌工程、平台工程、FinOps 全场景
技术栈
💻 语言
📦 容器 & 编排
🔄 CI/CD & GitOps
📊 可观测性
💾 数据 & 中间件
🛠️ IaC & 自动化
☁️ 云 & 安全
工作经历
独立运维开发咨询
运维开发架构师
为多家企业客户规划并落地 DevOps 平台,覆盖 CI/CD、可观测性、微服务治理与容灾体系。
自研 CI/CD
部署耗时 1.5h → 5min(↓94%),部署频率 2 次/周 → 5 次/日
监控告警
告警触达 5 秒,故障定位 30min → 8min(↓73%)
运维平台化
20+ 手动操作平台化,每周节省 15h,人力成本 ↓40%
微服务治理
治理 50+ 服务,限流熔断降级策略,整体 P99 200ms → 170ms
跨机房容灾
RPO <5min,RTO <30min,核心业务 7×24h 可用
地上铁绿色科技
运维工程师 → 运维负责人
新能源物流车数智化运营服务平台
180,000+ 运营车辆 | 200+ 城市 | 8,700+ 企业客户
180,000+ 运营车辆 | 200+ 城市 | 8,700+ 企业客户
SRE 体系
建立 SLO/SLI 体系与 On-Call 轮值机制,可用性 99.5% → 99.9%,年停机 ↓80%,MTTR ↓40%
容器化
3 个月完成 120+ 微服务 K8s 迁移,扩缩容 25min → 1min
安全合规
从 0 到 1 搭建安全体系,安全事件 ↓80%,通过等保 2.0 审计
DevOps 平台
引入蓝鲸平台并主导 GitLab + K8s 集成,提前 2 个月交付,产研效率 ↑30%
田田云(诺普信集团旗下)
运维工程师
MySQL 调优
索引优化 + 慢查询治理,慢查询 ↓90%,查询性能 ↑60%
Nginx
连接数调优 + 缓存策略,并发能力 5,000 → 20,000+
CI/CD
Jenkins 流水线,构建发布耗时 2h → 15min,失败率 ↓70%
多家企业
电商运营经理 / 运营主管
9 年电商运营,从零搭建 5 家企业电商项目,团队 30 人,年销售额合计 5,000万+。2017 年转型技术领域,业务视角成为后续运维平台建设的独特优势。
项目经历
1. Go 运维开发平台(从 0 到 1)
独立咨询
2023.10 — 至今 | 架构设计 & 核心开发
- 技术选型:Go(高并发、单二进制部署、跨平台),Gin + gRPC 微服务架构
- CI/CD 调度引擎:基于 DAG 任务编排,支持并行/串行/条件分支,插件化扩展
- 可观测性 SDK:日志采集 Agent + Metrics 上报 + 分布式链路追踪(Prometheus + Jaeger)
- 运维 API 平台:20+ 运维操作 RESTful 化,前端 Web 界面
- 容灾方案:跨机房容灾架构,数据同步 + 自动故障切换
2. 雪豹平台容器化迁移
地上铁
2020.01 — 2020.03 | 项目统筹
- 120+ 微服务 Docker 化 + K8s 迁移,Jenkins Pipeline 重构 CI/CD
- 3 个月完成全量迁移零故障,扩缩容 25min → 1min,发布效率 ↑50%
3. 运维安全体系 & 等保 2.0 合规
地上铁
2022.03 — 2022.06 | 项目统筹
- 安全基线加固、最小权限管控、漏洞扫描、应急响应 SOP
- 高危漏洞发现即修复率 100%,安全事件 ↓80%,通过等保 2.0 审计
4. 蓝鲸 DevOps 平台落地
地上铁
2019.09 — 2019.11 | 项目经理
- 引入蓝鲸平台,主导 GitLab + K8s 集成适配,标准化 30+ 作业流程
- 提前 2 个月交付,产研效率 ↑30%
技术输出
《现代运维实践指南》—— 独立撰写
2026.06 — 至今 | 持续更新
融合谷歌 SRE 核心理念,覆盖运维与安全全场景的系统性技术专著。25 篇 · 28 万字 · 7 大模块
SRE 体系 · 可观测性 · 云原生 & 平台工程 · 安全 & 合规 · 混沌工程 · AIOps · FinOps
教育 & 证书
🎓 大专
平职学院 · 机电一体化
2004 — 2007
🏆 NPDP
产品经理认证
2023 年
📜 ACP
敏捷项目管理认证
2022 年
联系方式
扫码添加微信,欢迎交流