核心職責: 1. 設計并實施監(jiān)控、告警系統(tǒng),確保及時發(fā)現(xiàn)問題。 2. 制定 SLA/SLO(服務等級目標)/SLI(服務等級指標),并圍繞這些指標優(yōu)化系統(tǒng)。 3. 處理事故(Incident Management),進行根因分析(RCA)并推動改進。 4. 通過自動化減少人工操作(如自動擴縮容、故障自愈)。 5. 容量規(guī)劃與性能優(yōu)化,確保系統(tǒng)可應對流量增長。 6. GitOps CI/CD流水線設計與實施 l 設計并搭建基于GitOps理念的自動化CI/CD流水線,集成Kubernetes、ArgoCD、Tekton等工具。 l 實現(xiàn)代碼從提交到部署的全流程自動化,確保環(huán)境一致性及可追溯性。 l 優(yōu)化流水線性能,提升構建、測試、部署效率。 7. DevOps工具鏈整合 l 將CI/CD系統(tǒng)與JIRA等敏捷管理工具深度整合,實現(xiàn)需求-開發(fā)-部署-運維閉環(huán)。 l 與企業(yè)微信集成,支持一鍵部署各集成環(huán)境(如開發(fā)、測試、預發(fā)布、生產(chǎn))。 l 通過自動化腳本(Python/Shell)打通工具鏈數(shù)據(jù)流,提供可視化度量指標(如部署頻率、故障恢復時間)。 8. 技術開發(fā)與自動化 l 使用Python開發(fā)運維工具、自動化腳本及API集成模塊,支持運維效率提升。 l 探索AI工具(如GitHub Copilot、LLM)在日志分析、故障排查、代碼生成等場景的應用。 9. 運維架構優(yōu)化與規(guī)范制定 l 設計高可用、可擴展的基礎設施架構,制定運維規(guī)范及災備方案。 l 推動Infrastructure as Code(IaC)實踐,熟練使用Terraform、Ansible等工具。
任職要求: 1. 必備條件: l 3年以上運維開發(fā)或DevOps相關經(jīng)驗,熟悉云原生技術棧(K8s/Docker/Helm)。 l 精通GitOps實踐,有ArgoCD/Flux等工具的實際項目經(jīng)驗。 l 熟練使用Python開發(fā),具備腳本編寫、API集成及自動化開發(fā)能力。 l 熟悉JIRA API及敏捷開發(fā)流程,能設計工具鏈整合方案。 l 具有企業(yè)微信API集成經(jīng)驗,能夠實現(xiàn)CI/CD與企業(yè)微信的自動化交互(如審批、通知、一鍵部署)。 l 善于學習新技術,能主動運用AI工具輔助工作。 2. 優(yōu)先條件: l 有保險、金融行業(yè)DevOps平臺建設經(jīng)驗。 l 熟悉Prometheus/Grafana監(jiān)控體系或日志分析工具(ELK)。 l 持有Kubernetes/CKA、AWS/Azure認證者加分。 l 會粵語者優(yōu)先