崗位內容:
1.能夠完成大數(shù)據(jù)領域常見組件的安裝部署,編寫巡檢腳本、完善監(jiān)控指標,定期檢查節(jié)點與服務運行狀態(tài)。
2.根據(jù)監(jiān)控與異常告警信息,通過日志分析等手段快速定位并處理常見故障,確保服務能夠盡快恢復正常。
3.與開發(fā)、測試人員密切配合,按照流程完成應用的版本發(fā)布與功能迭代,確保上線過程平穩(wěn)順利。
4.協(xié)助對各類數(shù)據(jù)庫的日常運維,包括連接狀態(tài)檢查、慢查詢分析以及基礎參數(shù)調優(yōu)等工作。
5.協(xié)助對Kubernetes集群的管理維護,能夠處理常見的K8s異常,并根據(jù)需求對資源配額進行合理調度。
任職要求:
1. 具備 2 年以上運維相關工作經(jīng)驗,有大數(shù)據(jù)領域或云計算領域運維從業(yè)經(jīng)歷者優(yōu)先;
2.熟悉大數(shù)據(jù)常見組件(如 Hadoop、Spark、HBase 等)的安裝部署與基礎運維邏輯;
3.具備基礎的腳本編寫能力(如 Shell、Python 等),能夠獨立完成巡檢、監(jiān)控類腳本開發(fā);
4.了解數(shù)據(jù)庫基礎運維知識,具備慢查詢分析、基礎參數(shù)調優(yōu)的實操經(jīng)驗;
5.熟悉 Kubernetes 集群基本架構,能夠處理容器編排、資源調度等常見問題;
6.具備較強的故障排查能力,能夠通過日志、監(jiān)控數(shù)據(jù)快速定位并解決問題;
7.具備良好的跨團隊溝通協(xié)作能力,能夠配合開發(fā)、測試團隊完成版本發(fā)布與迭代工作