J&T Express

资深运维工程师(OnCall)

J&T Express  •  Shanghai, CN (Onsite)  •  5 months ago
Apply
AI can make mistakes so check important info. Chat history is never stored.

Job Description

资深运维工程师(OnCall)上海全职职位描述一、岗位概述
作为企业IT系统应急保障核心技术专家,负责7×24小时、Oncall团队技术赋能与应急体系优化,持续推动运维工作,支撑业务连续性与系统稳定性目标达成;
二、核心职责。
1、设计并迭代Oncall应急响应流程、故障分级标准与复盘机制,主导监控体系(Prometheus/Grafana等)深度优化,构建覆盖业务全链路的智能告警与预警模型;
2、负责故障案例复盘分享、实战演练组织,提升团队整体故障处置能力与技术水平;
3、推动运维自动化工具(Shell/Python/Ansible)与自愈能力落地,编写核心系统应急处置预案(DRP)并定期演练,沉淀《重大故障处置手册》与技术知识库;
4、与开发、架构、业务、安全团队建立常态化沟通机制,提前识别系统潜在风险(如架构瓶颈、容量不足等),推动风险整改与性能优化,参与核心系统架构评审;职位要求三、任职要求
1、本科及以上学历,计算机、软件工程等相关专业,,有互联网、电商、物流等行业背景者优先;
2、精通Linux/Unix系统内核级运维,深入掌握网络协议(TCP/IP/HTTP/HTTPS)、数据库(MySQL/Redis/MongoDB)、中间件(Nginx/Kafka/RabbitMQ)原理与调优,具备分布式系统问题排查能力;
3、熟练掌握容器化(Docker/Kubernetes)、云平台(AWS/Azure/阿里云/腾讯云)运维技术,能独立设计云原生环境下的应急保障方案;
4、具备(如大规模服务雪崩、数据丢失、网络攻击等),能在高压环境下快速决策,主导跨团队协作攻坚;
5、精通监控告警工具(Prometheus/Grafana/Zabbix/ELK),具备日志分析、指标建模能力,能编写自动化脚本(Shell/Python)实现故障自愈或效率提升;
6、具备优秀的技术视野与问题拆解能力,良好的沟通协调与团队管理意识,能接受轮班/夜班及节假日值班,对系统稳定性有极致追求。 投递
J&T Express

About J&T Express

J&T Express is a global logistics service provider with leading express delivery businesses in Southeast Asia and China, the largest and fastest-growing market in the world. Founded in 2015, J&T Express' network spans thirteen countries, including Indonesia, Vietnam, Malaysia, the Philippines, Thailand, Cambodia, Singapore, China, Saudi Arabia, the UAE, Mexico, Brazil and Egypt.

Industry
Transportation & Logistics
Company Size
1,001-5,000 employees
Headquarters
Unknown
Year Founded
2015
Social Media