Job Description
MaaS-SRE/DBA北京全职互联网 / 电子 / 网游职位描述【岗位职责】
1. 稳定性保障(核心):负责MySQL、Redis等核心存储组件的稳定性,建设全方位的监控告警体系(Prometheus/Grafana),实现故障的早发现、快止损,保障MaaS平台在高并发场景下的99.99%可用性。
2. 架构治理与演进: 主导数据库架构升级,包括读写分离、冷热分离、分库分表及异地多活(双活)容灾体系的建设。
3. 深度调优与质量管控: 建立标准化的SQL审核与发布流程,负责慢 SQL 治理、大表治理及数据库参数深度调优,解决数据库性能瓶颈。
4. 自动化平台建设: 基于SRE理念,开发数据库自动化运维平台(Python/Go),实现备份恢复、高可用切换、自动扩缩容及账号权限管理的自动化。
5. 应急响应与预案: 负责突发故障(如宕机、带宽拥塞)的应急响应,制定并定期演练标准化恢复预案(SOP),降低故障平均恢复时间(MTTR)。
6. 容量规划与成本管理: 结合业务增长模型进行容量预测与压测,优化资源利用率,制定降本增效策略。
【岗位要求】
1. 学历与经验: 本科及以上学历,计算机相关专业;3 年以上大规模互联网数据库管理(DBA)或 SRE 经验,有高并发、大流量系统保障经验者极佳。
2. 数据库精通: 精通 MySQL 原理(InnoDB 引擎、事务锁机制、索引优化、主从复制),精通 Redis(集群模式、缓存一致性、热 Key/大 Key 处理);熟悉其高可用架构(MHA/Orchestrator/Sentinel/Cluster)。
3. SRE 与编程能力: 具备良好的编码能力,熟练掌握 Go/Python/Java 中至少一种语言(不仅仅是 Shell),有数据库中间件开发或自动化运维平台开发经验。
4. 系统与网络: 深入理解 Linux 操作系统原理(IO、内存管理、网络协议栈),具备极强的线上故障排查能力(熟练使用 perf, tcpdump, strace 等工具)。
5. 云原生与架构: 熟悉主流公有云(腾讯云/阿里云/AWS)数据库产品特性;了解 Kubernetes (K8s) 生态及数据库容器化技术者优先。
6. 软素质: 具备极强的责任心和抗压能力(能接受 On-call),良好的沟通协作能力;具备“数据安全红线”意识。
【加分项】
1. 有TiDB等分布式数据库(NewSQL)大规模生产环境落地经验。
2. 参与过跨地域双活/多活数据库架构设计与实施。 职位要求-- 投递