Imagemaker

SRE -Híbrido - CL

Imagemaker  •  Republic of Chile (Remote)  •  3 hours ago
Apply
AI can make mistakes so check important info. Chat history is never stored.

Job Description

SRE -Híbrido - CL

Application Deadline: 30 June 2026

Department: Operations

Employment Type: Full Time

Location: Chile

Buscamos un Senior Site Reliability Engineer (SRE) con especialización técnica profunda en Apache Airflow y Google Kubernetes Engine (GKE) para asumir la responsabilidad del soporte especializado en entornos productivos críticos (PRD) y Consultoría.

El objetivo principal del rol es garantizar la estabilidad, rendimiento y observabilidad de la plataforma de orquestación, liderando el análisis de causa raíz (RCA) ante incidentes complejos, diseñando mejoras continuas en la infraestructura y transfiriendo conocimiento técnico a los equipos operativos.

Es una posición estratégica que combina la resolución avanzada de problemas de infraestructura en la nube con la definición de estándares operacionales para optimizar el procesamiento batch de la compañía.

Modalidad: Híbrido, 1 vez a la semana presencial.
Contrato indefinido desde el inicio.

Deseable inglés intermedio

Key Responsibilities

  • Soporte Especializado: Atender escalaciones complejas del ambiente productivo, diagnosticando y resolviendo fallas críticas en el scheduler de Airflow (heartbeats, deadlocks en metadatos, degradación de ejecutores) e infraestructura de Kubernetes (CrashLoopBackOff, saturación de recursos CPU/memoria y fallas de red).
  • Gestión de Incidentes y RCA: Realizar análisis profundo de causa raíz frente a comportamientos anómalos en DAGs (concurrencia, tareas colgadas, reintentos infinitos) y producir documentación técnica post-mortem para mitigar riesgos futuros.
  • Evolución y Mejora de la Plataforma: Diseñar y ejecutar propuestas de optimización para la estabilidad y performance, planificando upgrades de versiones de Airflow y componentes GKE con el mínimo impacto en el negocio.
  • Observabilidad Proactiva: Implementar estrategias de monitoreo avanzado a través de la definición de métricas clave, configuración de alertas tempranas y construcción de dashboards operacionales.
  • Gobernanza y Transferencia de Conocimiento: Definir estándares operacionales y buenas prácticas para la gestión de DAGs, manteniendo actualizados los runbooks técnicos y capacitando activamente a los equipos de soporte de Nivel 1 y Nivel 2.

Skills, Knowledge and Expertise

Must to have:

Experiencia como SRE / Plataformas:
Dominio profundo de la arquitectura e infraestructura de Apache Airflow (Open Source) y desarrollo sobre la plataforma.

Contenedores y Orquestación: Experiencia sólida operando clusters, pods y despliegues en Kubernetes mediante Docker y Helm

Nice to Have:

Cloud Computing:
Experiencia en la consola de Google Cloud Platform (GCP) y sus herramientas nativas (Cloud Logging, Monitoring, Artifact Registry, IAM, Cloud SQL).

Ecosistema Tecnológico: Conocimiento en arquitectura de microservicios, bases de datos (PostgreSQL), lenguajes de scripting (Python, Bash) y herramientas de observabilidad (Prometheus, Grafana, Stackdriver).


Beneficios

😉 Ser maker es cool: Tenemos muy buenos beneficios y muchas actividades para divertirnos!

🏖️ Don’t worry, be happy: 3 días libres al año adicionales a tus vacaciones.
✨ Permiso sin goce de sueldo para cumplir tus sueños.
⚖️ Programa de bienestar enfocado a equilibrar el trabajo y la vida personal.
🏥 Seguro Complementario 100% gratuito para Makers.
🤓 ¡Programas de formación, clases de inglés y mucho más!
🎂 Día libre para tu cumpleaños y medio día para los cumpleaños de tus hijos.
💰 Bonificaciones que dan respiros: Fiestas patrias, navidad, matrimonio/AUC, nacimiento/adopción de hijos, etc.
💳 Convenios y precios preferenciales con bancos.
👶🏻 3 Días adicionales para padres por nacimiento o adopción de hijo/a.
🐶 Convenio de seguro para tus mascotas!
🌿 Nuestra cultura es horizontal, de innovación, desafiante y sobre todo, se respira mucha buena onda!

En el marco de nuestro compromiso con la inclusión, la siguiente vacante está abierta en el marco de la ley 21.015.
Imagemaker

About Imagemaker

Imagemaker is a software development company that specializes in Tech Consulting, Staff Augmentation and Agile Teams, with a focus on the banking, financial services, insurance (BFSI), and retail sectors. With over 25 years of experience, we’ve earned the trust of global brands like Mastercard, Scotiabank, Metlife, Walmart, Santander, LATAM Airlines, and Cardif. Our commitment to quality and long-term partnership is rooted in our ability to deliver expert talent, drive innovation, and ensure execution at scale.

Our team of 500+ professionals operates across the USA, Mexico, Costa Rica, Colombia, Chile, and the EU, allowing us to support our clients through nearshore and hybrid delivery models. We go beyond staffing by providing a layer of Customer Success that includes Delivery Managers, Technical Managers, Scrum Masters, and Agile Coaches, ensuring visibility, compliance, and high-standard SLAs throughout the development lifecycle.

From AI and Machine Learning to backend engineering, digital experience, cloud infrastructure, and quality assurance, we bring a wide range of technical capabilities to help our clients succeed. We’re proud to retain top talent through our award-winning workplace culture, achieving higher-than-average retention rates and consistently delivering on our promise: to build agile, high-performing teams that solve complex challenges and create real business value.

Industry
IT & Software
Company Size
201-500 employees
Headquarters
Santiago, CL
Year Founded
1999
Social Media