SRE (Site Reliability Engineer)

Factor IT - Santiago (Hybrid)

Factor IT

Salary: $$$
Type: Tiempo completo

Tags: Docker Kubernetes Google Cloud Platform CI/CD

En Factor IT, líder en tecnología y soluciones de datos, buscamos un/a SRE para fortalecer la confiabilidad y el rendimiento de plataformas en entornos modernos de producción. Participarás en iniciativas de Data & Analytics, Transformación Digital e integración de IA en clientes regionales, con foco en operar sistemas distribuidos de alta disponibilidad. Trabajarás junto a equipos de ingeniería para diseñar, implementar y automatizar prácticas de observabilidad, despliegues confiables y gestión de infraestructura como código. Tu aporte permitirá mejorar la experiencia del usuario final, reducir incidentes y acelerar la entrega de cambios con calidad en el sector financiero y otros rubros.

This job offer is available on Get on Board.

Funciones

  • Garantizar la confiabilidad, disponibilidad y rendimiento de servicios en producción.
  • Implementar y mantener prácticas de Observabilidad con Grafana y Datadog (métricas, alertamiento y trazabilidad).
  • Administrar y optimizar sistemas en Google Cloud Platform (GCP), asegurando operaciones estables y escalables.
  • Construir y operar componentes con Docker y Kubernetes, velando por buenas prácticas de runtime y resiliencia.
  • Automatizar la infraestructura mediante Terraform, promoviendo entornos reproducibles y controlados.
  • Desarrollar y mejorar pipelines CI/CD para facilitar despliegues consistentes, versionables y seguros.
  • Participar en la definición de SLO/SLI, análisis de incidentes (post-mortems) y acciones preventivas.
  • Colaborar con equipos de desarrollo para reducir el “time to detect” y el “time to resolve” ante fallas.

Descripción

Buscamos un/a SRE (Site Reliability Engineer) para unirse a Factor IT y aportar al funcionamiento robusto de plataformas modernas. El/la candidato/a deberá combinar habilidades de observabilidad, cloud y automatización para asegurar que los servicios se mantengan estables incluso ante variaciones de demanda y cambios frecuentes.
Requisitos y experiencia esperada:
  • Observabilidad: experiencia práctica con Grafana y Datadog para monitoreo, alertas y diagnósticos.
  • Cloud: experiencia con Google Cloud Platform (GCP).
  • Contenedores y orquestación: conocimientos sólidos en Docker y Kubernetes.
  • Infraestructura como código: experiencia con Terraform para aprovisionar y gestionar recursos.
  • CI/CD: experiencia en pipelines y automatización de despliegues.
Como parte del rol, valoramos:
  • Capacidad para trabajar con enfoque en confiabilidad, trazabilidad de incidentes y mejora continua.
  • Mentalidad analítica para identificar causas raíz y proponer acciones preventivas.
  • Comunicación clara y colaboración transversal con equipos técnicos.
  • Autonomía para gestionar tareas operativas y sostener estándares de calidad en producción.
  • Orientación a resultados, priorización efectiva y cuidado por la experiencia del usuario final.
Deseable: experiencia en sistemas distribuidos, especialmente en contextos donde la latencia, la tolerancia a fallas y el escalamiento sean críticos.

Deseable

  • Experiencia en sistemas distribuidos.
Valoramos especialmente el conocimiento aplicado a la resiliencia, el manejo de fallas parciales, y el diseño/operación de componentes que deben escalar y mantenerse disponibles.

Beneficios

Ofrecemos una modalidad de trabajo híbrida desde Santiago, Chile, con flexibilidad horaria para un balance saludable entre la vida profesional y personal.
FactorIT proporciona un ambiente colaborativo y dinámico, con tecnologías de última generación que facilitan el crecimiento profesional constante y la innovación tecnológica.
Nuestro paquete salarial es competitivo y acorde a la experiencia y perfil, complementado por una cultura inclusiva que valora la diversidad, la creatividad y el trabajo en equipo.
Además, participarás en proyectos desafiantes con impacto real en la transformación tecnológica de la región, dentro de una organización que promueve la innovación y el desarrollo profesional continuo.

Source: GetOnBoard | Main Category: Other