Data Engineer

Codeable

Codeable

Salary: $$$
Type: Tiempo completo

Tags: Python Git BigQuery ETL

Codeable es una escuela de programación de alta calidad que invierte en sus estudiantes y los entrena como software developers altamente empleables. Durante 6 meses, nuestros estudiantes aprenden las habilidades más demandadas por la industria tecnológica, graduándose con la capacidad de generar valor en entornos de trabajo globales y altamente competitivos. A la fecha, Codeable ha graduado a más de 120 estudiantes en sus primeras 4 promociones, y estamos listos para escalar nuestra oferta inclusiva y graduar a más de 200 estudiantes durante el 2022.

Official job site: Get on Board.

Funciones

  • Diseñar, construir y mantener pipelines ETL/ELT utilizando Airflow, Prefect o Cloud Composer.
  • Desarrollar procesos de extracción de datos mediante Python: scripting, scraping automatizado (Playwright, Puppeteer o Selenium) y consumo de APIs.
  • Implementar y optimizar transformaciones sobre CSV/JSON y estructuras heterogéneas.
  • Administrar y optimizar datasets en Google BigQuery: creación de tablas, relaciones, vistas materializadas y performance tuning.
  • Trabajar con DataFrames en pandas o PySpark para manipulación y limpieza de datos.
  • Implementar automatización de tareas (cronjobs, DAGs, Cloud Functions).
  • Crear scripts de validación, depuración y normalización de datos.
  • Colaborar con equipos de Data Science / BI para habilitar análisis avanzados (incluyendo sentiment analysis y clasificación básica de texto).
  • Documentar la trazabilidad, linaje y estructura del flujo de datos.
  • Mantener buenas prácticas de control de versiones y despliegue con Git y CI/CD.

Descripción

Buscamos un/a Data Engineer con experiencia en el diseño, construcción y mantenimiento de pipelines de datos de alta calidad. Serás responsable de la extracción, transformación, carga y orquestación de datos provenientes de diversas fuentes (APIs, scraping, archivos, plataformas). Trabajarás en la automatización, optimización y documentación de procesos, proponiendo mejoras técnicas y asegurando estándares de calidad en todo el flujo de datos.

Requisitos deseables

  • Conocimiento de OAuth2, tokens, paginación y manejo de rate limits.
  • Familiaridad con NLP básico: sentiment analysis, clasificación de texto, transformers o NLTK/spaCy.
  • Conocimientos de R o Node.js para integraciones adicionales.

Nuestros Valores

  • Ponemos a las personas primero. Nos preocupamos, estamos abiertos y alentamos a todas las personas con las que trabajamos
  • Pensamos y actuamos con responsabilidad. Somos responsables de identificar los problemas y hacemos todo lo posible para ayudar a resolverlos
  • Mejoramos todos los días. Creemos que todos tenemos la capacidad de mejorar y estamos motivados a ayudar a todos a ser la mejor versión de sí mismos
  • Estamos comprometidos con la diversidad. Contribuimos a un mundo en el que podamos ser nosotros mismos, juntos
  • Estamos todos JUNTOS en esto. Somos una comunidad de estudiantes, emprendedores y tecnólogos unidos por la misma misión: cerrar la brecha entre el talento y las oportunidades en tecnología en Latinoamérica

Fully remote You can work from anywhere in the world.

Source: GetOnBoard | Main Category: Other