Python Backend Engineer — Career Path 2026

01

Nivel 1

Trainee

Cimentación de la lógica computacional. El foco es entender cómo Python modela la realidad en memoria, y cómo los sistemas se comunican entre sí. Sin atajos: primero los fundamentos.

Área	Tema Específico	Objetivo	Dif.	Recursos	Proyecto / Validación	Criterio de Éxito
Sintaxis Core	Variables, tipos mutables vs inmutables int, float, str, bool, None — identity vs equality	Entender cómo Python gestiona objetos en memoria y cuándo dos variables apuntan al mismo objeto.	Fácil	Real Python: Variables Harvard CS50P	Explicar la diferencia entre `is` y `==` con ejemplos de listas mutadas en funciones.	Predecir correctamente el output de 10 snippets con referencias compartidas.
Sintaxis Core	Control de flujo completo if/elif/else, for/while, break/continue, match-case (3.10+)	Escribir lógica condicional expresiva evitando anidamiento excesivo (early returns, guard clauses).	Fácil	Real Python: Conditionals PEP 634 — match/case	Refactorizar 5 funciones con if-else anidados usando match-case y early returns.	Código sin más de 2 niveles de indentación en la lógica principal.
Sintaxis Core	Funciones: args, args, *kwargs, closures Scope LEGB, funciones como ciudadanos de primera clase	Comprender cómo Python resuelve nombres y cómo las funciones pueden capturar estado externo.	Fácil	Real Python: LEGB Scope	Implementar un decorador de logging sin librerías que registre entrada/salida de cualquier función.	Decorador funciona con funciones que tienen cualquier firma (args/*kwargs).
Sintaxis Core	Comprensiones y expresiones generadoras List/dict/set comprehensions, generator expressions, lazy evaluation	Transformar bucles imperativos en expresiones declarativas eficientes en memoria.	Fácil	Real Python: Comprehensions	Procesar un CSV de 500k filas con generadores sin cargarlo completo en memoria — medir el delta de RAM.	Uuso de memoria constante O(1) independientemente del tamaño del archivo.
Estructuras de Datos	list, dict, set, tuple — cuándo usar cada uno Complejidad O(n) vs O(1), acceso por índice vs hash, inmutabilidad	Seleccionar la estructura correcta basándose en el patrón de acceso, no en costumbre.	Fácil	Python Time Complexity Wiki LeetCode Easy (Hashing)	Resolver 10 problemas de LeetCode Easy usando la estructura óptima y justificar la elección con Big-O.	Todas las soluciones con complejidad temporal óptima para el problema dado.
Estructuras de Datos	collections: deque, Counter, defaultdict, OrderedDict Cuándo superar las estructuras built-in	Conocer la biblioteca estándar para evitar reinventar la rueda en problemas comunes de procesamiento.	Fácil	Python docs: collections	Analizar logs de acceso a un servidor y calcular top-10 IPs, paths más frecuentes y sliding window de errores.	Uso Counter y deque; no usa sorted() innecesariamente sobre dicts.
OOP	Clases, instancias, métodos, propiedades __init__, self, @property, @classmethod, @staticmethod	Modelar entidades del dominio con encapsulamiento adecuado y acceso controlado al estado interno.	Medio	Real Python: OOP EPAM Campus Python	Diseñar un sistema de facturación con clases `Product`, `Cart`, `Invoice` con reglas de negocio encapsuladas.	Estado privado con propiedades; lógica de negocio no expuesta como atributos públicos.
OOP	Herencia, super(), MRO, composición vs herencia Method Resolution Order, mixins, evitar herencia profunda	Entender cuándo la herencia genera acoplamiento y preferir composición para extensibilidad.	Medio	Real Python: super()	Refactorizar una jerarquía de 4 niveles usando mixins y composición. Medir reducción de acoplamiento.	Sin más de 2 niveles de herencia; comportamiento compartido como mixins o composición.
OOP	Dunder methods: __str__, __repr__, __eq__, __hash__, __len__ Protocolo de Python, objetos comparables, hashables y serializables	Hacer que objetos del dominio se integren naturalmente con estructuras de datos nativas de Python.	Medio	Python Data Model Docs	Clase `Money(amount, currency)` que soporte comparación, suma, uso en sets y repr clara para logs.	Objetos usables en `set()`, comparables con `==`, y con `repr()` reproducible.
Manejo de Errores	try/except/else/finally, excepciones personalizadas Jerarquía de excepciones, never catch-all, logging de errores	Gestionar fallos de forma explícita y construir excepciones de dominio que comuniquen contexto de negocio.	Fácil	Real Python: Exceptions	Librería CLI de procesamiento de archivos con excepciones propias: `FileFormatError`, `DataValidationError`.	Sin `except Exception` genérico; cada excepción captura sólo lo que puede manejar.
I/O y Archivos	File I/O, pathlib, csv, json modules Context managers, encoding, modos de apertura	Leer y escribir datos estructurados de forma robusta y sin fugas de recursos.	Fácil	Python docs: pathlib	ETL script: leer CSVs de múltiples carpetas, transformar y exportar JSON con manejo de encoding UTF-8/Latin-1.	Usa `pathlib.Path` (no `os.path`); cierra archivos siempre con context managers.
HTTP y APIs	Protocolo HTTP: métodos, status codes, headers GET/POST/PUT/PATCH/DELETE, 2xx/4xx/5xx, Content-Type, Auth headers	Entender la comunicación cliente-servidor para consumir y eventualmente construir APIs correctamente.	Fácil	MDN HTTP Docs HTTPBin (sandbox)	Cliente CLI que consuma la API de MercadoLibre: buscar productos, filtrar por precio, exportar top 20 en JSON.	Manejo explícito de 429 (rate limit) con retry; nunca ignorar el status code de la respuesta.
HTTP y APIs	Librería requests: sesiones, timeouts, autenticación Session reutilizable, headers por defecto, manejo de errores de red	Construir clientes HTTP robustos que no fallen silenciosamente ante errores de red.	Fácil	Requests Official Docs	Wrapper sobre una API externa con retry automático (exponential backoff) y timeout configurable.	No usa `requests.get()` global; usa `Session()`; siempre especifica timeout.
Git	Git workflow: branches, commits semánticos, merge vs rebase Conventional Commits, feature branches, resolución de conflictos	Colaborar en equipos mediante un historial de cambios limpio, rastreable y reversible.	Fácil	Learn Git Branching Conventional Commits	Mantener un proyecto de 4 semanas con +20 commits semánticos, 3 feature branches y 1 conflicto resuelto documentado.	Historial lineal legible; commits atómicos con mensaje tipo `feat(auth): add JWT validation`.
Calidad de Código	PEP 8, type hints, linting con ruff/flake8 Anotaciones de tipos, mypy básico, docstrings estilo Google	Escribir código que un colaborador entienda sin explicación verbal y que las herramientas puedan analizar.	Fácil	Ruff Linter mypy Docs	Pasar `ruff check .` y `mypy .` sin errores en un proyecto de 500+ líneas con type hints completos.	0 errores de linting; todas las funciones públicas con type hints y docstring.

02

Nivel 2

Junior Developer

De scripts a servicios. El Junior construye APIs funcionales con persistencia, validación y pruebas. La fiabilidad es el sello distintivo: código que no sólo funciona, sino que demuestra que funciona.

Área	Tema Específico	Objetivo	Dif.	Recursos	Proyecto / Validación	Criterio de Éxito
FastAPI	Routers, path/query params, request body APIRouter, response_model, status_code, tags para OpenAPI	Estructurar una API en módulos con separación de responsabilidades desde el primer commit.	Medio	FastAPI: Bigger Applications	API de e-commerce con módulos `products`, `orders`, `users` — cada uno con su propio router y OpenAPI tags.	Swagger UI completo y navegable; sin lógica de negocio en los routers directamente.
FastAPI	Dependency Injection: Depends(), lifespan events Gestión del ciclo de vida de conexiones, DB session per request	Manejar recursos compartidos (DB connections, HTTP clients) de forma eficiente y sin fugas.	Medio	FastAPI: Dependencies TestDriven.io FastAPI	Dependency que provee sesión de DB por request y la cierra al terminar; cliente HTTP reutilizado via lifespan.	Sin session leaks bajo carga; `async with lifespan(app)` para inicialización global.
Pydantic v2	BaseModel, Field, validators, model_config @field_validator, @model_validator, alias, serialización	Garantizar integridad de datos en el borde de la API con validaciones expresivas y mensajes de error útiles.	Medio	Pydantic v2 Docs	Esquemas para un sistema de pagos: `CreatePaymentRequest` con validación cruzada de moneda/monto/tarjeta.	Errores de validación con `loc` y `msg` claros; sin validación manual en los endpoints.
Pydantic v2	Pydantic Settings: configuración desde env vars pydantic-settings, .env files, SecretStr para secretos	Separar configuración del código para deploys seguros en múltiples entornos (12-factor app).	Fácil	pydantic-settings Docs	Configuración tipada que carga de .env en dev y de variables de entorno en producción sin cambiar código.	Cero strings hardcodeadas para config; secrets manejados como `SecretStr`.
PostgreSQL	DDL: CREATE TABLE, constraints, índices básicos PRIMARY KEY, FOREIGN KEY, UNIQUE, NOT NULL, B-tree index	Diseñar esquemas relacionales que garanticen integridad de datos a nivel de base de datos, no solo aplicación.	Medio	PostgreSQL Tutorial Use The Index, Luke	Esquema para sistema de e-commerce en 3NF: usuarios, productos, categorías, órdenes, ítems de orden.	Constraints a nivel DB; FK con ON DELETE CASCADE donde sea apropiado; índices en columnas de búsqueda.
PostgreSQL	DML: JOINs, GROUP BY, window functions, EXPLAIN INNER/LEFT JOIN, aggregaciones, ROW_NUMBER, EXPLAIN ANALYZE	Escribir consultas eficientes y diagnosticar el plan de ejecución antes de llegar a producción.	Medio	SQLBolt explain.depesz.com	Report de top 10 productos más vendidos por categoría en el último mes con window function y tiempo < 200ms.	EXPLAIN ANALYZE sin Seq Scan en tablas > 10k filas; query < 200ms en dataset de prueba.
SQLAlchemy 2.0	Modelos declarativos, relaciones, AsyncSession Mapped[], relationship(), lazy/eager loading, selectin	Mapear el dominio a tablas relacionales evitando el N+1 query problem desde el diseño.	Medio	SQLAlchemy 2.0 Docs	ORM completo para el e-commerce con relaciones y carga eficiente de datos: 0 queries N+1 verificados con logging SQL.	Carga con `selectin` o `joined` en relaciones; sin `lazy="select"` en endpoints de listado.
SQLAlchemy 2.0	Alembic: migraciones, autogenerate, downgrade env.py, revision heads, data migrations, multi-head	Evolucionar el esquema de DB sin downtime y con capacidad de rollback documentada.	Medio	Alembic Official Docs	Ejecutar 5 migraciones incluyendo una con data migration; downgrade exitoso sin pérdida de datos en todos los casos.	Cada migración probada con `upgrade` + `downgrade` en entorno limpio antes de merge.
Testing	Pytest: fixtures, parametrize, conftest.py Setup/teardown, scope de fixtures, factories con faker	Construir una suite de pruebas que documente el comportamiento esperado y detecte regresiones automáticamente.	Medio	Pytest Official Docs TestDriven.io FastAPI Testing	Suite con +50 tests para la API de e-commerce; cobertura > 80%; factories de datos con Faker para datos realistas.	Tests aislados entre sí; sin orden de ejecución implícito; cobertura verificada con `pytest-cov`.
Testing	Mocking: unittest.mock, pytest-mock, AsyncMock patch(), MagicMock, side_effect, httpx mock para APIs externas	Aislar unidades de código de sus dependencias externas para probarlas de forma determinista y rápida.	Medio	Python docs: unittest.mock HTTPX Mock Transports	Tests unitarios para un servicio de notificaciones que mockea el cliente SMTP y la API de SMS; sin llamadas reales.	Tests ejecutan en < 2s en total; 0 llamadas a servicios externos en la suite de unit tests.
Docker	Dockerfile: multi-stage builds, capas, .dockerignore Imagen mínima, non-root user, build args vs env vars	Empaquetar aplicaciones en imágenes reproducibles, seguras y optimizadas para el registry.	Medio	Docker: Multi-stage builds Snyk: Python Docker Best Practices	Imagen multi-stage para FastAPI: builder + runtime. Imagen final < 150MB, user no-root, sin secrets en capas.	Audit de seguridad con `docker scout` sin vulnerabilidades críticas; imagen < 150MB.
Docker	Docker Compose: servicios, volúmenes, redes, healthchecks depends_on con condition, redes bridge, bind mounts vs volumes	Levantar un stack local completo (API + DB + cache) reproducible para cualquier miembro del equipo en un comando.	Medio	Docker Compose Docs	Compose con FastAPI, PostgreSQL, Redis y pgAdmin; healthchecks en todos los servicios; setup en < 2 min desde cero.	API sólo arranca cuando DB pasa healthcheck; datos de DB persisten entre reinicios.
Auth	JWT: generación, validación, refresh tokens python-jose / PyJWT, payload, expiry, firma asimétrica RS256	Implementar autenticación stateless sin comprometer la seguridad del acceso a recursos protegidos.	Medio	FastAPI: OAuth2 + JWT JWT.io Debugger	Sistema auth completo: registro, login, refresh token rotation, logout con token revocation en Redis.	Access token: 15min TTL; refresh token: httpOnly cookie; revocación funcional sin DB extra.
Logging	Logging estructurado con structlog o logging module JSON logs, correlation ID por request, niveles y handlers	Producir logs que un sistema de observabilidad pueda indexar, buscar y correlacionar con contexto de negocio.	Fácil	structlog Docs	Middleware FastAPI que inyecta `request_id` en cada log del request; logs en JSON en producción, human-readable en dev.	Todos los logs de un request comparten el mismo `request_id` correlacionable en producción.

03

Nivel 3

Semi-Senior (SSR)

Autonomía técnica y visión de sistemas. El SSR diseña para la concurrencia real, desacopla responsabilidades con patrones arquitectónicos y automatiza la entrega de software end-to-end.

Área	Tema Específico	Objetivo	Dif.	Recursos	Proyecto / Validación	Criterio de Éxito
Async / Concurrencia	asyncio: event loop, coroutines, tasks, gather asyncio.create_task(), asyncio.gather(), shield(), timeout()	Diseñar servicios que manejen miles de conexiones I/O concurrentes sin bloquear el event loop.	Difícil	Python asyncio Docs Real Python: Async IO	Agregador de noticias asíncrono que consulte 100 fuentes RSS simultáneamente con timeout por fuente y sem de concurrencia.	Tiempo total ≈ max(fuente más lenta) + overhead; Semaphore(20) para no saturar red.
Async / Concurrencia	asyncio avanzado: Semaphore, Lock, Queue, async generators Backpressure, control de concurrencia, streaming responses	Controlar el flujo de trabajo concurrente para evitar saturación de recursos downstream.	Difícil	asyncio Sync Primitives	Pipeline de procesamiento de imágenes con Queue para limitar workers concurrentes y backpressure controlado.	Memoria estable bajo carga sostenida; sin deadlocks ni starvation bajo load test de 60s.
Async / Concurrencia	httpx async client: connection pooling, retries, timeouts AsyncClient reutilizable, backoff exponencial, circuit breaker básico	Construir clientes HTTP asíncronos para comunicación inter-servicio resilientes ante fallos transitorios.	Difícil	HTTPX Docs Tenacity (retry)	Clase `ServiceClient` genérica con retry exponencial configurable, timeout adaptativo y circuit breaker con tenacity.	Falla rápido (fail-fast) cuando el servicio upstream está caído; no cuelga el event loop.
Background Jobs	Celery: task definition, routing, retry strategies @shared_task, bind=True, max_retries, eta, countdown	Desacoplar tareas pesadas del ciclo HTTP para mantener tiempos de respuesta de la API por debajo de 200ms.	Difícil	Celery Project Docs	Sistema de generación de reportes PDF en segundo plano: task con retry, notificación por webhook al completar.	Endpoint retorna en < 50ms; reintento automático con backoff ante fallo; 0 tareas huérfanas.
Background Jobs	Celery Beat: tareas periódicas, monitoreo con Flower crontab schedule, Flower dashboard, worker concurrency	Orquestar trabajos programados y tener visibilidad operativa del estado de las colas en tiempo real.	Difícil	Celery Beat Docs Flower Docs	Job nocturno de reconciliación de inventario con alertas si falla; métricas de throughput visibles en Flower.	Alert en Slack si la tarea no se ejecuta en su ventana esperada; tasa de éxito > 99%.
Redis Avanzado	Redis: pub/sub, streams, sorted sets, TTL patterns Leaderboards, rate limiting, distributed locks, XADD/XREAD	Usar Redis como plataforma de mensajería y coordinación, más allá del simple caching de key-value.	Medio	Redis Official Docs Redis University	Rate limiter por usuario con sliding window counter en Redis; distributed lock para evitar procesamiento duplicado.	Rate limit exacto bajo concurrencia alta (100 req simultáneos); lock libera siempre, incluso ante crash.
Arquitectura	Repository Pattern y Unit of Work Abstracción de persistencia, interfaces, inyección de dependencias	Separar la lógica de negocio pura de los detalles de almacenamiento para hacerla testeable en aislamiento.	Difícil	Architecture Patterns with Python	Refactorizar un servicio para que su lógica de dominio se pruebe sin base de datos (in-memory repository).	Tests de dominio corren en < 1s sin Docker; intercambiar SQL ↔ MongoDB sin tocar la lógica.
Arquitectura	Principios SOLID en Python: DI, OCP, SRP Protocol typing, ABC, inversión de dependencias con inyección	Escribir módulos que sean extensibles sin modificación y fáciles de sustituir en pruebas o en evolución del sistema.	Difícil	Real Python: SOLID	Diseñar un sistema de notificaciones que soporte Email, SMS y WhatsApp sin modificar el código del servicio core.	Añadir un nuevo canal requiere sólo una nueva clase; 0 cambios en el servicio existente.
Arquitectura	Event-Driven: RabbitMQ o Kafka básico Producers, consumers, dead letter queue, idempotencia de mensajes	Desacoplar microservicios mediante eventos para lograr consistencia eventual y tolerancia a fallos parciales.	Difícil	RabbitMQ Tutorials Kafka Documentation	Sistema de pedidos donde `orders-service` publica eventos y `inventory-service` los consume idempotentemente.	Mensaje duplicado procesado una sola vez (idempotency key); DLQ configurable con alertas.
CI/CD	GitHub Actions: pipelines, matrix, secrets management Workflows on push/PR, test + lint + build + deploy stages	Automatizar el ciclo completo de validación y despliegue para eliminar errores manuales y acelerar el delivery.	Medio	GitHub Actions Docs	Pipeline que ejecuta tests, linting, análisis de seguridad (Trivy) y despliega a staging automáticamente en cada PR aprobado.	PR sin tests verdes no puede hacer merge; deploy automático sólo si todas las checks pasan.
Cloud / AWS	AWS Core: EC2, RDS, S3, ElastiCache, SQS, IAM Roles IAM con least privilege, VPC básica, grupos de seguridad	Desplegar y conectar los componentes de una aplicación backend en AWS con principios de seguridad mínima.	Medio	AWS Developer Associate	Desplegar el stack completo (API en EC2, DB en RDS, caché en ElastiCache) con IAM roles sin claves de acceso hardcodeadas.	Sin credenciales en código o env vars de instancia; acceso a S3 via IAM role; 0 servicios expuestos públicamente sin necesidad.
Cloud / AWS	Terraform básico: providers, resources, variables, state terraform plan/apply, remote state en S3, módulos simples	Gestionar infraestructura como código para que los entornos sean reproducibles, versionados y auditables.	Medio	HashiCorp Terraform Tutorials	Infraestructura completa del stack en Terraform: VPC, subnets, RDS, ElastiCache, EC2 con user_data para la API.	`terraform destroy` + `terraform apply` recrea el stack idéntico en < 10 minutos.
NoSQL / Cache	Estrategias de caché: cache-aside, write-through, invalidación Cache stampede prevention, TTL vs event-based invalidation	Reducir latencia y carga en DB aplicando la estrategia de caché apropiada para cada patrón de lectura/escritura.	Medio	Caching Strategies Guide	Capa de caché para la API de productos: reducción medible de latencia P95 en 60%+ para rutas populares bajo load test.	Cache hit ratio > 80% en escenario realista; invalidación correcta al actualizar producto.
NoSQL / Cache	MongoDB: document modeling, aggregation pipeline Embedded vs referenced, índices compuestos, $lookup, $unwind	Modelar datos no estructurados o con esquema variable eligiendo entre embedding y referencias basándose en patrones de acceso.	Medio	MongoDB Official Docs MongoDB University	Modelo de catálogo de productos con atributos variables por categoría; aggregation para analytics de ventas por región.	Justificación documentada para embedding vs reference en cada relación; pipeline sin $lookup innecesario.
Load Testing	Locust o k6: escenarios de carga, ramp-up, análisis Virtual users, throughput, P50/P95/P99 latency, bottleneck ID	Identificar cuellos de botella antes de producción mediante pruebas de carga representativas del tráfico esperado.	Medio	Locust Docs k6 Docs	Escenario de 500 usuarios simultáneos sobre la API; identificar y solucionar el cuello de botella principal; re-test.	P95 latency < 500ms bajo 500 usuarios; bottleneck identificado con evidencia y solucionado.

04

Nivel 4

Senior Engineer

Arquitecto de resiliencia. El Senior diseña sistemas que sobreviven fallos parciales, instrumenta la observabilidad desde el día uno, y eleva el nivel técnico del equipo a través de decisiones documentadas.

Área	Tema Específico	Objetivo	Dif.	Recursos	Proyecto / Validación	Criterio de Éxito
System Design	CAP Theorem, consistencia eventual, PACELC CP vs AP trade-offs, read-your-writes, monotonic reads, linearizability	Tomar decisiones arquitectónicas informadas sobre modelos de consistencia según los requisitos de negocio concretos.	Experto	Designing Data-Intensive Apps (Kleppmann)	Diseñar el sistema de inventario de MercadoLibre: justificar si priorizar disponibilidad o consistencia en cada operación.	Documento ADR con análisis de trade-offs para las 3 operaciones críticas del sistema.
System Design	Sharding, particionamiento y replicación de bases de datos Horizontal sharding, consistent hashing, read replicas, replication lag	Escalar la capa de persistencia más allá de una instancia única sin sacrificar la consistencia de datos críticos.	Experto	System Design Interview — Alex Xu	Diseño de un sistema de URL shortener a 100M URLs/día con sharding por hash de alias y replicación geográfica.	Diagrama con estrategia de sharding, análisis de hot-spots y plan de rebalanceo.
System Design	API Gateway, BFF, gRPC inter-service Protocol Buffers, streaming bidireccional, service mesh básico	Diseñar la capa de comunicación entre microservicios eligiendo el protocolo óptimo para cada contrato.	Experto	gRPC Python Docs Microservices Patterns: API Gateway	Comunicación entre `orders` y `payments` via gRPC con streaming; API Gateway en Kong o Traefik en el borde.	Latencia inter-servicio < 5ms en red local; proto contracts versionados con backwards compatibility.
Performance	Python 3.14 free-threading (no-GIL) para CPU-bound threading module sin GIL, shared state safety, benchmarking paralelo	Explotar paralelismo real en tareas CPU-intensivas que antes requerían multiprocessing o extensiones en C.	Experto	Python 3.14 free-threading guide What's New in Python 3.14	Motor de scoring de recomendaciones: comparar multiprocessing vs free-threading en Python 3.14 con 8 cores. Documentar speedup.	Speedup demostrado ≥ 3x vs single-thread en tarea CPU-bound; análisis de correctitud thread-safe.
Performance	Profiling: py-spy, cProfile, memory-profiler, flamegraphs Sampling vs instrumenting profilers, heap profiling, call stack analysis	Localizar cuellos de botella con evidencia cuantitativa antes de optimizar, evitando premature optimization.	Experto	py-spy GitHub Python Speed: Profiling Tools	Identificar y solucionar los 3 hotspots principales de una API con flamegraph; documentar mejora con benchmarks antes/después.	Reducción de CPU time ≥ 40% en el endpoint más costoso con cambios justificados por flamegraph.
Performance	Database query optimization: EXPLAIN ANALYZE, índices, pgBouncer Connection pooling, prepared statements, partial indexes, BRIN vs B-tree	Optimizar la capa de base de datos para soportar carga de producción sin escalar hardware innecesariamente.	Experto	Use The Index, Luke!pgBouncer Docs	Reducir tiempo de query más lenta de una API de analytics de 2s a < 200ms documentando cada cambio con EXPLAIN ANALYZE.	Evidencia de EXPLAIN ANALYZE antes/después; sin Seq Scans en tablas > 100k filas.
Observabilidad	OpenTelemetry: traces, métricas y logs correlacionados Spans, baggage, context propagation, OTLP exporter	Instrumentar un ecosistema de microservicios para que cualquier petición sea rastreable de extremo a extremo en segundos.	Difícil	OTel Python Docs Honeycomb Whitepapers	3 microservicios con OTel auto + manual instrumentation; traces completas en Jaeger; correlación trace-log-metric por request_id.	Dada una petición fallida, identificar el servicio y línea causante en < 2 minutos usando sólo la UI de observabilidad.
Observabilidad	Prometheus + Grafana: dashboards, alertas, SLO/SLA RED method (Rate, Errors, Duration), SLO burn rate alerts	Definir y monitorear Service Level Objectives que reflejen la experiencia real del usuario, no solo que el proceso está vivo.	Difícil	Prometheus Docs Grafana Tutorials	Dashboard con métricas RED para cada servicio; alerta de SLO burn rate que dispara antes de consumir el budget de error.	Alert dispara cuando el error rate consume el 5% del error budget en 1 hora; 0 false positives en 48hs.
Seguridad	OAuth2 / OIDC: Authorization Code Flow, PKCE, token introspection Keycloak o Auth0, scopes, claims, refresh token rotation	Integrar autenticación delegada con un IdP externo siguiendo los flujos estándar de la industria sin implementar auth casero.	Difícil	OAuth 2.0 Simplified Keycloak Docs	API protegida con Keycloak: PKCE flow para SPA, client credentials para M2M, token introspection en el API Gateway.	Tokens de acceso no almacenados en localStorage; refresh rotation funcional; revocación inmediata al logout.
Seguridad	RBAC/ABAC y OWASP Top 10 para APIs Injection, broken object-level auth, SSRF, mass assignment, rate limiting	Diseñar sistemas de control de acceso granular y blindar la API contra los vectores de ataque más comunes.	Difícil	OWASP API Security Top 10 Snyk Python Security Guide	Audit de seguridad propio sobre la API: identificar y corregir al menos 3 de las OWASP Top 10; reporte con evidencia.	Scan con Snyk + checklist manual OWASP sin vulnerabilidades críticas o altas sin resolver.
Seguridad	Dependency security: dependabot, pip-audit, SBOM CVE scanning, pinning de versiones, Software Bill of Materials	Gestionar la superficie de ataque de la cadena de suministro de dependencias de forma continua y automatizada.	Difícil	pip-audit GitHub Dependabot	Pipeline con pip-audit en CI que bloquea merge si hay CVE crítica; SBOM generado en cada release.	0 CVEs críticas sin PR de remediación en < 24hs; SBOM disponible en el registry de artefactos.
Resiliencia	Circuit Breaker, Bulkhead, Retry con backoff tenacity, pybreaker, fallback strategies, chaos engineering básico	Diseñar servicios que degradan graciosamente ante fallos parciales en lugar de fallar en cascada.	Difícil	Tenacity Docs pybreaker	Introducir caos (latencia alta, errores aleatorios) en un servicio dependiente y verificar que el sistema principal no cascadea.	Servicio degradado retorna respuesta de fallback en < 500ms; upstream fallo no se propaga al cliente.
Kubernetes	Pods, Deployments, Services, ConfigMaps, Secrets Rolling update, health probes (liveness/readiness/startup), HPA	Desplegar y escalar aplicaciones en Kubernetes con zero-downtime deployments y autoescalado basado en métricas reales.	Difícil	Kubernetes Docs learnk8s.io	Deploy de la API en k8s local (minikube): rolling update sin downtime, HPA que escala entre 2-10 pods bajo carga.	0 requests fallidos durante rolling update; HPA activa en < 60s cuando CPU > 70%.
Liderazgo Técnico	Architectural Decision Records (ADR) y RFC process Formato ADR (context/decision/consequences), revisión por pares técnicos	Documentar decisiones arquitectónicas con su contexto y consecuencias para evitar repetir debates en el futuro.	Medio	ADR GitHub (Nygard)The Staff Engineer's Path	Escribir 3 ADRs para decisiones técnicas reales del equipo; facilitar el proceso de revisión y consenso hasta aprobación.	ADRs con alternativas consideradas, decisión con justificación y consecuencias positivas/negativas explícitas.

05

Nivel 5

Staff / Principal Engineer

Influencia multiplicadora. El Staff Engineer no mide su impacto en líneas de código sino en la velocidad de innovación de toda la organización. IA agentica, plataformas internas y estrategia multi-cloud.

Área	Tema Específico	Objetivo	Dif.	Recursos	Proyecto / Validación	Criterio de Éxito
IA Agentica	LangGraph: state machines, nodos, edges condicionales StateGraph, interrupt_before, human-in-the-loop, streaming events	Orquestar flujos de trabajo autónomos multi-agente con control de estado explícito y capacidad de intervención humana.	Experto	LangGraph Docs LangGraph Tutorials	Agente de customer support que consulta DBs, ejecuta scripts de compensación y escala a humano con contexto completo.	Tasa de resolución autónoma > 70%; escalado a humano con traza completa de lo que intentó el agente.
IA Agentica	PydanticAI: structured tool calling, type-safe agents Agent, Tool, RunContext, structured outputs con Pydantic models	Construir agentes de IA con outputs estructurados y tipados que se integren limpiamente en backends Python existentes.	Experto	PydanticAI Docs Best AI Engine 2026 — Softlandia	Agente de análisis financiero que extrae datos de DBs, genera reportes tipados en Pydantic y decide acciones de portfolio.	0 parsing errors de outputs del LLM; outputs validados con Pydantic en 100% de las ejecuciones.
IA Agentica	RAG Systems: vector DBs, chunking, reranking pgvector, Qdrant, embedding models, semantic search, HyDE	Construir sistemas de retrieval que permitan a los LLMs razonar sobre bases de conocimiento privadas de la empresa.	Experto	Qdrant Docs LangChain RAG Concepts	RAG sobre documentación técnica interna: precision@10 > 85%; latencia < 2s; evaluación automatizada con RAGAS.	Benchmark con RAGAS: faithfulness > 0.85, answer relevancy > 0.80 en dataset de evaluación de 100 preguntas.
Platform Engineering	Internal Developer Platform (IDP): diseño y adopción Golden paths, Backstage, self-service provisioning, paved roads	Crear abstracciones que permitan a los equipos de producto crear nuevos servicios con seguridad y observabilidad nativa desde el minuto uno.	Experto	platformengineering.org Backstage Docs	Template de microservicio en Backstage que provisiona: repo, CI/CD, monitoring, secrets, DB y service mesh en < 5 minutos.	Tiempo de creación de nuevo servicio: de días a < 10 minutos; adopción > 80% del engineering team.
Platform Engineering	Kubernetes Avanzado: KEDA, Operators, service mesh (Istio) Event-driven autoscaling, CRDs, traffic management, mTLS entre servicios	Diseñar la plataforma de cómputo para que los equipos escalen automáticamente basados en señales de negocio, no solo CPU.	Experto	KEDA Docs Istio Docs	KEDA scaling basado en longitud de cola SQS; Istio con mTLS automático entre todos los servicios; canary deployment para releases.	Scaling reactivo a eventos de negocio en < 30s; 100% de tráfico inter-servicio con mTLS verificado.
Engineering Metrics	DORA Metrics: Deployment Frequency, Lead Time, MTTR, CFR Measurement instrumentation, trend analysis, benchmark vs industria	Cuantificar la capacidad de entrega del equipo con métricas objetivas para identificar bloqueos sistémicos y priorizar mejoras.	Experto	DORA Research Program Swarmia: DORA Metrics	Dashboard automatizado con DORA metrics desde GitHub + PagerDuty; tendencias de 90 días; actionable insights por squad.	Equipo clasificado en tier "High" DORA; cada métrica con objetivo SMART y dueño asignado.
Engineering Metrics	Developer Experience (DevEx): SPACE framework, feedback loops Satisfaction, Performance, Activity, Communication, Efficiency	Diseñar el entorno de desarrollo para que los ingenieros puedan entrar en estado de flujo consistentemente sin fricción tooling.	Experto	SPACE Framework — ACM Queue GitHub Engineering Fundamentals	Survey trimestral de DevEx con SPACE framework; roadmap de mejoras priorizado; métricas antes/después de cada iniciativa.	Mejora estadísticamente significativa en satisfacción del developer después de 2 ciclos de mejora medidos.
Estrategia Técnica	Tech Debt Strategy: ADR repository, cuantificación, roadmap Debt ledger, interest rate calculation, kill-by date, refactor sprints	Gestionar la deuda técnica como un activo financiero: cuantificarla, priorizarla con el negocio y planificar su amortización.	Experto	Architect Elevator: Tech Debt ADR Templates (GitHub)	Inventario de deuda técnica valorizado en "engineering days"; roadmap de 2 años con ROI estimado por ítem; aprobado por CTO.	Deuda priorizada por impacto en DORA metrics; cada item con fecha de resolución y responsable nombrado.
Estrategia Técnica	Engineering roadmaps: OKR alignment, capacity planning Technical strategy document, build vs buy framework, RFC aprobación	Traducir la estrategia de negocio en inversiones técnicas concretas con impacto medible y alineación ejecutiva.	Experto	The Staff Engineer's Path — T. Reilly	Documento de estrategia técnica de 18 meses: 3 iniciativas con OKRs, análisis de capacidad del equipo y plan de riesgos.	Aprobado en revisión con VPs; tracking trimestral de progreso con datos objetivos publicados al equipo.
Multi-Cloud	Cloud-agnostic architecture: Terraform modules, abstraction layers Provider-agnostic Terraform, CNCF landscape, portabilidad de workloads	Diseñar la infraestructura para evitar lock-in de proveedor y poder migrar cargas de trabajo según condiciones de negocio.	Experto	CNCF Landscape Terraform Modules	Módulos Terraform abstraídos que despliegan el mismo stack en AWS y GCP sin cambios en la lógica de módulo.	Deploy idéntico en ambas nubes en < 30 minutos; 0 recursos cloud-specific en módulos compartidos.
Multi-Cloud	FinOps: cost attribution, rightsizing, spot strategy Cost tagging, budget alerts, reserved vs on-demand, savings plans	Optimizar el gasto en cloud con visibilidad por producto y equipo para tomar decisiones de arquitectura con consciencia de costo.	Experto	FinOps Foundation Cloud Cost Tools 2026	Dashboard de cost attribution por equipo/producto; rightsizing plan que reduzca el bill en > 20% sin degradar SLOs.	Reducción de > 20% en cloud spend; cada squad con visibilidad de su costo y responsabilidad sobre él.
Seguridad Governance	Supply chain security: SLSA, SBOM, SAST/DAST en CI Sigstore, cosign, artifact signing, GitHub OIDC, OSSF Scorecard	Garantizar la integridad de la cadena de suministro de software desde el commit hasta el artefacto desplegado en producción.	Experto	SLSA Framework Sigstore / cosign Docs	Pipeline con SLSA Level 2: artefactos firmados con cosign, SBOM publicado en cada release, OSSF Scorecard > 7/10.	Artefacto en producción sólo si firma verificable; OSSF Scorecard público y > 7/10 en el repo principal.
ML Systems	Model serving: MLflow, Ray Serve, feature stores Model registry, A/B testing de modelos, online feature store, drift detection	Diseñar la infraestructura MLOps que permita a los equipos de data science desplegar y monitorear modelos en producción de forma autónoma.	Experto	Ray Serve Docs MLflow Docs	Plataforma MLOps: model registry en MLflow, serving en Ray Serve con A/B testing, monitoreo de data drift con Evidently.	Deploy de nuevo modelo en producción en < 30 min via PR; alert automático ante data drift > threshold definido.

Python Backend Engineering Career Path

Trainee

Junior Developer

Semi-Senior (SSR)

Senior Engineer

Staff / Principal Engineer

Python Backend
Engineering Career Path