Latencia en Sistemas Distribuidos

La latencia no solo se mide: se diseña, se negocia y se gestiona.

Gráfico de latencia y métricas de rendimiento en sistemas distribuidos

En sistemas distribuidos, la latencia es uno de los factores que más impacto tiene en la experiencia del usuario y en la carga de los equipos. Un sistema puede estar "arriba", pero si responde tarde, para el cliente está caído igual.

¿Qué es realmente la latencia?

Es el tiempo que tarda una operación en completarse: desde que se hace una solicitud hasta que se recibe la respuesta. En un sistema distribuido, ese tiempo se reparte entre:

Cuando el sistema crece, la latencia deja de ser un número y se vuelve un presupuesto.

Latencia como presupuesto de diseño

En plataformas serias, la pregunta no es "¿cuánto demora?", sino: "¿cuánta latencia podemos permitirnos y cómo la distribuimos?".

📊 Ejemplo: Presupuesto de latencia (500ms total)

Red
100ms
Procesamiento
180ms
Base de datos
150ms
APIs externas
70ms
Red (20%)
Procesamiento (36%)
Base de datos (30%)
APIs externas (14%)

⚠️ Cómo se manifiestan los problemas de latencia

  • Usuarios que "sienten" el sistema lento aunque no haya errores.
  • Incremento de timeouts y reintentos que multiplican la carga.
  • Spikes de CPU y memoria en momentos de alta demanda.
  • Incidentes intermitentes difíciles de reproducir.

Buenas prácticas en sistemas distribuidos

Un sistema rápido no es el que tiene más hardware, sino el que usa bien cada milisegundo. Entender la latencia es entender cómo realmente vive y respira tu plataforma.

Jorel del Portal

Jorel del Portal

Ingeniero de sistemas especializado en arquitectura de software empresarial y plataformas de alta disponibilidad.