sre – Página 2 – observasistemas

Continuous profiling en la práctica: Parca, Pyroscope y el agente eBPF de OpenTelemetry

10 de junio de 2026 Tomas Pardellas

Un servicio de checkout en Go que llevaba meses estable empieza a arrastrar la latencia tras el despliegue del martes. El p99 sube de 120 ms a 400 ms, pero nada cuadra: la CPU del pod está al 40 %, la memoria plana, los logs limpios y las trazas señalan que el tiempo se va … Leer más

Observabilidad de agentes de IA en producción: cuando el coste de la telemetría se dispara

8 de junio de 2026 Tomas Pardellas

Un agente de IA en producción ejecuta docenas de llamadas a modelos de lenguaje por segundo, cada una con su contexto, su historial de conversación y sus parámetros de inferencia. Cada llamada genera tokens de entrada y salida, consume tiempo de procesamiento y puede fallar de formas que nunca habías visto: el modelo devuelve JSON … Leer más

Novedades Observabilidad: semana del 17/05/2026 al 24/05/2026

24 de mayo de 2026 Tomas Pardellas

Resumen semanal del ecosistema cloud-native y SRE: OpenTelemetry, CNCF y SRE Weekly. Artículos y contenidos originales en inglés resumidos en español para facilitar el seguimiento de novedades, releases y tendencias del sector sin depender de ningún vendor concreto. CNCF Blog Designing end-to-end ingress request tracing for multi-tenant SaaS platforms Publicado el 2026-05-22 — Leer artículo … Leer más

Adaptive Telemetry: cuando menos datos significan más claridad

11 de mayo de 2026 Tomas Pardellas

Son las 2:47 de la madrugada y el equipo de guardia recibe una alerta: el tiempo de respuesta del proceso de pago ha subido un 300% en los últimos cuatro minutos. El SRE abre la plataforma de observabilidad y busca las trazas del flujo API Gateway → Checkout → Validación de tarjetas → Antifraude externo. … Leer más