Continuous profiling en la práctica: Parca, Pyroscope y el agente eBPF de OpenTelemetry

Un servicio de checkout en Go que llevaba meses estable empieza a arrastrar la latencia tras el despliegue del martes. El p99 sube de 120 ms a 400 ms, pero nada cuadra: la CPU del pod está al 40 %, la memoria plana, los logs limpios y las trazas señalan que el tiempo se va … Leer más

Sampling de trazas: cómo no arruinar el presupuesto sin perder visibilidad

Es lunes por la mañana. Abres el correo y ahí está: la factura de tu plataforma de observabilidad ha subido un 40% este mes. Te conectas al panel de costes y descubres que las trazas distribuidas se están comiendo el presupuesto. Tu aplicación genera millones de trazas al día, la mayoría de peticiones rutinarias que … Leer más

Cribl y el enrutamiento inteligente de telemetría: cómo reducir costes sin perder control

Imagina que tu equipo recibe cada día decenas de gigabytes de logs, métricas y trazas desde aplicaciones, Kubernetes, firewalls y servicios cloud. Todo acaba en Splunk, Elastic o Datadog. El problema no es que los datos lleguen: el problema es que todos llegan, sin filtrar, al destino más caro de tu stack. Los logs de … Leer más

Adaptive Telemetry: cuando menos datos significan más claridad

Son las 2:47 de la madrugada y el equipo de guardia recibe una alerta: el tiempo de respuesta del proceso de pago ha subido un 300% en los últimos cuatro minutos. El SRE abre la plataforma de observabilidad y busca las trazas del flujo API Gateway → Checkout → Validación de tarjetas → Antifraude externo. … Leer más

Este sitio web utiliza cookies para que usted tenga la mejor experiencia de usuario. Si continúa navegando está dando su consentimiento para la aceptación de las mencionadas cookies y la aceptación de nuestra política de cookies, pinche el enlace para mayor información.

ACEPTAR
Aviso de cookies