🤖Inteligencia Artificial

📖 Artículo especializadoHer · हेर — a detectivefor your Claude Code sessions

A Blog post by Build Small Hackathon on Hugging Face

Autor

Julian Geller

📅

Publicado

7 de junio de 2026

⏱️

Tiempo de lectura

9 min lectura

Continúa leyendo

Home Blog

⏱️

Tiempo de lectura

9 min lectura

🎯

Nivel

Intermedio

📊

Última edición

7 de jun de 2026

💡

Guía de Inteligencia Artificial

Para profesionales tecnológicos

Este artículo está diseñado específicamente para empresarios y responsables de IT que buscan implementar soluciones de inteligencia artificial de manera práctica y efectiva en sus empresas.

🤖 IA🏢 PyMEs🇦🇷 Argentina

"Her": Un Detective Analítico para Sesiones de Agentes de IA y LLMs

El vertiginoso avance en el desarrollo de agentes basados en Large Language Models (LLMs) ha transformado radicalmente la capacidad de automatizar tareas complejas, desde la atención al cliente hasta la gestión de operaciones críticas. Sin embargo, con esta potencia viene una complejidad intrínseca: la depuración (debugging) y la interpretación del comportamiento de estos sistemas. Las interacciones de un agente de IA, especialmente aquellos que orquestan múltiples herramientas y subagentes, generan un rastro de eventos en formato jsonl que, en la práctica, suele ser una caja negra. Analizar miles de líneas de JSON para discernir por qué un agente tomó una decisión particular, cómo consumió su presupuesto de tokens, o cuál subagente ejecutó una función específica, es una tarea titánica y propensa a errores.

Aquí es donde entra en juego "Her" (हेर, que significa "detective" en marathi): una herramienta diseñada para transformar estos registros crípticos en insights accionables y comprensibles. Pensada para el desarrollador de Machine Learning e IA, "Her" se posiciona como una pieza clave en la observabilidad y auditabilidad de sus agentes LLM, ofreciendo una perspectiva forense sobre cada sesión de trabajo.

La Opacidad del Comportamiento de los Agentes LLM: Un Desafío en MLOps

La naturaleza estocástica y a menudo opaca de los LLMs presenta desafíos únicos en entornos de desarrollo y producción. Un agente que interactúa con bases de datos, APIs externas o sistemas de configuración, puede exhibir comportamientos inesperados. La dificultad radica en que los logs de sesión tradicionales, aunque detallados, son fundamentalmente "write-only" para la mayoría de los propósitos prácticos. Preguntas críticas como "¿por qué este agente intentó acceder a un entorno de producción sin autorización?", "¿dónde se consumió la mayor parte del presupuesto de contexto en esta cadena de pensamiento?" o "¿qué herramienta o subagente contribuyó más al tiempo de latencia?" a menudo quedan sin respuesta clara, ralentizando los ciclos de depuración y optimización.

Para un equipo de MLOps en Argentina, por ejemplo, donde la eficiencia de costos y la seguridad de los datos son primordiales, entender el rastro exacto de un agente que interactúa con sistemas financieros como los de Mercado Pago o APIs gubernamentales como las de AFIP es crucial. Un error de configuración o un consumo excesivo de tokens puede tener implicaciones económicas y regulatorias significativas. "Her" aborda esta brecha, actuando como un microscopio que descompone la complejidad en eventos discretos y analizables.

"Her": Desentrañando la Lógica Interna de tus Agentes

El principio de funcionamiento de "Her" es elegantemente simple pero profundamente efectivo: al proporcionarle un archivo de sesión (.jsonl), la herramienta se encarga de la investigación, reconstruyendo los eventos en lenguaje natural, identificando acciones de riesgo y trazando cada paso hasta su origen exacto.

Análisis Forense y Reconstrucción de Eventos

"Her" convierte el laberinto de JSONL en una narrativa coherente. Esta capacidad de reconstruir la secuencia de eventos en inglés (o español, mediante traducción posterior) es invaluable para:

Depuración Rápida: Identificar la secuencia de prompts y respuestas que condujeron a un comportamiento anómalo.
Validación de Lógica: Confirmar si el agente sigue la lógica de orquestación esperada.
Comunicación con Stakeholders: Presentar el comportamiento del agente en términos comprensibles para equipos no técnicos o gerenciales, mostrando cómo se abordó una consulta o se realizó una tarea.

Identificación de Riesgos y Guardrails Operacionales

Una de las características más críticas de "Her" es su capacidad para señalar movimientos de alto riesgo. Esto incluye:

Despliegues o cambios de configuración: Alertar sobre comandos que podrían modificar entornos de producción.
Acceso a recursos sensibles: Detectar el uso de herramientas o credenciales que interactúan con sistemas críticos (bases de datos de producción, APIs con datos sensibles).
Manejo de secretos: Identificar si la información confidencial fue expuesta o mal utilizada.

En el contexto argentino, un agente que accidentalmente intenta un despliegue en un servidor de producción de un banco o que expone información personal sensible como números de DNI o detalles fiscales durante una interacción, podría enfrentar graves consecuencias. "Her" actúa como un sistema de alerta temprana, permitiendo a los desarrolladores implementar "guardrails" de seguridad más robustos y prevenir errores costosos antes de que escalen.

Optimización de Costos y Eficiencia de Tokens

Los LLMs son costosos, y el consumo de tokens es un factor directo en los gastos operativos. "Her" proporciona una visibilidad detallada sobre el uso de tokens:

Asignación de Contexto: Muestra dónde se gastó el presupuesto de contexto, revelando qué partes del prompt o las respuestas consumieron más recursos.
Identificación de Ineficiencias: Ayuda a pinpointar patrones de uso de tokens derrochadores, facilitando la optimización de prompts y la gestión de la ventana de contexto.

Para startups y empresas en Argentina, donde los presupuestos pueden ser ajustados, la capacidad de optimizar el consumo de tokens es directamente relevante para la sostenibilidad económica de sus soluciones de IA. Reducir el gasto innecesario en llamadas a la API de LLMs puede marcar una diferencia significativa.

Visibilidad Completa de Herramientas y Orquestación

"Her" no solo lista las herramientas usadas, sino que las identifica y contextualiza. Rastrea qué herramientas, subagentes, habilidades o servidores (MCP) fueron invocados. Esto es crucial para:

Mapeo de Dependencias: Entender cómo los diferentes componentes del sistema interactúan.
Análisis de Rendimiento: Identificar cuellos de botella o dependencias inesperadas en la ejecución de la lógica del agente.
Auditoría de Acciones: Confirmar si las herramientas adecuadas fueron utilizadas en el momento correcto.

Además, "Her" viene con una base de datos de herramientas populares de Homebrew, npm y PyPI, lo que le permite reconocer y describir automáticamente muchas utilidades. Esto significa que puede identificar si un agente ejecutó kubectl para interactuar con un clúster de Kubernetes, dbt para transformaciones de datos, o pandas para análisis, marcando estas actividades para una revisión más profunda si son críticas.

Insights Accionables Basados en Buenas Prácticas

Más allá del análisis descriptivo, "Her" ofrece sugerencias constructivas. Basándose en las mejores prácticas de la comunidad y de entidades como Anthropic, la herramienta puede proponer mejoras cuando detecta patrones subóptimos. Es importante destacar que estas son "sugerencias", no afirmaciones, y la herramienta se mantiene en silencio cuando no hay nada relevante que añadir. Este enfoque separa el análisis determinista de la interpretación basada en LLM, garantizando la fiabilidad de los datos mientras se proporciona orientación valiosa.

Depuración Interactiva con "Ask Her" y Análisis Multi-Sesión

"Her" incluye un "copiloto" integrado, "Ask Her", que permite a los desarrolladores formular preguntas específicas sobre la traza: "¿por qué se usó esta herramienta en particular?", por ejemplo. La herramienta responderá directamente desde el archivo de sesión, citando las vueltas específicas y abriendo el registro exacto de la llamada a la herramienta.

Para una perspectiva más amplia, "Her" puede analizar múltiples archivos de sesión simultáneamente, construyendo una "vista de proyecto". Esto es inmensamente útil para:

Comparación de Versiones: Evaluar el impacto de diferentes prompts o configuraciones de agente.
Identificación de Patrones: Encontrar fallos comunes o comportamientos recurrentes a través de múltiples ejecuciones.
Auditoría de Rendimiento: Monitorear la eficiencia y el costo de los agentes a lo largo del tiempo o en diferentes escenarios.

Arquitectura Robusta y Compromiso con la Privacidad

Un aspecto fundamental que distingue a "Her" es su arquitectura enfocada en la privacidad y la seguridad de los datos:

Procesamiento Local y Sin APIs Externas: La herramienta no realiza llamadas a APIs de IA de terceros. El modelo LLM subyacente (como Nemotron-Mini-4B-Instruct) se ejecuta directamente en la GPU del Space, aprovechando ZeroGPU. Esto garantiza que el procesamiento de sus datos de sesión se mantenga local.
Privacidad de Datos Extrema: Los archivos de sesión se cargan en un namespace privado y de eliminación automática, vinculado exclusivamente a su ejecución. Ninguna información abandona este entorno aislado. Este nivel de privacidad es crucial para empresas en Argentina que manejan datos sensibles, como el sector financiero o de salud, y deben cumplir con estrictas regulaciones de protección de datos personales.
Motor de Evaluación Determinista: El motor de análisis principal de "Her" es puramente determinista. Esto significa que los hallazgos numéricos y las identificaciones de eventos son consistentes y fiables, independientemente de cualquier cambio en el modelo LLM utilizado para generar las descripciones en lenguaje natural. El modelo solo se emplea para la redacción de la prosa y las sugerencias "suaves", nunca para afirmar hallazgos críticos. Esta separación asegura la integridad y fiabilidad de los resultados.

Implicaciones Prácticas para Desarrolladores de ML/IA

"Her" no es solo una herramienta de depuración; es una plataforma de observabilidad que empodera a los equipos de ML/IA. Para un desarrollador que experimenta con arquitecturas de agentes complejas, "Her" reduce drásticamente el tiempo dedicado a la resolución de problemas. Para un ingeniero de MLOps, proporciona la visibilidad necesaria para monitorear agentes en producción, asegurar el cumplimiento y optimizar el rendimiento.

Consideremos un equipo en Argentina desarrollando un agente de IA para un call center que maneja consultas sobre seguros. El agente necesita interactuar con una base de datos de clientes, una API de pólizas y, quizás, un sistema de gestión de reclamos. Sin "Her", depurar por qué un reclamo no se procesó correctamente, o por qué el agente consumió demasiados tokens en una interacción trivial, sería un proceso arduo y manual. Con "Her", se pueden identificar rápidamente:

La secuencia exacta de eventos que llevó a un error de procesamiento.
Si el agente intentó acceder a información que no le correspondía.
Los prompts que generaron respuestas excesivamente largas y costosas.
Las herramientas específicas que fueron invocadas y sus resultados.

Esto no solo acelera el desarrollo, sino que también mejora la calidad y la seguridad de los sistemas de IA, un requisito indispensable en el ecosistema tecnológico argentino en constante crecimiento. En esencia, cuando el comportamiento de un agente LLM se vuelve impredecible o cuando surge la pregunta "¿qué está haciendo mi agente?", "Her" proporciona las respuestas, iluminando la caja negra y permitiendo a los desarrolladores construir sistemas de IA más robustos, eficientes y seguros.

Fuente: Fuente

🎯

¿Te resultó útil este artículo?

En Grupo La Red nos especializamos en ayudar a PyMEs argentinas a implementar soluciones tecnológicas seguras y eficientes. Nuestro equipo de expertos puede ayudarte a evaluar y mejorar la ciberseguridad de tu empresa.

💬 Consulta gratuita 🛡️ Nuestros servicios

Ver todos los artículos

Explora nuestro blog completo

Más de Inteligencia Artificial

¿Te gustó este artículo?

¡Compártelo en tus redes sociales!

WhatsApp LinkedIn Facebook X Instagram Telegram

Enlaces Útiles

Recursos y enlaces relacionados que podrían ser útiles para ti

Nuestros Servicios

Soporte IT para PyMEs

Mantenimiento y soporte técnico especializado

soporte ITmantenimientotécnicoPyMEs

Desarrollo de Aplicaciones

Apps móviles y web personalizadas

desarrolloaplicacionesappsmóviles

Contacto

Solicita una consulta gratuita

contactoconsultapresupuestoasesoramiento

Recursos Externos

Power BI

Herramienta de análisis de datos de Microsoft

Power BIanálisis de datosBIMicrosoft

OpenAI

Plataforma oficial de OpenAI

OpenAIChatGPTIAinteligencia artificial

Contenido Relacionado

Descubre más artículos que podrían interesarte, seleccionados por nuestro algoritmo de similitud.

3 artículos relacionados

Algoritmo inteligente

#1 relacionado

🤖

11 min lectura

Inteligencia Artificial

27 may

Reachy Mini goes fully local

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

Julian Geller

Leer

#2 relacionado

La IA prometía descentralizar el conocimiento. Está haciendo exactamente lo contrario

🤖

9 min lectura

Inteligencia Artificial

10 may

La IA prometía descentralizar el conocimiento. Está haciendo exactamente lo contrario

Todo el debate sobre la IA gira en torno a lo mismo: empleo, deepfakes, derechos de autor, automatización. Son preguntas razonables. Pero hay una que importa...

Delfina Geller

Leer

#3 relacionado

Mejores CRM para PyMEs argentinas 2025: Guía completa de selección

📱

4 min lectura

Marketing Digital

3 oct

Mejores CRM para PyMEs argentinas 2025: Guía completa de selección

Descubre información valiosa sobre este tema y cómo puede beneficiar a tu empresa.

🏷️tecnología 🏷️empresas

Delfina Geller

Leer

🤖 Algoritmo de Similitud Inteligente

Estos artículos fueron seleccionados usando nuestro algoritmo que analiza categorías, tags, títulos y contenidopara encontrar los artículos más relevantes para ti.

¿Quieres implementar IA en tu empresa?

Nuestro equipo de especialistas en IA está disponible para consultas gratuitas sobre automatización y transformación digital.

Contactanos gratis

ℹ️ Información del Contenido

Contenido adaptado: Los artículos y posts publicados en esta sección han sido adaptados y procesados a partir de información de sitios de marketing y tecnología reconocidos. Hemos seleccionado, estructurado y adaptado el contenido para facilitar su comprensión y acceso específicamente para PyMEs argentinas.

Generación con IA: Parte del contenido mostrado en esta página ha sido generado o procesado con inteligencia artificial para mejorar la experiencia del usuario y proporcionar información estructurada y actualizada.

Responsabilidad: Grupo La Red no se hace responsable por la exactitud del contenido original ni por las opiniones expresadas en los artículos adaptados. Recomendamos verificar la información directamente en la fuente original y consultar con profesionales cuando sea necesario.

Para más información sobre nuestro uso de IA, consulta nuestra política de términos.

"Her": Un Detective Analítico para Sesiones de Agentes de IA y LLMs

La Opacidad del Comportamiento de los Agentes LLM: Un Desafío en MLOps

"Her": Desentrañando la Lógica Interna de tus Agentes

Análisis Forense y Reconstrucción de Eventos

"Her" convierte el laberinto de JSONL en una narrativa coherente. Esta capacidad de reconstruir la secuencia de eventos en inglés (o español, mediante traducción posterior) es invaluable para:

Depuración Rápida: Identificar la secuencia de prompts y respuestas que condujeron a un comportamiento anómalo.
Validación de Lógica: Confirmar si el agente sigue la lógica de orquestación esperada.
Comunicación con Stakeholders: Presentar el comportamiento del agente en términos comprensibles para equipos no técnicos o gerenciales, mostrando cómo se abordó una consulta o se realizó una tarea.

Identificación de Riesgos y Guardrails Operacionales

Una de las características más críticas de "Her" es su capacidad para señalar movimientos de alto riesgo. Esto incluye:

Despliegues o cambios de configuración: Alertar sobre comandos que podrían modificar entornos de producción.
Acceso a recursos sensibles: Detectar el uso de herramientas o credenciales que interactúan con sistemas críticos (bases de datos de producción, APIs con datos sensibles).
Manejo de secretos: Identificar si la información confidencial fue expuesta o mal utilizada.

Optimización de Costos y Eficiencia de Tokens

Los LLMs son costosos, y el consumo de tokens es un factor directo en los gastos operativos. "Her" proporciona una visibilidad detallada sobre el uso de tokens:

Asignación de Contexto: Muestra dónde se gastó el presupuesto de contexto, revelando qué partes del prompt o las respuestas consumieron más recursos.
Identificación de Ineficiencias: Ayuda a pinpointar patrones de uso de tokens derrochadores, facilitando la optimización de prompts y la gestión de la ventana de contexto.

Visibilidad Completa de Herramientas y Orquestación

"Her" no solo lista las herramientas usadas, sino que las identifica y contextualiza. Rastrea qué herramientas, subagentes, habilidades o servidores (MCP) fueron invocados. Esto es crucial para:

Mapeo de Dependencias: Entender cómo los diferentes componentes del sistema interactúan.
Análisis de Rendimiento: Identificar cuellos de botella o dependencias inesperadas en la ejecución de la lógica del agente.
Auditoría de Acciones: Confirmar si las herramientas adecuadas fueron utilizadas en el momento correcto.

Insights Accionables Basados en Buenas Prácticas

Depuración Interactiva con "Ask Her" y Análisis Multi-Sesión

Para una perspectiva más amplia, "Her" puede analizar múltiples archivos de sesión simultáneamente, construyendo una "vista de proyecto". Esto es inmensamente útil para:

Comparación de Versiones: Evaluar el impacto de diferentes prompts o configuraciones de agente.
Identificación de Patrones: Encontrar fallos comunes o comportamientos recurrentes a través de múltiples ejecuciones.
Auditoría de Rendimiento: Monitorear la eficiencia y el costo de los agentes a lo largo del tiempo o en diferentes escenarios.

Arquitectura Robusta y Compromiso con la Privacidad

Un aspecto fundamental que distingue a "Her" es su arquitectura enfocada en la privacidad y la seguridad de los datos:

Procesamiento Local y Sin APIs Externas: La herramienta no realiza llamadas a APIs de IA de terceros. El modelo LLM subyacente (como Nemotron-Mini-4B-Instruct) se ejecuta directamente en la GPU del Space, aprovechando ZeroGPU. Esto garantiza que el procesamiento de sus datos de sesión se mantenga local.
Privacidad de Datos Extrema: Los archivos de sesión se cargan en un namespace privado y de eliminación automática, vinculado exclusivamente a su ejecución. Ninguna información abandona este entorno aislado. Este nivel de privacidad es crucial para empresas en Argentina que manejan datos sensibles, como el sector financiero o de salud, y deben cumplir con estrictas regulaciones de protección de datos personales.
Motor de Evaluación Determinista: El motor de análisis principal de "Her" es puramente determinista. Esto significa que los hallazgos numéricos y las identificaciones de eventos son consistentes y fiables, independientemente de cualquier cambio en el modelo LLM utilizado para generar las descripciones en lenguaje natural. El modelo solo se emplea para la redacción de la prosa y las sugerencias "suaves", nunca para afirmar hallazgos críticos. Esta separación asegura la integridad y fiabilidad de los resultados.

Implicaciones Prácticas para Desarrolladores de ML/IA

La secuencia exacta de eventos que llevó a un error de procesamiento.
Si el agente intentó acceder a información que no le correspondía.
Los prompts que generaron respuestas excesivamente largas y costosas.
Las herramientas específicas que fueron invocadas y sus resultados.

Fuente: Fuente