Cuantas hipotesis deberia generar un hunter por sprint?

Depende de la duracion del sprint y la complejidad de las hipotesis. Un sprint de una semana tipicamente aborda entre 1 y 3 hipotesis. Es mejor investigar una hipotesis a fondo que cinco de forma superficial. La profundidad genera hallazgos de valor, la amplitud genera informes vacios.

Que hago si mi hipotesis no encuentra nada?

Una hipotesis que no encuentra actividad maliciosa sigue siendo un resultado valido. Documenta las fuentes de datos consultadas, las consultas realizadas y las limitaciones (gaps de visibilidad, periodo temporal cubierto). Luego evalua si la hipotesis necesita refinamiento, si los datos son insuficientes para testarla, o si efectivamente no hay evidencia de esa amenaza en tu entorno.

Puedo automatizar la generacion de hipotesis?

Parcialmente. Puedes automatizar la identificacion de gaps de cobertura ATT&CK comparando tu coverage map con las tecnicas usadas por los threat actors relevantes para tu sector. Herramientas como MITRE ATT&CK Navigator y DeTT&CT facilitan esto. Sin embargo, la formulacion de la hipotesis y el diseno de la investigacion requieren juicio humano.

Intermediothreat-huntinghipotesisMITRE-ATT&CKmetodologiaCTI

Hipotesis de Hunting Basadas en ATT&CK: Guia Practica

Como construir hipotesis de threat hunting solidas a partir de MITRE ATT&CK, inteligencia de amenazas y anomalias de baseline.

MalwareIntel Research·9 de junio de 2026·11 min lectura

Serie: Threat Hunting — Parte 3

La Hipotesis como Motor del Hunting

TL;DR: Una hipótesis de hunting es una afirmación testeable que dirige la investigación de amenazas específicas dentro de una infraestructura digital. A diferencia de las búsquedas genéricas, una hipótesis bien estructurada permite detectar técnicas precisas como la ejecución de DLLs mediante rundll32.exe. Es fundamental integrar los cuatro componentes clave de una hipótesis para transformar datos masivos en hallazgos de seguridad accionables.

Una hipotesis de hunting es una afirmacion testeable sobre una amenaza potencial en tu entorno. Es el punto de partida que dirige la investigación, determina que datos necesitas y define el criterio de éxito o fracaso del hunt.

La calidad de la hipotesis determina la calidad del hunt. Una hipotesis vaga ("buscar actividad sospechosa en la red") no produce resultados accionables. Una hipotesis específica ("adversarios están usando rundll32.exe para ejecutar DLLs maliciosas desde directorios temporales en los endpoints Windows del segmento de finanzas") dirige la investigación de forma precisa.

Anatomia de una Buena Hipotesis

Una hipotesis de hunting efectiva tiene cuatro componentes:

Amenaza (quien o que). El adversario, la campana o la técnica que se busca. Puede ser un actor específico (APT28), un tipo de malware (ransomware) o una técnica generica (movimiento lateral).

Técnica (como). El método que el adversario usaria. Debe ser específica y describir un comportamiento observable en los datos. "Usando WMI para ejecutar comandos remotamente" es mejor que "haciendo cosas malas".

Entorno (donde). La parte de la infraestructura donde se buscara. "En los servidores Windows del segmento de bases de datos" es más útil que "en alguna parte de la red".

Evidencia (que buscar). Los artefactos, logs o patrones que confirmarian o refutarian la hipotesis. "Eventos Sysmon ID 1 con ParentImage wmiprvse.exe y CommandLine conteniendo cmd.exe o powershell.exe" define exactamente que buscar.

Plantilla de hipotesis

HIPOTESIS: [Actor/Amenaza] esta usando [Tecnica ATT&CK]
para [objetivo tactica] en [segmento/sistemas del entorno].

EVIDENCIA ESPERADA:
- Fuente de datos: [Sysmon, Zeek, AD logs, etc.]
- Indicadores: [eventos, patrones, valores especificos]
- Baseline normal: [que deberia verse normalmente]
- Anomalia buscada: [desviacion del baseline]

PRIORIDAD: [Alta/Media/Baja] basada en [justificacion]

Tres Fuentes de Hipotesis

Fuente 1: MITRE ATT&CK (attack-driven)

ATT&CK es la fuente mas sistematica para generar hipotesis. El framework documenta cientos de tecnicas agrupadas en tacticas. El proceso es:

Mapear la cobertura de deteccion actual contra ATT&CK (que tecnicas tienen reglas de deteccion)
Identificar gaps: tecnicas sin cobertura de deteccion
Priorizar gaps por relevancia (que adversarios usan esas tecnicas y son relevantes para tu sector)
Formular hipotesis para los gaps de mayor prioridad

Ejemplo con T1053.005 (Scheduled Task/Job: Scheduled Task):

Un analisis de cobertura revela que no hay reglas de deteccion para la creacion de tareas programadas en Windows. La tecnica es usada por numerosos grupos (APT29, FIN7, Lazarus) y es comun en la fase de persistencia.

HIPOTESIS: Un adversario ha establecido persistencia mediante la
creacion de tareas programadas (schtasks.exe) que ejecutan scripts
de PowerShell o binarios desde ubicaciones no estandar en los
servidores Windows del dominio corporativo.

EVIDENCIA ESPERADA:
- Fuente: Sysmon Event ID 1 (Process Create)
- Indicadores: ParentImage que incluya schtasks.exe,
  CommandLine con /create y apuntando a rutas %TEMP%, %APPDATA%,
  o carpetas ocultas
- Fuente complementaria: Windows Event ID 4698 (A scheduled task was created)
- Baseline: tareas programadas legitimas (backups, updates,
  scripts de IT) documentadas en CMDB
- Anomalia: tareas no documentadas, especialmente las que
  ejecutan PowerShell, cmd.exe o binarios en rutas temporales

Ejemplo con T1021.002 (Remote Services: SMB/Windows Admin Shares):

HIPOTESIS: Existe movimiento lateral mediante el uso de shares
administrativos (C$, ADMIN$, IPC$) entre servidores del segmento
de produccion, fuera del horario habitual de mantenimiento.

EVIDENCIA ESPERADA:
- Fuente: Windows Event ID 5140 (Network Share Accessed)
  y 5145 (Detailed File Share)
- Indicadores: accesos a C$, ADMIN$ o IPC$ entre servidores
  (no desde estaciones de trabajo de administradores)
- Fuente complementaria: Zeek smb_mapping.log
- Baseline: accesos legitimos durante ventanas de mantenimiento
  desde IPs de administradores
- Anomalia: accesos fuera de horario, desde IPs no conocidas,
  o entre servidores que no deberian comunicarse

Fuente 2: Inteligencia de amenazas (intelligence-driven)

La CTI proporciona contexto sobre amenazas activas que afectan a organizaciones similares. La diferencia con el hunting basado en IOCs es que aqui se buscan TTPs, no indicadores atomicos.

Proceso:

Recibir un informe de CTI relevante (CISA advisory, reporte de vendor, publicacion CERT)
Extraer las TTPs descritas en el informe
Mapear las TTPs a ATT&CK
Formular hipotesis basadas en como esas TTPs se manifestarian en tu entorno

Ejemplo basado en un advisory de CISA sobre Volt Typhoon:

El advisory describe que Volt Typhoon (actor chino state-sponsored) usa LOLBins para persistir y moverse lateralmente en infraestructuras criticas. Las tecnicas principales incluyen ntdsutil.exe para extraer credenciales de AD y netsh para crear port forwarding.

HIPOTESIS: Un adversario esta usando ntdsutil.exe para crear
snapshots de NTDS.dit (base de datos de Active Directory) en
los domain controllers, como paso previo a la extraccion de
credenciales de todos los usuarios del dominio.

EVIDENCIA ESPERADA:
- Fuente: Sysmon Event ID 1 en Domain Controllers
- Indicadores: proceso ntdsutil.exe con argumentos "snapshot"
  o "activate instance ntds"
- Fuente complementaria: creacion de archivos .dit en directorios
  no estandar (Sysmon Event ID 11)
- Baseline: uso legitimo de ntdsutil por el equipo de AD
  (documentado y en horario laboral)
- Anomalia: ejecucion fuera de ventanas de mantenimiento,
  por cuentas no autorizadas, o seguida de compresion/copia
  de archivos

Ejemplo basado en un reporte sobre campana de Qakbot:

Un reporte de seguridad describe una nueva variante de Qakbot distribuida via emails de respuesta encadenada (reply-chain phishing) que usa archivos .one (OneNote) como vector de entrega.

HIPOTESIS: Usuarios del departamento comercial han recibido
emails de phishing con adjuntos .one de OneNote que contienen
scripts embebidos (HTA, VBS, BAT) como vector de entrega
de Qakbot u otro loader.

EVIDENCIA ESPERADA:
- Fuente: logs del gateway de correo (adjuntos .one)
- Fuente: Sysmon Event ID 1 con ParentImage onenote.exe
  lanzando procesos hijos (wscript, cmd, powershell, mshta)
- Indicadores: cadena de ejecucion onenote.exe -> wscript.exe
  o mshta.exe -> cmd.exe
- Baseline: onenote.exe no deberia lanzar procesos de scripting
  en uso normal
- Anomalia: cualquier proceso hijo de scripting lanzado por
  onenote.exe

Fuente 3: Anomalias de baseline (anomaly-driven)

Las anomalias son desviaciones del comportamiento normal del entorno. Requieren un baseline documentado contra el cual comparar.

Tipos de anomalias que generan hipotesis:

Anomalias de volumen. Un servidor que normalmente genera 100 MB de trafico DNS al dia y repentinamente sube a 2 GB. Un usuario que consulta 500 archivos en un dia cuando su media es 20.

Anomalias temporales. Actividad en horarios inusuales: conexiones RDP a las 3 AM desde una estacion de trabajo que nunca se usa fuera de horario laboral.

Anomalias de destino. Un servidor interno que empieza a comunicarse con IPs en paises donde la organizacion no tiene presencia. Un endpoint que resuelve dominios de hosting gratuito que no son parte del negocio.

Anomalias de proceso. Un servicio de base de datos que lanza PowerShell. Un servidor web que ejecuta certutil. Un proceso de sistema que abre conexiones salientes no documentadas.

HIPOTESIS: Un endpoint comprometido en el segmento de usuarios
esta realizando DNS tunneling para exfiltrar datos, evidenciado
por un volumen anomalo de consultas DNS a un dominio especifico
con registros TXT de longitud inusual.

EVIDENCIA ESPERADA:
- Fuente: logs DNS (Zeek dns.log o logs del resolver interno)
- Indicadores: alto volumen de consultas a un mismo dominio
  de segundo nivel, subdominios largos (mas de 50 caracteres),
  consultas de tipo TXT con respuestas de tamano grande
- Baseline: volumen normal de consultas DNS por endpoint
  (tipicamente 500 a 2000 queries/dia)
- Anomalia: endpoint con mas de 10.000 queries/dia a un mismo
  dominio, subdominios con patrones de codificacion (Base32/64)

Priorizacion de Hipotesis

No todas las hipotesis tienen la misma prioridad. Tres factores determinan el orden de investigacion:

Relevancia de la amenaza. Las hipotesis basadas en amenazas que afectan activamente a tu sector tienen prioridad sobre amenazas genericas. Si eres una institucion financiera, las TTPs de FIN7 son mas prioritarias que las de APT28.

Gap de deteccion. Las tecnicas sin ninguna cobertura de deteccion son mas prioritarias que las que tienen cobertura parcial. Un gap total significa que un adversario puede usar esa tecnica sin riesgo de deteccion.

Impacto potencial. Las hipotesis sobre tecnicas de alto impacto (exfiltracion, ransomware, destruccion) tienen prioridad sobre tecnicas de reconocimiento o descubrimiento.

Matriz de priorizacion

Criterio	Peso	Alto (3)	Medio (2)	Bajo (1)
Relevancia amenaza	40%	Actor activo en mi sector	Actor activo en otros sectores	Tecnica teorica
Gap deteccion	35%	Sin cobertura	Cobertura parcial	Cobertura completa
Impacto potencial	25%	Exfiltracion, ransomware	Persistencia, C2	Reconocimiento

Puntuacion: (Relevancia x 0.4) + (Gap x 0.35) + (Impacto x 0.25). Las hipotesis con puntuacion mas alta se investigan primero.

De la Hipotesis a la Investigacion

Una vez formulada y priorizada la hipotesis, el siguiente paso es disenar la investigacion.

Paso 1: Identificar fuentes de datos

Para cada hipotesis, lista las fuentes de datos necesarias y verifica que estan disponibles:

Los datos existen y se estan recopilando?
La retencion cubre el periodo temporal de interes?
La granularidad es suficiente (por ejemplo, Sysmon Event ID 1 incluye CommandLine completa)?
Hay gaps conocidos (endpoints sin Sysmon, segmentos sin monitorizacion de red)?

Paso 2: Construir consultas

Traduce la evidencia esperada a consultas ejecutables en tu SIEM o herramienta de analisis.

Ejemplo en KQL (Elastic) para la hipotesis de tareas programadas:

event.code: "1" AND
process.parent.name: "schtasks.exe" AND
process.command_line: (*powershell* OR *cmd.exe* OR *wscript*) AND
process.working_directory: (*Temp* OR *AppData* OR *ProgramData*)

Ejemplo en SPL (Splunk):

index=sysmon EventCode=1 ParentImage="*schtasks.exe"
| where match(CommandLine, "(?i)(powershell|cmd\.exe|wscript)")
| where match(CurrentDirectory, "(?i)(temp|appdata|programdata)")
| stats count by Computer, User, CommandLine, ParentCommandLine
| sort -count

Paso 3: Analizar resultados

Los resultados de las consultas raramente dan una respuesta binaria. El hunter debe:

Filtrar falsos positivos conocidos (tareas programadas legitimas del equipo de IT)
Identificar patrones (multiples endpoints con la misma tarea sospechosa)
Pivotar sobre hallazgos (si una tarea sospechosa ejecuta PowerShell, que hace ese script?)
Correlacionar con otras fuentes (la IP de destino del script aparece en feeds de CTI?)

Paso 4: Documentar y cerrar

Independientemente del resultado, el hunt se documenta con:

Hipotesis original y justificacion
Fuentes de datos consultadas y consultas usadas
Hallazgos (positivos, negativos, inconcluyentes)
Limitaciones (gaps de visibilidad, período temporal)
Recomendaciones (nuevas reglas de detección, mejoras de logging)

Errores Comunes al Formular Hipotesis

Hipotesis demasiado amplias. "Buscar malware en la red" no es una hipotesis. No dirige la investigación, no define que buscar ni donde. Acotar por técnica, segmento y período temporal.

Hipotesis sin datos disponibles. Formular una hipotesis sobre DNS tunneling cuando los logs de DNS no se recopilan es inutil. Antes de formular la hipotesis, verifica que los datos están disponibles.

Confundir IOCs con hipotesis. "Buscar la IP 203.0.113.45 en los logs" es una busqueda de IOC, no una hipotesis. Una hipotesis describe un comportamiento, no un indicador atomico.

No considerar el baseline. Sin saber que es normal, todo parece sospechoso. Si la hipotesis busca "ejecuciones inusuales de PowerShell", el hunter necesita saber cuales son las ejecuciones habituales.

Hipotesis que no se pueden refutar. "Un adversario sofisticado puede haber comprometido cualquier sistema usando técnicas desconocidas" no es testeable. Si no se puede refutar, no es una hipotesis.

ATT&CK Navigator para Planificar Hunts

MITRE ATT&CK Navigator es una herramienta web que permite crear capas (layers) del framework ATT&CK con colores y anotaciones. Es extremadamente útil para planificar hunts:

Capa 1: Cobertura de detección. Colorea en verde las técnicas cubiertas por reglas de detección. Las técnicas sin color son gaps.

Capa 2: Amenazas relevantes. Colorea en rojo las técnicas usadas por los adversarios relevantes para tu sector. Puedes superponer multiples actores.

Capa 3: Prioridades de hunting. Superpone las capas 1 y 2. Las intersecciones (técnicas usadas por adversarios relevantes que no tienen cobertura) son los candidatos prioritarios para hunting.

Esta visualización permite al equipo ver de un vistazo donde concentrar los esfuerzos de hunting y como va evolucionando la cobertura a medida que se completan hunts y se crean nuevas reglas.

Conclusion

La hipotesis es el corazon del threat hunting. Sin ella, el hunting se convierte en una busqueda sin dirección. Con una hipotesis bien formulada, el hunter sabe exactamente que buscar, donde buscar y como interpretar lo que encuentra.

Las tres fuentes de hipotesis (ATT&CK, inteligencia de amenazas y anomalias de baseline) se complementan entre si. Un programa de hunting maduro usa las tres de forma rotativa, asegurando cobertura amplia y profunda.

En los siguientes artículos de esta serie, aplicaremos estos conceptos a escenarios específicos de hunting: movimiento lateral, persistencia, command and control y exfiltración.

Preguntas frecuentes

Libros recomendados

MITRE ATT&CK Defender Certified (MAD) Study Guide

Amazon (enlace afiliado)

Crafting the InfoSec Playbook (Jeff Bollinger)