1. Herramientas de Análisis de Problemas

Técnicas estructuradas para identificar causas raíz, analizar problemas y encontrar soluciones efectivas.

1.1 🌳 Issue Trees (Árbol de Problemas)

Qué: Descomposición estructurada de problema en sub-problemas mutuamente excluyentes.

Por qué: Evitar análisis caótico, asegurar exhaustividad, priorizar mejor.

Cuándo: Problemas complejos, consultancy, análisis de causa raíz.

Dónde: Whiteboards, Miro, papel.

Cómo:

Definir problema en la raíz (root)
Descomponer en categorías MECE (ver abajo)
Sub-dividir cada categoría hasta llegar a causas accionables
Priorizar ramas por impacto/factibilidad

Ejemplo - "Performance del sistema es lenta":

           [Performance Lenta]
                  |
      ┌──────────┼──────────┐
      |          |          |
  [Backend]  [Frontend]   [Red]
      |          |          |
  ┌───┼───┐  ┌──┼──┐   ┌───┼───┐
  |   |   |  |  |  |   |   |   |
 DB Código AP CSS JS HTML CDN Latencia AnchoBanda

Reglas:

Cada nivel debe ser MECE (Mutually Exclusive, Collectively Exhaustive)
Profundizar solo ramas relevantes
Usar datos para priorizar ramas

Diferencia con Ishikawa: Issue Tree es más estructurado y cuantificable, Ishikawa es brainstorming.

1.2 🔍 MECE Principle

Qué: Mutually Exclusive, Collectively Exhaustive (Mutuamente Excluyente, Colectivamente Exhaustivo).

Por qué: Evitar overlaps y gaps en análisis, claridad en categorización.

Cuándo: Segmentar mercados, organizar análisis, estructurar presentaciones.

Reglas:

Mutually Exclusive: Sin overlap entre categorías
Collectively Exhaustive: Cubre todos los casos posibles

Ejemplo - Segmentar usuarios:

❌ No MECE:

Usuarios nuevos
Usuarios pagos
Usuarios activos (Problema: Un usuario puede ser nuevo Y pago Y activo = overlap)

✅ MECE:

Por antigüedad: Nuevo (< 30 días) / Establecido (≥ 30 días)
Por pago: Free / Pago
Por actividad: Activo (login última semana) / Inactivo

Frameworks MECE comunes:

Tiempo: Pasado / Presente / Futuro
Geográfico: Region A / Region B / Region C
Tipo de cliente: B2B / B2C
Funnel: Awareness / Consideration / Purchase / Retention

1.3 ✅ Phoenix Checklist

Qué: Lista de preguntas desarrollada por la CIA para resolver problemas complejos.

Por qué: Fuerza pensar desde múltiples ángulos, evita soluciones superficiales.

Cuándo: Problemas críticos, decisiones estratégicas, brainstorming estructurado.

Categorías de Preguntas:

1.3.1 1. El Problema

¿Por qué es necesario resolver este problema?
¿Cuáles son los beneficios de resolverlo?
¿Qué pasa si no lo resolvemos?
¿Quién decide si está resuelto?

1.3.2 2. Definición

¿Cómo se explicaría a un niño de 10 años?
¿Qué palabras clave describen el problema?
¿Qué analogías aplican?
¿Puedes dibujarlo?

1.3.3 3. Soluciones

¿Cómo lo resolverían expertos de otros campos?
¿Qué haría [persona admirable]?
Si se tuvieran recursos ilimitados
Si se tuviera que resolver en 1 hora
¿Cuál es la solución opuesta/inversa?

1.3.4 4. Plan

¿Qué información necesitas?
¿Qué no sabes que necesitas saber?
¿Dónde está la información?
¿Qué asunciones estás haciendo?

1.3.5 5. Revisión

¿Hay un patrón en soluciones anteriores?
¿Qué puedes generalizar?
¿Cómo esto se relaciona con otros problemas?
¿Qué aprendiste?

Ejemplo de uso: Problema: "Churn alto de usuarios"

Definición: "Usuarios dejan de usar el producto después de 2 meses"
Analogía: "Como un gimnasio donde la gente paga pero no va"
¿Qué haría Netflix? Personalización, contenido constante, recordatorios
Solución inversa: En vez de retener, ¿y si hacemos más fácil volver?

1.4 ⚠️ AMFE (Análisis de Modos de Fallo y Efectos)

Qué: Método sistemático para identificar fallos potenciales y su impacto.

Por qué: Prevención proactiva, priorizar riesgos por severidad.

Cuándo: Diseño de sistemas críticos, nuevas features riesgosas, compliance.

Componentes:

Componente	What	Escala
Modo de Fallo	¿Cómo puede fallar?	N/A
Efecto	¿Qué pasa si falla?	N/A
Severidad (S)	Impacto del fallo	1-10 (10=catastrófico)
Ocurrencia (O)	Probabilidad	1-10 (10=muy frecuente)
Detección (D)	¿Qué tan difícil detectar?	1-10 (10=imposible detectar)
RPN	Risk Priority Number	S × O × D

Proceso:

Identificar componente/proceso
Listar modos de fallo posibles
Analizar efectos
Calcular RPN
Priorizar acciones para RPN > 100

Ejemplo - Sistema de pagos:

Modo Fallo	Efecto	S	O	D	RPN	Acción
DB caída	No se procesan pagos	9	2	2	36	Redundancia DB
API timeout	Usuario ve error	5	6	3	90	Retry logic + circuit breaker
Doble cobro	Usuario cobra 2x	10	4	7	280 🔴	Idempotency keys obligatorios
Webhook falla	Merchant no notificado	8	5	4	160 🔴	Queue + retry exponencial

Acciones según RPN:

> 200: Crítico, actuar inmediatamente
1200: Alto riesgo, priorizar
< 100: Monitorear

Herramientas: Excel, Google Sheets, software específico FMEA.

1.5 🎯 ¿Por qué usar herramientas estructuradas?

Qué: Frameworks probados para resolver problemas de forma sistemática.

Por qué: Evitar soluciones superficiales (tratar síntomas en vez de causas), tomar decisiones basadas en datos.

Quién: Todo el equipo - developers, PMs, QAs, managers.

Cuándo: Cuando hay un problema recurrente, incident post-mortem, planning de features.

Esfuerzo: Inversión 30min-2h por sesión, previene semanas de trabajo en dirección incorrecta.

1.6 🐟 Diagrama de Ishikawa (Espina de Pescado)

Qué: Diagrama causa-efecto que identifica múltiples causas potenciales de un problema.

Por qué: Visualiza relaciones entre causas y efecto, pensamiento estructurado.

Cuándo: Problemas complejos con múltiples causas posibles, post-mortems.

Dónde: Whiteboards, Miro, FigJam, papel.

Cómo:

Dibujar línea horizontal (espina) con problema en la derecha
Dibujar espinas principales (categorías): Personas, Procesos, Tecnología, Ambiente, Métodos, Materiales
Para cada categoría, hacer brainstorming de causas
Agregar sub-causas (espinas secundarias)
Analizar e investigar causas más probables

Ejemplo:

              Personas          Procesos
                 |                 |
                 |                 |
        ---------+-----------------+--------- [Bug en Producción]
                 |                 |
                 |                 |
            Tecnología         Ambiente

Caso de uso real: Sistema lento en producción

Personas: Falta capacitación en optimización, equipo nuevo
Procesos: Sin code review de performance, no hay load testing
Tecnología: DB sin índices, queries N+1, instancias pequeñas
Ambiente: Alto tráfico inesperado, región lejana de usuarios

1.7 ❓ 5 Porqués

Qué: Preguntar "¿Por qué?" 5 veces consecutivas para llegar a la causa raíz.

Por qué: Profundizar más allá del síntoma obvio.

Cuándo: Problemas con causa no clara, post-mortems, retrospectivas.

Cómo:

Definir problema claramente
Preguntar "¿Por qué ocurrió?"
Responder basándose en hechos
Preguntar "¿Por qué?" a esa respuesta
Repetir hasta llegar a causa raíz (típicamente 5 veces)

Ejemplo - Deploy fallido:

Problema: Deploy a producción falló
¿Por qué? → Tests E2E fallaron
¿Por qué? → Endpoint /users retorna 500
¿Por qué? → DB migration no corrió
¿Por qué? → Script de deploy no ejecuta migrations
¿Por qué? → Migrations fueron agregadas pero script no actualizado

Causa raíz: Proceso de deploy no incluye checklist de migrations.

Solución: Agregar migrations al pipeline automático + checklist.

Tip: No siempre son exactamente 5. Puede ser 3 o 7 según complejidad.

1.8 📊 Diagrama de Pareto (Regla 80/20)

Qué: Principio que dice que 80% de los efectos vienen de 20% de las causas.

Por qué: Priorizar esfuerzos en lo que más impacta.

Cuándo: Múltiples problemas, priorizar bugs, optimizar performance.

Cómo:

Listar todos los problemas/causas
Medir frecuencia o impacto de cada uno
Ordenar de mayor a menor
Calcular % acumulado
Identificar el 20% que causa el 80% del problema

Ejemplo - Bugs en producción (último mes):

Tipo Bug	Cantidad	% Acumulado
Validación inputs	45	45%
Timeouts API	30	75%
UI responsive	15	90%
Otros	10	100%

Insight: Enfocarse en validación de inputs (45%) y timeouts (30%) resuelve el 75% de bugs.

Herramientas: Excel, Google Sheets, Python (matplotlib).

1.9 💡 Lluvia de Ideas (Brainstorming)

Qué: Generación libre de ideas sin juicio inicial.

Por qué: Explorar todas las posibilidades, creatividad colectiva.

Cuándo: Buscar soluciones, diseño de features, naming, arquitectura.

Cómo:

Definir problema/objetivo claramente
Timeboxear (30 min)
Reglas: No juzgar, todas las ideas valen, cantidad > calidad
Una persona modera, otra anota todo
Agrupar ideas similares
Votar o priorizar después

Variantes:

Brainwriting: Escribir ideas en post-its en silencio (mejor para introverts)
Round Robin: Cada persona aporta una idea por turno
Starbursting: Generar preguntas en vez de respuestas

Herramientas: Miro, FigJam, post-its físicos.

1.10 🌳 Árbol Lógico de Fallos (FTA - Fault Tree Analysis)

Qué: Diagrama top-down que descompone un fallo en causas más básicas.

Por qué: Analizar fallos críticos de forma exhaustiva, encontrar puntos únicos de falla.

Cuándo: Sistemas críticos (salud, finanzas, aeroespacial), análisis de riesgo.

Cómo:

Identificar evento no deseado (top)
Preguntar: "¿Qué puede causar esto?"
Usar compuertas lógicas:
AND: Todas las causas deben ocurrir
OR: Cualquiera de las causas es suficiente
Descomponer hasta eventos básicos
Calcular probabilidades si se tienen datos

Ejemplo - Sistema caído:

          [Sistema Caído]
                |
          ----- OR -----
          |            |
   [App crashea]  [DB no responde]
          |            |
    ----- OR ----  --- OR ---
    |          |   |        |
[Memory]  [Bug]  [Disco] [Network]

Uso en software: Identificar single points of failure, diseñar redundancia.

1.11 📈 Diagrama de Flujo

Qué: Representación gráfica de proceso paso a paso.

Por qué: Visualizar proceso completo, identificar cuellos de botella, documentar.

Cuándo: Diseñar algoritmos, documentar procesos, onboarding.

Símbolos:

Óvalo: Inicio/Fin
Rectángulo: Proceso/Acción
Rombo: Decisión (if)
Paralelogramo: Input/Output
Flecha: Flujo

Ejemplo - Proceso de login:

(Inicio) → [Ingresar credenciales] → <¿Válidas?> 
                                          |
                                    No ----+---- Sí
                                    |            |
                            [Mostrar error]   [Login exitoso]
                                    |            |
                                    +------------+
                                          |
                                        (Fin)

Herramientas: draw.io, Lucidchart, Mermaid.

1.12 🔍 5W2H

Qué: Framework de 7 preguntas para definir problema/solución completamente.

Why: Asegurar que se consideraron todos los aspectos importantes.

When: Planning de features, escribir user stories, post-mortems.

Las 7 preguntas:

What (Qué): ¿Qué es el problema/solución?
Why (Por qué): ¿Por qué es importante resolverlo?
Who (Quién): ¿Quién está involucrado/afectado?
When (Cuándo): ¿Cuándo ocurre? ¿Deadline?
Where (Dónde): ¿Dónde ocurre? (Sistema, módulo, geografía)
How (Cómo): ¿Cómo lo resolveremos?
How much (Cuánto): ¿Cuánto costará en tiempo/dinero/esfuerzo?

Ejemplo - Feature: Export de reportes:

What: Permitir exportar dashboard a PDF
Why: Clientes necesitan compartir reportes con stakeholders
Who: Usuarios premium, equipo de analytics (desarrollo)
When: Sprint actual, crítico para Q1
Where: Módulo de reportes, botón en toolbar
How: Librería Puppeteer para generar PDF, queue para async
How much: 3 días desarrollo, 1 día QA, gratis para usuarios

1.13 🔄 PDCA (Plan-Do-Check-Act)

What: Ciclo iterativo de mejora continua.

Why: Mejora incremental basada en datos.

When: Implementar mejoras, optimizar procesos.

Fases:

Plan: Identificar problema, analizar, planear solución
Do: Implementar solución en pequeña escala (piloto)
Check: Medir resultados, comparar con objetivo
Act: Si funciona → estandarizar. Si no → ajustar y repetir

Ejemplo:

Plan: Reducir bugs en producción
Do: Implementar pre-commit hooks + code review obligatorio
Check: Medir bugs/semana durante 1 mes: -40%
Act: Estandarizar en todos los repos, documentar proceso

1.14 🎯 Matriz de Decisión

What: Tabla para comparar opciones según criterios ponderados.

Why: Decisiones objetivas, transparentes.

When: Elegir tecnología, priorizar features, seleccionar vendor.

How:

Listar opciones (columnas)
Listar criterios (filas)
Asignar peso a cada criterio (1-5)
Calificar cada opción en cada criterio (1-10)
Multiplicar peso × calificación
Sumar total por opción
Mayor puntaje = mejor opción

Ejemplo - Elegir framework frontend:

Criterio	Peso	React	Vue	Angular
Performance	5	8×5=40	9×5=45	7×5=35
Curva aprendizaje	3	7×3=21	9×3=27	5×3=15
Ecosistema	4	10×4=40	7×4=28	8×4=32
Total	-	101	100	82

Resultado: React ligeramente mejor que Vue, Angular tercero.

1.15 🚫 Errores Comunes

Error	Problema	Solución
Saltar al "cómo" sin el "por qué"	Resolver síntoma, no causa	Usar 5 Porqués primero
Análisis parálisis	Sobre-analizar sin actuar	Timeboxear, decidir con datos disponibles
Sesgo de confirmación	Buscar solo evidencia que confirme hipótesis	Buscar activamente evidencia contraria
Soluciones sin medir	No saber si funcionó	Definir métricas de éxito antes
No documentar aprendizajes	Repetir mismos errores	Post-mortem blameless, runbooks

1. Herramientas de Análisis de Problemas

1.1 🌳 Issue Trees (Árbol de Problemas)

1.2 🔍 MECE Principle

1.3 ✅ Phoenix Checklist

1.3.1 1. El Problema

1.3.2 2. Definición

1.3.3 3. Soluciones

1.3.4 4. Plan

1.3.5 5. Revisión

1.4 ⚠️ AMFE (Análisis de Modos de Fallo y Efectos)

1.5 🎯 ¿Por qué usar herramientas estructuradas?

1.6 🐟 Diagrama de Ishikawa (Espina de Pescado)

1.7 ❓ 5 Porqués

1.8 📊 Diagrama de Pareto (Regla 80/20)

1.9 💡 Lluvia de Ideas (Brainstorming)

1.10 🌳 Árbol Lógico de Fallos (FTA - Fault Tree Analysis)

1.11 📈 Diagrama de Flujo

1.12 🔍 5W2H

1.13 🔄 PDCA (Plan-Do-Check-Act)

1.14 🎯 Matriz de Decisión

1.15 🚫 Errores Comunes

1.16 📚 Recursos