De la alucinación al análisis verificable.
4 técnicas para que la IA razone con estructura, adopte tu estándar, ataque tus ideas y rastree información con trazabilidad.
4 Ejercicios
Gobernanza de IA
Universidad ANDES 360
La IA por defecto te da la razón, salta a conclusiones y rellena vacíos con datos inventados. Estos cuatro ejercicios son los controles que lo impiden. Cada uno es un antídoto a un comportamiento específico que ya conoces de la teoría.
Ejercicio 01
Chain of Thought — Manual CoT
Obligar a la IA a desglosar su razonamiento paso a paso evita que salte directamente a una conclusión genérica. Más importante: hace visible la lógica antes de que llegues al output, para que puedas auditarla. Este es el antídoto directo contra la alucinación en decisiones de alta complejidad.
Zero-Shot CoT vs. Manual CoT — la distinción que importa
Zero-Shot CoT es simplemente agregar "piensa paso a paso" al final del prompt. Funciona para problemas simples, pero la IA elige el marco de razonamiento por sí sola — y ese marco puede ser inadecuado para tu contexto.
Manual CoT es dictar explícitamente el marco mental que debe seguir: qué analizar primero, qué considerar en segundo lugar, y qué restricción imponer antes de emitir la conclusión. Tú controlas el proceso de razonamiento, no solo el resultado.
Ejecución — Prompt de Alto Nivel
1
El prompt de Manual CoT
5–8 min
01_chain_of_thought.mdCopiar
Actúa como Consultor Estratégico de Educación Superior.ANDES 360 está evaluando lanzar un nuevo programa
de Maestría en Economía Aplicada.Antes de darme una recomendación, sigue estrictamente
esta cadena de pensamiento:Paso 1: Identifica las 3 condiciones del entorno
que hacen viable este lanzamiento hoy
(mercado laboral, demanda estudiantil,
competencia regional).
Paso 2: Para cada condición favorable, plantea
un escenario concreto en que esa condición
se revierta en los primeros 18 meses del programa.
Paso 3: Para cada escenario de reversión, identifica:
— ¿Qué indicador operativo de ANDES 360
lo detectaría primero?
— ¿Con cuánto tiempo de anticipación podría
reaccionar la institución?
(No inventes cifras financieras. Identifica
indicadores y tiempos de respuesta institucional.)Paso 4: Solo después de completar los pasos 1 al 3,
formula una recomendación:
Lanzar / Posponer / No lanzar
Acompaña la recomendación con las 3 condiciones
que deben cumplirse antes de tomar la decisión final.
Tu outputPega aquí el análisis generado por la IA — los 4 pasos más la recomendación final
Momento de enseñanza
Después de ver el output, preguntarle al grupo: "¿En qué paso confían más en la respuesta? ¿En cuál menos?" — esa conversación ancla el concepto de alucinación en la práctica. El Paso 3 fue diseñado deliberadamente sin pedirle cifras: pide indicadores y tiempos, que la IA puede razonar sin fabricar. Eso es el control.
CoT no elimina el riesgo de alucinación — lo hace visible y auditable. Un razonamiento que muestra sus pasos puede ser revisado. Una conclusión directa, no.
Ejercicio 02
Few-Shot Prompting — Calibrar el Estándar
Sin ejemplos, la IA adivina cuál es tu estándar de comunicación. Con ejemplos propios, adopta exactamente el tono, la densidad de información y el formato que ya tienes definido. La IA deja de improvisar y empieza a replicar tu criterio institucional.
Racional
El mismo dato financiero o académico produce outputs radicalmente distintos según si la IA tiene o no tiene ejemplos del estándar que buscas. Sin ellos, genera texto informativo pero genérico — correcto, pero no usable directamente.
Los ejemplos no son decoración: son el programa. Cada Input/Output que agregas le enseña a la IA el nivel de síntesis, el tono de alerta y la estructura de acción que tu Consejo ya espera. Con dos ejemplos bien construidos, no hay margen de error en el formato.
Ejecución — Prompt con Ejemplos Contrastantes
1
El prompt completo con ejemplos
5–7 min
02_few_shot_consejo.mdCopiar
Tu tarea es transformar datos crudos de gestión
académica en resúmenes ejecutivos para el Consejo
de Facultad de ANDES 360, siguiendo el estándar
de comunicación institucional que te muestro.
— Ejemplo 1 —Input: La tasa de deserción en primer semestre
subió del 12% al 18% este año. Los datos de
bienestar muestran que el 60% de los estudiantes
que abandonaron no había tenido ningún contacto
con los servicios de apoyo disponibles.
Output (Estándar Consejo):Alerta deserción: Incremento de 6 puntos porcentuales
en primer semestre. Factor determinante: 60% de los
casos sin contacto previo con bienestar.
Acción requerida: Protocolo de activación temprana
antes de semana 4.— Ejemplo 2 —Input: El programa de doble titulación con Universidad
del Pacífico superó la meta de inscripciones en un 20%,
pero el costo operativo por estudiante fue un 30% más
alto de lo proyectado por requerimientos de homologación
no anticipados.
Output (Estándar Consejo):Oportunidad doble titulación: Demanda superior a meta
(+20%). Riesgo: Estructura de costos subestimada (+30%
por homologación). Acción requerida: Revisión del modelo
financiero antes de abrir convocatoria siguiente cohorte.— Tarea Actual —Input:[Dictar aquí en voz alta el párrafo sobre
el incremento en costos de nómina docente y la
dificultad para retener profesores de planta
en el área de métodos cuantitativos.]Output (Estándar Consejo):
Tu outputPega aquí el resumen ejecutivo generado en el formato del Consejo
Activación en sala
Pedir a dos participantes que dicten en voz alta el párrafo de input — que sea información real o verosímil para ellos. La reacción al ver el output adoptando exactamente su registro institucional es el momento de mayor impacto del ejercicio. La IA no fue programada para eso: aprendió del ejemplo.
Los ejemplos son el programa. Cada Input/Output que agregas le enseña a la IA tu criterio institucional. Con dos ejemplos bien construidos, no hay margen de error en el formato.
Ejercicio 03
Red Teaming — El Abogado del Diablo
Configurar a la IA con múltiples perspectivas hostiles para someter a prueba de estrés una decisión directiva antes de ejecutarla. Un comité de riesgos instantáneo — sin agenda política, sin relaciones que cuidar, sin filtros de cortesía.
Antídoto directo contra la sycophancy
La IA por defecto valida. Si le presentas una propuesta, tenderá a encontrar sus fortalezas antes que sus fisuras. Esto no es un error técnico — es comportamiento aprendido. Red Teaming invierte el comportamiento por defecto: en lugar de validar, atacar. En lugar de ser cortés, ser implacable. La instrucción "Sé implacable. No seas cortés." no es retórica — es una restricción técnica que rompe el modo adulación.
Tres Perspectivas Hostiles
1
El Empleador Escéptico
Mercado laboral · Reputación
Argumenta cómo la propuesta daña la empleabilidad de los egresados y debilita la reputación del programa frente a sus competidores regionales.
2
El Evaluador de Acreditación
Estándares · Riesgo institucional
Identifica los puntos que generarían observaciones críticas en el próximo proceso de acreditación internacional. Cita los estándares en riesgo.
3
El Estudiante Afectado
Equidad · Impacto real
Articula el caso de un estudiante de bajos recursos para quien la propuesta, que parece flexible, cierra puertas que antes estaban abiertas.
Ejecución — Prompt de Red Teaming
1
El prompt completo
8–10 min
03_red_teaming_andes360.mdCopiar
Vamos a hacer un ejercicio de Red Teaming sobre
la siguiente propuesta institucional de ANDES 360:
"Eliminar los requisitos de idioma extranjero
obligatorio para todos los programas de pregrado,
reemplazándolos por electivas de libre elección."Asume tres roles distintos de manera consecutiva:Rol 1 — El Empleador Escéptico:
Encuentra el argumento más fuerte por el que
esta decisión daña la empleabilidad de los
egresados y debilita la reputación del programa
en el mercado laboral regional.
Rol 2 — El Evaluador de Acreditación:
Identifica los puntos de esta propuesta que
generarían observaciones críticas en el próximo
proceso de acreditación internacional.
Cita los estándares que estarían en riesgo.Rol 3 — El Estudiante Afectado:
Articula el caso de un estudiante de bajos
recursos para quien esta política —que parece
flexible— en realidad cierra puertas que
antes estaban abiertas.
Sé implacable. No seas cortés.
No busques el equilibrio.
Termina con las 3 vulnerabilidades críticas
que la propuesta debe resolver antes de
presentarse al Consejo Académico.
Tu outputPega aquí el análisis de Red Teaming — tres roles + tres vulnerabilidades críticas
Pregunta de cierre
"¿Alguno de estos tres ataques lo hubieran anticipado solos antes de llegar al Consejo?" — La respuesta honesta es la que instala la herramienta. Red Teaming no reemplaza el juicio directivo; le da al directivo argumentos que no habría construido sin presión adversarial.
Red Teaming convierte a la IA en un comité de riesgos instantáneo — uno que no tiene agenda política, no cuida relaciones y no filtra lo incómodo. Para directivos que deben defender propuestas ante órganos colegiados, esto es práctica real antes de que sea necesario.
Ejercicio 04
Deep Research vs. Búsqueda Tradicional
El contraste no es solo de velocidad — es de utilidad real para la decisión. Una búsqueda estándar entrega datos que habría que verificar manualmente durante días. Deep Research entrega un mapa triangulado, listo para debatir en reunión de facultad. La clave: cita sus fuentes, lo que te devuelve la capacidad de auditar antes de actuar.
Fase 1 · Búsqueda Estándar
Google o IA sin navegación profunda
Rankings genéricos sin fecha verificable
Páginas institucionales de marketing
Información desactualizada o sin fuente
Sin triangulación entre bases de datos
Requiere semanas de verificación manual
Fase 2 · Deep Research
Rastreo profundo con trazabilidad
Cruza múltiples bases públicas
Cita cada fuente con fecha
Detecta brechas y casos de fracaso
Señala datos no verificables en lugar de estimarlos
Entregable directo para reunión de facultad
Ejecución — Dos Fases
1
Fase 1 — Búsqueda estándar
3 minutos
04a_busqueda_estandar.mdCopiar
¿Cómo se posicionan los programas de Economía
en universidades latinoamericanas en términos
de empleabilidad y acreditación internacional?
Observación¿Qué tipo de información entrega? ¿Tiene fechas, fuentes, triangulación? Anota lo que falta.
2
Fase 2 — Deep Research estructurado
5–12 min
04b_deep_research.mdCopiar
Realiza una investigación profunda sobre el
posicionamiento competitivo de los programas
de Economía en universidades de América Latina.
Cruza las siguientes fuentes: rankings QS y THE
más recientes, reportes de empleabilidad de
graduados disponibles públicamente, y declaraciones
oficiales sobre acreditaciones internacionales
(AACSB, AMBA, EQUIS) de los últimos 24 meses.Identifica:
1. Qué instituciones han mejorado su posición
y qué cambio curricular o de facultad lo explica.
2. Qué brechas de formación mencionan los empleadores
con mayor frecuencia al evaluar egresados de
programas de Economía.
3. Casos documentados de programas que hayan perdido
acreditación o posición — y las causas registradas.
Cita cada fuente con fecha.
Si un dato no tiene fuente verificable,
señálalo explícitamente en lugar de estimarlo.
Tu outputPega aquí el análisis de Deep Research — con fuentes citadas y datos verificables identificados
Nota de facilitación — Logística
Deep Research puede tomar entre 5 y 12 minutos según la plataforma. Tener un resultado pre-generado como respaldo para no perder el ritmo. Mostrar el proceso en curso mientras se discute la anatomía del prompt — la espera visible es parte de la demostración: el tiempo es el precio de la profundidad.
La conexión con la sesión: Deep Research no alucina menos por ser más lento. Alucina menos porque cita sus fuentes, devolviendo al directivo la capacidad de auditar la información antes de tomar la decisión.
Usos institucionales para ANDES 360
Proceso de Acreditación
Benchmarking de pares institucionales con fuentes verificables para el informe de autoevaluación.
Reforma Curricular
Evidencia sobre qué brechas reportan los empleadores antes de rediseñar el perfil de egreso.
Nuevos Programas
Análisis de mercado y competencia antes de proponer un lanzamiento al Consejo de Facultad.
El contraste entre las dos fases no es sobre herramientas — es sobre la calidad de la evidencia que respalda la decisión. Un directivo que llega al Consejo con Deep Research llega con fuentes. Uno que llega con búsqueda estándar llega con estimaciones.
Secuencia completa
CoT
Control del proceso de razonamiento
Few-Shot
Control del formato y el estándar
Red Teaming
Control de la sycophancy
Deep Research
Control de las fuentes
De controlar el razonamiento, al formato, a la honestidad, a la evidencia. Cuatro controles, un solo principio: la IA que auditas vale más que la IA que simplemente usas.