Laboratorio de Ejecución · Sesión 03 · ANDES 360

Criterio Ejecutivo:
Decidir con Rigor.

De la alucinación al análisis verificable.
4 técnicas para que la IA razone con estructura, adopte tu estándar, ataque tus ideas y rastree información con trazabilidad.

4 Ejercicios Gobernanza de IA Universidad ANDES 360

Inicializar Laboratorio

Ejercicio 01

Chain of Thought — Manual CoT

Obligar a la IA a desglosar su razonamiento paso a paso evita que salte directamente a una conclusión genérica. Más importante: hace visible la lógica antes de que llegues al output, para que puedas auditarla. Este es el antídoto directo contra la alucinación en decisiones de alta complejidad.

Zero-Shot CoT vs. Manual CoT — la distinción que importa

Zero-Shot CoT es simplemente agregar "piensa paso a paso" al final del prompt. Funciona para problemas simples, pero la IA elige el marco de razonamiento por sí sola — y ese marco puede ser inadecuado para tu contexto.

Manual CoT es dictar explícitamente el marco mental que debe seguir: qué analizar primero, qué considerar en segundo lugar, y qué restricción imponer antes de emitir la conclusión. Tú controlas el proceso de razonamiento, no solo el resultado.

Ejecución — Prompt de Alto Nivel

El prompt de Manual CoT 5–8 min

01_chain_of_thought.md Copiar

Actúa como Consultor Estratégico de Educación Superior. ANDES 360 está evaluando lanzar un nuevo programa de Maestría en Economía Aplicada. Antes de darme una recomendación, sigue estrictamente esta cadena de pensamiento: Paso 1: Identifica las 3 condiciones del entorno que hacen viable este lanzamiento hoy (mercado laboral, demanda estudiantil, competencia regional). Paso 2: Para cada condición favorable, plantea un escenario concreto en que esa condición se revierta en los primeros 18 meses del programa. Paso 3: Para cada escenario de reversión, identifica: — ¿Qué indicador operativo de ANDES 360 lo detectaría primero? — ¿Con cuánto tiempo de anticipación podría reaccionar la institución? (No inventes cifras financieras. Identifica indicadores y tiempos de respuesta institucional.) Paso 4: Solo después de completar los pasos 1 al 3, formula una recomendación: Lanzar / Posponer / No lanzar Acompaña la recomendación con las 3 condiciones que deben cumplirse antes de tomar la decisión final.

Tu output Pega aquí el análisis generado por la IA — los 4 pasos más la recomendación final

Momento de enseñanza

Después de ver el output, preguntarle al grupo: "¿En qué paso confían más en la respuesta? ¿En cuál menos?" — esa conversación ancla el concepto de alucinación en la práctica. El Paso 3 fue diseñado deliberadamente sin pedirle cifras: pide indicadores y tiempos, que la IA puede razonar sin fabricar. Eso es el control.

CoT no elimina el riesgo de alucinación — lo hace visible y auditable. Un razonamiento que muestra sus pasos puede ser revisado. Una conclusión directa, no.

Ejercicio 02

Few-Shot Prompting — Calibrar el Estándar

Sin ejemplos, la IA adivina cuál es tu estándar de comunicación. Con ejemplos propios, adopta exactamente el tono, la densidad de información y el formato que ya tienes definido. La IA deja de improvisar y empieza a replicar tu criterio institucional.

Racional

El mismo dato financiero o académico produce outputs radicalmente distintos según si la IA tiene o no tiene ejemplos del estándar que buscas. Sin ellos, genera texto informativo pero genérico — correcto, pero no usable directamente.

Los ejemplos no son decoración: son el programa. Cada Input/Output que agregas le enseña a la IA el nivel de síntesis, el tono de alerta y la estructura de acción que tu Consejo ya espera. Con dos ejemplos bien construidos, no hay margen de error en el formato.

Ejecución — Prompt con Ejemplos Contrastantes

El prompt completo con ejemplos 5–7 min

02_few_shot_consejo.md Copiar

Tu tarea es transformar datos crudos de gestión académica en resúmenes ejecutivos para el Consejo de Facultad de ANDES 360, siguiendo el estándar de comunicación institucional que te muestro. — Ejemplo 1 — Input: La tasa de deserción en primer semestre subió del 12% al 18% este año. Los datos de bienestar muestran que el 60% de los estudiantes que abandonaron no había tenido ningún contacto con los servicios de apoyo disponibles. Output (Estándar Consejo): Alerta deserción: Incremento de 6 puntos porcentuales en primer semestre. Factor determinante: 60% de los casos sin contacto previo con bienestar. Acción requerida: Protocolo de activación temprana antes de semana 4. — Ejemplo 2 — Input: El programa de doble titulación con Universidad del Pacífico superó la meta de inscripciones en un 20%, pero el costo operativo por estudiante fue un 30% más alto de lo proyectado por requerimientos de homologación no anticipados. Output (Estándar Consejo): Oportunidad doble titulación: Demanda superior a meta (+20%). Riesgo: Estructura de costos subestimada (+30% por homologación). Acción requerida: Revisión del modelo financiero antes de abrir convocatoria siguiente cohorte. — Tarea Actual — Input: [Dictar aquí en voz alta el párrafo sobre el incremento en costos de nómina docente y la dificultad para retener profesores de planta en el área de métodos cuantitativos.] Output (Estándar Consejo):

Tu output Pega aquí el resumen ejecutivo generado en el formato del Consejo

Activación en sala

Pedir a dos participantes que dicten en voz alta el párrafo de input — que sea información real o verosímil para ellos. La reacción al ver el output adoptando exactamente su registro institucional es el momento de mayor impacto del ejercicio. La IA no fue programada para eso: aprendió del ejemplo.

Los ejemplos son el programa. Cada Input/Output que agregas le enseña a la IA tu criterio institucional. Con dos ejemplos bien construidos, no hay margen de error en el formato.

Ejercicio 03

Red Teaming — El Abogado del Diablo

Configurar a la IA con múltiples perspectivas hostiles para someter a prueba de estrés una decisión directiva antes de ejecutarla. Un comité de riesgos instantáneo — sin agenda política, sin relaciones que cuidar, sin filtros de cortesía.

Antídoto directo contra la sycophancy

La IA por defecto valida. Si le presentas una propuesta, tenderá a encontrar sus fortalezas antes que sus fisuras. Esto no es un error técnico — es comportamiento aprendido. Red Teaming invierte el comportamiento por defecto: en lugar de validar, atacar. En lugar de ser cortés, ser implacable. La instrucción "Sé implacable. No seas cortés." no es retórica — es una restricción técnica que rompe el modo adulación.

Tres Perspectivas Hostiles

El Empleador Escéptico

Mercado laboral · Reputación

Argumenta cómo la propuesta daña la empleabilidad de los egresados y debilita la reputación del programa frente a sus competidores regionales.

El Evaluador de Acreditación

Estándares · Riesgo institucional

Identifica los puntos que generarían observaciones críticas en el próximo proceso de acreditación internacional. Cita los estándares en riesgo.

El Estudiante Afectado

Equidad · Impacto real

Articula el caso de un estudiante de bajos recursos para quien la propuesta, que parece flexible, cierra puertas que antes estaban abiertas.

Ejecución — Prompt de Red Teaming

El prompt completo 8–10 min

03_red_teaming_andes360.md Copiar

Vamos a hacer un ejercicio de Red Teaming sobre la siguiente propuesta institucional de ANDES 360: "Eliminar los requisitos de idioma extranjero obligatorio para todos los programas de pregrado, reemplazándolos por electivas de libre elección." Asume tres roles distintos de manera consecutiva: Rol 1 — El Empleador Escéptico: Encuentra el argumento más fuerte por el que esta decisión daña la empleabilidad de los egresados y debilita la reputación del programa en el mercado laboral regional. Rol 2 — El Evaluador de Acreditación: Identifica los puntos de esta propuesta que generarían observaciones críticas en el próximo proceso de acreditación internacional. Cita los estándares que estarían en riesgo. Rol 3 — El Estudiante Afectado: Articula el caso de un estudiante de bajos recursos para quien esta política —que parece flexible— en realidad cierra puertas que antes estaban abiertas. Sé implacable. No seas cortés. No busques el equilibrio. Termina con las 3 vulnerabilidades críticas que la propuesta debe resolver antes de presentarse al Consejo Académico.

Tu output Pega aquí el análisis de Red Teaming — tres roles + tres vulnerabilidades críticas

Pregunta de cierre

"¿Alguno de estos tres ataques lo hubieran anticipado solos antes de llegar al Consejo?" — La respuesta honesta es la que instala la herramienta. Red Teaming no reemplaza el juicio directivo; le da al directivo argumentos que no habría construido sin presión adversarial.

Red Teaming convierte a la IA en un comité de riesgos instantáneo — uno que no tiene agenda política, no cuida relaciones y no filtra lo incómodo. Para directivos que deben defender propuestas ante órganos colegiados, esto es práctica real antes de que sea necesario.

Ejercicio 04

Deep Research vs. Búsqueda Tradicional

El contraste no es solo de velocidad — es de utilidad real para la decisión. Una búsqueda estándar entrega datos que habría que verificar manualmente durante días. Deep Research entrega un mapa triangulado, listo para debatir en reunión de facultad. La clave: cita sus fuentes, lo que te devuelve la capacidad de auditar antes de actuar.

Fase 1 · Búsqueda Estándar

Google o IA sin navegación profunda

Rankings genéricos sin fecha verificable
Páginas institucionales de marketing
Información desactualizada o sin fuente
Sin triangulación entre bases de datos
Requiere semanas de verificación manual

Fase 2 · Deep Research

Rastreo profundo con trazabilidad

Cruza múltiples bases públicas
Cita cada fuente con fecha
Detecta brechas y casos de fracaso
Señala datos no verificables en lugar de estimarlos
Entregable directo para reunión de facultad

Ejecución — Dos Fases

Fase 1 — Búsqueda estándar 3 minutos

04a_busqueda_estandar.md Copiar

¿Cómo se posicionan los programas de Economía en universidades latinoamericanas en términos de empleabilidad y acreditación internacional?

Observación ¿Qué tipo de información entrega? ¿Tiene fechas, fuentes, triangulación? Anota lo que falta.

Fase 2 — Deep Research estructurado 5–12 min

04b_deep_research.md Copiar

Realiza una investigación profunda sobre el posicionamiento competitivo de los programas de Economía en universidades de América Latina. Cruza las siguientes fuentes: rankings QS y THE más recientes, reportes de empleabilidad de graduados disponibles públicamente, y declaraciones oficiales sobre acreditaciones internacionales (AACSB, AMBA, EQUIS) de los últimos 24 meses. Identifica: 1. Qué instituciones han mejorado su posición y qué cambio curricular o de facultad lo explica. 2. Qué brechas de formación mencionan los empleadores con mayor frecuencia al evaluar egresados de programas de Economía. 3. Casos documentados de programas que hayan perdido acreditación o posición — y las causas registradas. Cita cada fuente con fecha. Si un dato no tiene fuente verificable, señálalo explícitamente en lugar de estimarlo.

Tu output Pega aquí el análisis de Deep Research — con fuentes citadas y datos verificables identificados

Nota de facilitación — Logística

Deep Research puede tomar entre 5 y 12 minutos según la plataforma. Tener un resultado pre-generado como respaldo para no perder el ritmo. Mostrar el proceso en curso mientras se discute la anatomía del prompt — la espera visible es parte de la demostración: el tiempo es el precio de la profundidad.

La conexión con la sesión: Deep Research no alucina menos por ser más lento. Alucina menos porque cita sus fuentes, devolviendo al directivo la capacidad de auditar la información antes de tomar la decisión.

Usos institucionales para ANDES 360

Proceso de Acreditación

Benchmarking de pares institucionales con fuentes verificables para el informe de autoevaluación.

Reforma Curricular

Evidencia sobre qué brechas reportan los empleadores antes de rediseñar el perfil de egreso.

Nuevos Programas

Análisis de mercado y competencia antes de proponer un lanzamiento al Consejo de Facultad.

El contraste entre las dos fases no es sobre herramientas — es sobre la calidad de la evidencia que respalda la decisión. Un directivo que llega al Consejo con Deep Research llega con fuentes. Uno que llega con búsqueda estándar llega con estimaciones.

Secuencia completa

CoT

Control del proceso de razonamiento

Few-Shot

Control del formato y el estándar

Red Teaming

Control de la sycophancy

Deep Research

Control de las fuentes

De controlar el razonamiento, al formato, a la honestidad, a la evidencia. Cuatro controles, un solo principio: la IA que auditas vale más que la IA que simplemente usas.

Criterio Ejecutivo:Decidir con Rigor.

Chain of Thought — Manual CoT

Few-Shot Prompting — Calibrar el Estándar

Red Teaming — El Abogado del Diablo

Deep Research vs. Búsqueda Tradicional

Criterio Ejecutivo:
Decidir con Rigor.