Alfabetización en IA
¿Qué es la IA?
Delimitamos qué cuenta como IA y qué no, distinguiéndola de la programación tradicional y de otros sistemas automáticos. Recorremos la relación entre IA, machine learning y deep learning para ordenar el vocabulario antes de entrar en detalle.
Historia
Hilo conductor de Turing a hoy: prueba de Turing, inviernos de la IA, surgimiento del ML y salto reciente con redes profundas. Mostramos que cada gran avance respondió a un problema técnico concreto, para evitar tanto el hype como el escepticismo.
Impacto Ambiental
Analizamos el costo energético y de cómputo de entrenar y desplegar modelos a gran escala. Discutimos huella de carbono, consumo de agua y la asimetría entre quienes producen y quienes sufren ese impacto.
Ética
Abordamos sesgos, deepfakes, privacidad y responsabilidad a partir de casos reales (COMPAS, Arup, Air Canada, NYT vs. OpenAI). Introducimos el marco regulatorio actual (EU AI Act y discusiones locales) como contexto del trabajo profesional con IA.
Utilización de Modelos
Criterios para elegir un modelo según la tarea, los datos disponibles y las restricciones del contexto. Práctica guiada de prompting y parámetros de inferencia (temperatura, top-p) en un entorno tipo Google AI Studio.
Machine Learning
Conceptos clave
Idea central: aprender una función a partir de ejemplos etiquetados para generalizar a datos nuevos. Vocabulario base: dataset, features, label, instancia y división entre entrenamiento y prueba.
Modelos
Recorrido por familias representativas: regresión lineal y logística, árboles de decisión y k-NN. Mostramos que distintos modelos imponen distintos sesgos inductivos y conviene elegir según el problema.
Métricas de evaluación
Accuracy y matriz de confusión con sus cuatro cuadrantes (VP, VN, FP, FN) como punto de partida. Precision, recall y F1 para entender que ninguna métrica única captura todos los tipos de error.
Limitaciones Estructurales
Overfitting, underfitting y el problema de generalizar más allá del conjunto de entrenamiento. Sesgos en los datos, fugas de información (data leakage) y supuestos que el modelo no puede cuestionar por sí mismo.
Actividad/Tarea
Neural Networks
Conceptos clave
Idea central: una red neuronal es una función parametrizada que compone neuronas en capas y ajusta sus pesos a partir de datos para generalizar.
Neurona
Unidad mínima: una suma ponderada de las entradas más un sesgo, pasada por una función de activación que decide la salida. Límite fundamental: un perceptrón simple solo separa clases linealmente (no resuelve XOR), y eso motiva apilar neuronas en capas.
Arquitecturas: de shallow a deep
Una sola capa oculta basta para aproximar cualquier función continua (teorema de aproximación universal), pero sin garantías sobre cuántas unidades hacen falta ni sobre poder entrenarla. La profundidad aporta eficiencia y representaciones jerárquicas: rasgos simples en las primeras capas, conceptos abstractos en las últimas.
¿Cómo aprende una red?
Ciclo de cuatro pasos: predecir (forward pass), medir el error (pérdida), calcular gradientes (backpropagation) y ajustar pesos (descenso por gradiente con tasa η). Se repite por épocas: backpropagation calcula el gradiente, mientras que la optimización es la que efectivamente mueve los pesos.
Tipos de Redes Neuronales
No hay una arquitectura única: se elige según el dato y el problema (MLP para tabular, CNN para imágenes, RNN/LSTM para secuencias). Los Transformers, basados en autoatención, son el estado del arte y la base de los grandes modelos de lenguaje (LLMs).
Limitaciones y cuidados
Sobreajuste, subajuste y el desafío de generalizar más allá del conjunto de entrenamiento. Sesgos en los datos y confusiones frecuentes a evitar: perceptrón ≠ neurona moderna, y backpropagation ≠ descenso por gradiente.