Tarea 2: La “caja” en ciencia y un paradigma actual en Deep Learning (CNN + optimización por gradiente
Cuando se dice que para ser creativo hay que pensar “fuera de la caja”, en ciencia la frase suena bien… pero es engañosa. La mayor parte del conocimiento científico no se produce inventando ocurrencias sin restricción, sino resolviendo problemas dentro de un marco compartido. La creatividad científica existe, pero suele aparecer como innovación disciplinada: explorar “los rincones de la caja” más que huir de ella.
1) ¿Qué es realmente “la caja” en ciencia?
En el sentido que propone Thomas Kuhn, la “caja” se corresponde con el paradigma: un acuerdo (explícito e implícito) dentro de una comunidad científica sobre:
- qué preguntas son legítimas,
- qué herramientas y métodos son válidos,
- cómo se interpreta la evidencia,
- qué cuenta como explicación satisfactoria,
- qué problemas “merecen la pena” (y cuáles se consideran ruido o irrelevantes).
Mientras un paradigma está vigente, la disciplina vive un periodo de ciencia normal: la gente no intenta refutarlo todo el rato, sino extenderlo, afinarlo y aplicar sus reglas a nuevos casos. En este marco, el trabajo científico es acumulativo y altamente productivo.
Kuhn insiste en algo importante: no hay investigación sin contraejemplos (anomalías). La diferencia entre ciencia normal y crisis no es que una tenga “errores” y la otra no, sino cómo se interpretan: en ciencia normal, las anomalías suelen tratarse como problemas locales (medición, modelo incompleto, caso especial); en crisis, se vuelven persistentes y centrales, y el paradigma empieza a parecer insuficiente.
2) Paradigma de mi disciplina: el “pipeline” del Deep Learning (CNN + optimización por gradiente)
Un paradigma muy claro (y exitoso) en aprendizaje automático actual es el que podríamos llamar:
Representación aprendida + optimización por gradiente + evaluación empírica.
En visión por computador, su versión típica es:
CNN → capas de pooling/normalización → entrenamiento con backprop + SGD/Adam → validación en benchmarks.
Este paradigma define la “caja” de manera práctica:
1. Qué problemas importan: clasificación, detección, segmentación, etc., medidos con métricas estándar y conjuntos de datos de referencia.
2. Qué cuenta como avance: mejoras de accuracy/robustez/eficiencia en condiciones comparables (mismo dataset, splits, protocolo).
3. Qué métodos son “naturales”: arquitecturas modulares (convoluciones, activaciones, normalización, pooling) y aprendizaje ajustando parámetros mediante gradientes.
4. Qué tipo de creatividad se premia: nuevas capas, pérdidas, regularizaciones, trucos de entrenamiento o cambios arquitectónicos… siempre evaluables de forma replicable.
La consecuencia es que la mayor parte del trabajo “serio” ocurre dentro de ese marco: no es “libre”, pero es fértil, porque todos comparten reglas del juego y pueden comparar resultados.
3) Ciencia normal dentro del paradigma: “explorar los rincones de la caja”
En este paradigma, “explorar rincones” es exactamente lo que hacen miles de trabajos:
- variantes de arquitecturas (bloques residuales, atención, etc.),
- estrategias de entrenamiento (data augmentation, schedulers),
- funciones de pérdida,
- y, muy relevante aquí, funciones de agregación/pooling para mejorar robustez o conservar información.
Esta exploración es ciencia normal kuhniana: no pretende “derribar” el enfoque, sino resolver rompecabezas (“puzzles”) dentro de sus supuestos.
4) Anomalías (lo que empieza a tensar la caja)
Incluso en un paradigma muy exitoso aparecen tensiones recurrentes:
- fragilidad a cambios de distribución (domain shift),
- vulnerabilidad a perturbaciones (adversarial o ruido),
- falta de interpretabilidad/explicabilidad,
- dependencia de datos masivos y coste energético,
- límites en generalización robusta.
En ciencia normal, muchas de estas anomalías se intentan “absorber” con parches: mejores regularizaciones, arquitecturas más grandes, augmentations, etc. Pero si algunas anomalías se vuelven demasiado persistentes o costosas, el campo puede entrar en algo parecido a una crisis (al menos local), donde se vuelven atractivos enfoques alternativos.
5) ¿Qué sería “pensar fuera de la caja” aquí?
En el marco de Kuhn, “fuera de la caja” no es “cualquier idea loca”, sino proponer o adoptar un marco alternativo que:
- redefine qué problemas son centrales,
- cambia qué evidencia se considera convincente,
- ofrece nuevas herramientas,
- y, crucialmente, funciona mejor en anomalías importantes.
Por ejemplo, dentro de ML se han propuesto “micro-replanteamientos” del paradigma (más énfasis en causalidad, en incertidumbre bien calibrada, en modelos híbridos simbólico-estadísticos, o en evaluaciones centradas en robustez real). No todos son revoluciones completas, pero sí intentos de “salirse” parcialmente de la caja dominante.
6) Cierre: por qué esta metáfora importa
La metáfora de la caja es útil si se entiende bien: no es una prisión, sino un andamiaje colectivo que hace posible la productividad científica. Y también es un recordatorio de que la ciencia no avanza solo por ideas, sino por comunidades que acuerdan estándares de prueba, métodos y problemas valiosos.
En ese sentido, la creatividad científica suele tener dos formas:
- Creatividad “dentro de la caja” (ciencia normal): explotar el paradigma con nuevas piezas y mejores soluciones.
- Creatividad “cambiando la caja” (revolución): cuando una alternativa explica mejor lo que el paradigma ya no maneja bien.
Y la mayor parte del tiempo, sí: estamos explorando rincones.
Muy buen trabajo, y muy bien escrito. El punto 6 me ha encantado
ResponderEliminar