
En los últimos dos años, los debates sobre la IA han girado casi exclusivamente en torno a la potencia informática: GPU insuficientes, capacidad informática insuficiente y clústeres inadecuados.Pero este informe enfatiza repetidamente un punto clave: lo que realmente frena a la IA no es la incapacidad de computar, sino la incapacidad para mover datos.
A medida que el tamaño de los modelos se ha ampliado de decenas de megabytes a varios gigabytes, los componentes más ocupados del sistema ya no son las unidades informáticas, sino la memoria y los buses.En otras palabras, el cuello de botella de la IA está cambiando silenciosamente: de un “problema informático” a una propuesta más fundamental: una problema de almacenamiento.
Esto ha llevado a una dirección más radical: si el movimiento de datos es el mayor gasto, ¿por qué no dejar que se realice la computación? directamente en el almacenamiento?
Una arquitectura llamada Compute-in-Memory (CIM) está intentando reescribir esta lógica desde la raíz.La clave para habilitarlo no es un nodo de proceso más avanzado, sino un tipo de tecnología que no ha sido tan “convencional” en el pasado.memoria analógica.
Este artículo nos invita a repensar una pregunta crítica: a medida que la IA evoluciona hasta donde está hoy, ¿qué determina realmente su límite superior: la potencia informática o el almacenamiento?
El cuello de botella en el rendimiento de la IA está pasando del “poder de computación” al “almacenamiento y movimiento de datos”, y la solución radica en reconstruir el paradigma de la computación con “memoria analógica + Computación en memoria (CIM)”.
El cálculo central de las redes neuronales profundas (DNN) es la multiplicación de matrices vectoriales (VMM), que inherentemente se basa en una lectura masiva de pesos.A medida que el tamaño de los modelos crece de megabytes a gigabytes (10 MB-10 GB), imponen enormes demandas de almacenamiento en el chip.
El entrenamiento es “intensivo en escritura”, mientras que la inferencia es “intensiva en lectura”; ambos giran en torno al almacenamiento de peso (memoria sináptica).
Conclusión: La IA no es un problema puramente informático;Se trata esencialmente de una cuestión de “eficiencia de almacenamiento + movimiento de datos”.
Las GPU/TPU tradicionales funcionan según un principio simple: el cálculo se produce en elementos de procesamiento (PE), mientras que los datos se almacenan en SRAM/DRAM, lo que genera un movimiento frecuente de datos y una eficiencia extremadamente baja.
Comparación de eficiencia energética:
Contradicción central: El problema no es la incapacidad de calcular, sino la incapacidad de mover datos de manera eficiente.
La arquitectura CIM almacena pesos directamente en matrices de memoria y realiza cálculos (VMM paralelo) dentro de estas matrices, eliminando la necesidad de mover datos entre "unidades de almacenamiento ↔ informáticas".
Cambio fundamental:
Se trata de un cambio de paradigma a nivel arquitectónico, no de una simple optimización.
Para realizar CIM, se requiere un nuevo "portador de peso".Los principales candidatos incluyen:
La capacidad esencial de estos dispositivos es representar pesos utilizando conductancia continua (multibit analógico).
El informe no enfatiza “si se puede hacer”, sino los obstáculos prácticos:
1. Desafíos de capacitación (proceso de escritura)
Requisitos: Linealidad y simetría.
Cuestiones prácticas: la no linealidad y la asimetría reducen la precisión
2. Desafíos de inferencia (estabilidad de lectura)
Los pesos varían con el tiempo, con problemas que incluyen:
- Deriva térmica
- Leer interferencia
- Problemas de retención
3. Problemas a nivel de matriz
- Variabilidad entre dispositivos
- Compensaciones entre precisión, rendimiento del ADC y tamaño de la matriz
Conclusión central: El problema con la memoria analógica no es "si la precisión es suficiente", sino "estabilidad y controlabilidad".
Las direcciones futuras incluyen:
esencia: Este no es un avance de un solo punto, sino una reconstrucción completa.
El cuello de botella de la IA ya no es la potencia informática, sino el “almacenamiento y el flujo de datos”.Analog CIM está transformando el “almacenamiento” en el nuevo núcleo de la informática, redefiniendo cómo operan los sistemas de IA desde cero.