Hace pocas fechas dábamos cuenta de DeepSeek, el generador de lenguaje natural que parece ser mucho más eficiente que sus contrincantes europeos o, sobre todo, americanos. En aquel post, se analizaban los elementos técnicos que podía permitir esta mayor eficacia. Rendimiento que suponía mayor velocidad, menor consumo de energía, más facilidad de entrenamiento, mejor velocidad de respuesta y el uso de hardware simple. En definitiva, mucho más barato de entrenar, usar y mantener.
Así, DeepSeek decía haber necesitado sólo 6 millones de dólares para su desarrollo (unas 10 veces menos que sus competidores), precisar sólo de unas 2000 GPU y tener un coste por inferencia órdenes de magnitud menores que otros LLMs.
En la batalla de marketing desatadas entre las Compañías, hace pocos días, la firma SemiAnalysis publicó un informe en que se afirma que DeepSeek ha incurrido, en realidad, en unos gastos de hardware de 1600 millones de dólares y que dispone, para ejecutar programas, de 50000 GPUs de NVIDIA.
Según el informe, DeepSeek dispondría de una infraestructura informática con aproximadamente 50.000 GPU Hopper, incluyendo 10.000 H800 y 10.000 H100. Todas estas unidades estarían distribuidas en múltiples ubicaciones y servirían para entrenar el LLM, para investigación y desarrollo y para ejecutar modelos financieros que son la misión original y principal de la empresa. La inversión total de capital de la Sociedad en servidores ronda los 1.600 millones de dólares, con un gasto estimado de 944 millones en costes operativos.
Aunque las cifras globales parecen ser ciertas ya que están basadas en el balance societario, no queda claro qué proporción del gasto se dedica, en realidad, al modelo de lenguaje.
Claro está, de ser cierto que esa proporción es mayor que la manifestada con anterioridad, la supuesta fantástica eficacia de DeepSeek no sería tal.
Habrá que ser prudentes y dejar que pase la marejada de marketing e intereses financieros.
De momento, tenemos el modelo DeepSeek para experimentar con él.
0 comentarios :
Publicar un comentario