Era cosa de tiempo para saber con certeza, cuál es el motor con el cual el llamado «Chat GPT chino» DeepSeek es capaz de poder moverse con tanta soltura, más allá de observaciones sobre sus respuestas o censura.
De acuerdo al filtrador Alexander Doria, quien ha publicado en su cuenta X los detalles cómo opera y que el modelo de lenguaje detrás de DeepSeek, llamado DeepSeek R1, está siendo entrenado usando los chips HUAWEI Ascend 910C.
I feel this should be a much bigger story: DeepSeek has trained on Nvidia H800 but is running inference on the new home Chinese chips made by Huawei, the 910C. pic.twitter.com/6IAgQlQ3ou
— Alexander Doria (@Dorialexander) January 28, 2025
Probablemente, debido a algunas imprecisiones basadas en su programación, estas se deben al rendimiento relativamente más bajo del chip Huawei Ascend 910C, el cual limita su idoneidad para el entrenamiento, el cual estaría resuelto con el próximo chip 920C con el objetivo de competir con Blackwell B200, el chipset líder de Nvidia para operaciones de IA.