sora63
Buah, ya se podía imaginar que DeepSek se basa en modelos de los murricanos, no pilla a nadie por sorpresa creo.
A ver, por una parte es trampear el presupuesto utilizado porque sin los modelos usanos (probablemente los de Meta) los chinos no hubiesen podido crear Deepseek R1.
Así que lo que que les salió barato el entrenamiento es una chufla, porque la realidad es que habría que sumarle el dinero y recursos que se destinaron a los modelos con los que entrenaron DeepSeek R1 (y entonces vemos que su entrenamiento no fue tan barato).
Eso no quita mérito a los chinos, los cuales lograron que a partir de ahora se democratice la investigación en IA y que sea mucho más accesible en todos los sentidos.
Así que la intervención de los chinos es muy positiva y además viene en un momento en el que la IA parecía destinada a estar en manos de unas pocas Big Tech, pero su irrupción cambió por completo esta percepción y abrió más que nunca la competencia de la investigación a otros actores.
Pero también es cierto que seguimos dependiendo de modelos usanos, sin ellos Deepseek R1 no existiría, y si en Deepseek quieren seguir mejorando tendrán siempre que depender de los modelos previos de los americanos, lo cual sigue haciendo que todo el mundo sea extremadamente dependiente de ellos (probablemente al final los propios americanos podrán hacerlo mejor ya que son la propia fuente de ese tipo de modelos).
Otro riesgo añadido es que puede que por culpa de este tema a partir de ahora los americanos empiecen a desconfiar más del código abierto, y pueden empezar a dejar de publicar sus trabajos de esa manera (cosa que Meta hace de manera constante).
Tras aclarar y puntualizar estas cosas creo que en general Ia irrupción de Deepseek es muy positiva de cara a la democratización de la IA, la competencia en investigación, y su acercamiento a las masas.