DeepSeek, un arma para que Europa se sume a la guerra por el control de la inteligencia artificial

El tablero de juego de la inteligencia artificial estaba claro hasta el 27 de enero. Por un lado, teníamos a unos jugadores fijos y con su rol establecido: Nvidia como líder mundial en hardware y software junto con OpenAI —que tiene detrás el dinero de Microsoft—, Google DeepMind, Meta o Anthropic —financiado por Amazon y también por Google— desarrollando modelos de lenguaje, IA generativa o chatbots como ChatGPT. Y, por otro, unos riesgos inherentes para los usuarios: suplantación de identidad, discriminación, menor privacidad…
Sin embargo, todo saltó por los aires el pasado lunes. La china DeepSeek logró acabar de un plumazo con el monopolio de Silicon Valley tirando por borda la extendida creencia de que para entrenar y usar un modelo de inteligencia artificial es necesario tener detrás la potencia de un gigante tecnológico. "Es un lanzamiento muy importante. El gran éxito es que demuestra que no hace falta tanta potencia computacional como se pensaba para desarrollar estos modelos", explica Cristina Puente, doctora en informática, profesora en ICAI y colaboradora de la Fundación Alternativas.
Para esta experta, el aterrizaje mundial de DeepSeek puede ser considerado como una "buena noticia" en el sentido de que "la imagen que lanza al mundo" es que no hace falta "una infraestructura tan monstruosa como la OpenAI". Opinión similar mantiene Lucía Ortiz de Zárate, investigadora en Ética y Gobernanza de la Inteligencia Artificial en la Universidad Autónoma de Madrid: "Demuestra que es posible crear una IA demandando menos recursos. Es significativamente mejor en eficiencia energética y usa menos chips".
DeepSeek logra reducir la necesidad de recursos gracias a una innovadora receta: código abierto, bajos costes y eficiencia. ¿Qué implica cada uno de estos ingredientes?
Primero, su código abierto. Esto quiere decir que es totalmente transparente ya que cualquier persona puede ver cómo funciona por dentro y cualquiera puede instalarse esta tecnología de forma local. Esto contrasta totalmente con el hermetismo de los modelos privados de las big tech estadounidenses. "Apostar por el código libre que tiene muchas ventajas para usuarios e investigación", detalla Puente.
Segundo, su bajo coste. Según DeepSeek, el desarrollo de su modelo V3, base de su asistente de inteligencia artificial que es muy similar al actual ChatGPT, duró dos meses y costó sólo 5,58 millones de dólares. Lejos, por ejemplo, de las cifras de los 80 millones que costaron modelos como el de OpenAI. Aunque, tal y como recoge Reuters, algunos analistas dudan de estas cifras. "OpenAI mintió al principios sobre lo que utilizaba y aquí no descarto que también se estén echando un farol", explica Puente. Ortiz de Zárate pone otra variable encima de la mesa: "Podrían estar usando mano de obra barata". Y esto, no saldría en el código disponible.
Por ello, estos dos primeros ingredientes, su código abierto y su bajo coste, han levantado muchas suspicacias porque en la industria tecnológica, como en muchos otros campos empresariales, se tiene la percepción de que el código cerrado y, por tanto, sus altos precios es sinónimo de mayor calidad. En cambio, lo que representa DeepSeek traslada la idea de peores servicios. Un poco como las aerolíneas low cost o las marcas chinas de ropa como Shein.
"La etiqueta lowcost tiene una connotación negativa", matiza Ortiz de Zárate ya que "el hecho de que requiera menos dinero y recursos no necesariamente la convierte en peor": "Si las funcionalidades son las mismas, no es peor". "Demuestra que se pueden hacer modelos similares a los que tenemos con menos coste, pero para nada es de mala calidad", defiende Puente.
Y tercero, su eficiencia. "Los usuarios no van a notar un gran cambio porque funciona muy parecido a ChatGPT", explica Ortiz de Zárate. "Y los resultados son muy similares a la herramienta de OpenAI", asegura Puente. Aunque la organización de confiabilidad de la información NewsGuard, concluye en un primer informe que proporciona respuestas inexactas o no responde el 83% de las veces cuando se le pregunta sobre temas relacionados con las noticias y además sólo desmintió el 17% de las afirmaciones demostrablemente falsas.
Además, DeepSeek tiene otro problema: el chatbot a menudo no proporciona información actualizada o en tiempo real relacionada con eventos noticiosos de alto perfil. Por ejemplo, si se le pregunta por el presidente de EEUU responde que es Joe Biden, aunque dejó de serlo el 20 de enero.
A pesar de estos fallos, lo cierto es que, según las pruebas de la propia empresa china que recoge Techcrunch, DeepSeek V3 supera tanto a los modelos disponibles abiertamente, como Llama de Meta, como a los "cerrados", como GPT-4o de OpenAI. Además, su modelo de razonamiento, R1, funciona tan bien como los de la matriz de ChatGPT ya que es capaz de verificarse a sí mismo de manera eficaz. "Es un modelo más eficiente que el de OpenAI y le ha funcionado mejor con menos coste y menos datos", reconoce Puente.
Según detalla TechCrunch, los modelos de razonamiento tardan un poco más en llegar a soluciones en comparación con un modelo típico sin razonamiento. Pero, su ventaja es que tienden a ser más fiables en ámbitos como la física, la ciencia y las matemáticas.
Los problemas de DeepSeek: ciberataques, propiedad intelectual y censura
Sin embargo, la gran atención que ha acaparado esta semana también ha traído problemas. Por un lado, una serie de ciberataques han limitado los registros de nuevos usuarios. Desde China ya han señalado a EEUU.
Por otro, las denuncias de robo de propiedad intelectual ya que OpenAI afirma que tiene pruebas de que DeepSeek utilizó sus modelos para entrenar a los suyos, lo que supondría una violación de los términos de uso de la tecnológica con sede en Silicon Valley. Lo curioso de toda esta historia es que esta denuncia llega con la empresa estadounidense inmersa en procesos legales tras ser acusada de utilizar datos sin permiso ni licencia de los editores y la industria creativa para entrenar su inteligencia artificial.
Y, finalmente, al estar en el ojo del huracán, el mundo ha puesto la lupa y ha comenzado a encontrar sus trapos sucios. El más evidente es que su asistente está aplicando censura a algunas de sus respuestas ya que no contesta a preguntas sensibles sobre política y geopolítica. Así, y en línea con la normativa de Pekín de que los servicios de IA deben respetar "los valores socialistas fundamentales", se niega a comentar cuestiones como la Masacre de Tiananmen de 1989, si Taiwán forma parte de China o incluso a decir cuál es el líder chino más importante de la historia. Pregunta que, por cierto, ChatGPT si responde. Y que DeepSeek también contesta si se cambia líder chino por líder español.
Más allá de la censura, también preocupan sus sesgos. Durante los últimos años, diferentes estudios y análisis han ido poniendo sobre la mesa todos los sesgos sociales que arrastra de serie la inteligencia artificial: tiene ideología y además es machista, racista y con prejuicios sociales. "Los datos nunca son objetivos ni neutrales. Reproducen una cuestión social y nuestra sociedad es machista y racista", recuerda Ortiz de Zárate. Un pecado original que también afecta a DeepSeek.
"Los sesgos están implícitos en los datos. En este caso, hayan cogido los datos de Internet o de ChatGPT para entrenar, es difícil dejar un set sin sesgos porque es muy complicado de equilibrar y habrá que ir refinándolos", indica Puente que explica que estos entrenamientos es "como enseñar a un niño". "Quizás hayan introducido correcciones, pero lo más probable es que nos encontremos con este tipo de problemas", añade Ortiz de Zárate.
El problema de la gratuidad
Y tampoco termina de convencer que su chatbot sea totalmente gratuito y que ofrezca sus productos y servicios muy por debajo del valor del mercado. Esto ha levantado suspicacias sobre cuál es su modelo de negocio, tal y como recoge TechCrunch. Porque cuando en la industria tecnológica es gratis, el producto es el usuario y sus datos. "Una cosa es que el sistema sea más eficiente y otra cosa es que sea gratis y no obtenga nada de ti. Nadie da nada gratis", defiende Puente.
Y, según publicó Wired, la configuración de DeepSeek parece recopilar mucha información, "incluidos todos tus mensajes de chat" que almacena en "servidores seguros ubicados en la República Popular China". De hecho, tal y como destaca este medio, es probable que esté enviando más datos a este país que TikTok en los últimos años. "No está claro de dónde han sacado los datos y tampoco cómo los gestionan. Y teniendo en cuenta que este país asiático no respeta los derechos humanos de sus ciudadanos, tampoco va a hacerlo con los de sus usuarios", sostiene Puente.
A pesar de estas dudas sobre la IA china, lo cierto es que las empresas tecnológicas de EEUU tampoco están libres de culpa y problemas. ¿Cuál es más peligrosa para los usuarios? "Con DeepSeek no sabemos a quién le estamos dando los datos ni qué hacen con ellos, pero pasa lo mismo con los modelos de EEUU", detalla Puente que reconoce que en todos estos casos detrás hay "un sistema opaco". Ortiz de Zárate distingue los riesgos que se asumen en China o en EEUU con los que puede afectar a una persona europea: "La regulación de la UE es la que es y da igual de donde venga el producto ya que se tendrán que acoplar a la legislación. A priori, nosotros estamos amparados".
Otro capítulo de EEUU vs China. ¿Y Europa?
Lo que sí que está claro es que el ascenso de DeepSeek ha marcado un punto de inflexión en el panorama de la inteligencia artificial. Sobre todo en Silicon Valley. Algunas startups, según pública The Wall Street Journal, han comenzado a subirse a este carro ya que sus pruebas demostraron que ofrecía un rendimiento similar por una cuarta parte del precio. Y Microsoft anunció este miércoles que ha incorporado el modelo R1 en su servicio de la nube.
Sin embargo, según recoge TechCrunch, directores ejecutivos, fundadores, investigadores e inversores aseguran que estos modelos tienen implicaciones importantes para la política estadounidense y podrían empujar a la nueva Administración Trump a aumentar aún más su inversión en esta tecnología para competir con China. "Esto significa una carrera más reñida, lo que normalmente no es bueno para la seguridad de la IA", explicó uno de los padrinos de la IA moderna, Yoshua Bengio, a The Guardian.
Ante esta guerra tecnológica con EEUU y China luchando por el liderazgo mundial, la tercera en discordia vuelve a ser Europa. Sin una industria potente en este campo, sí que cuenta con un marco regulatorio pionero en inteligencia artificial, a pesar de sus múltiples grietas, y una norma fuerte de privacidad con el reglamento europeo de protección de datos. "Es un actor que está actuando de una forma distinta. Se decanta por un modelo civilizatorio apostando por un uso ético y responsable, que es, en realidad, el verdadero progreso", apunta Ortiz de Zárate que, no obstante, señala que esta normativa europea tiene "muchos defectos".
Tirando de esa legislación, Italia ya ha movido ficha y ha bloqueado la plataforma china por falta de información. Aunque el titular es fácil, lo cierto es que el movimiento recuerda mucho a lo que hizo con ChatGPT en 2023. Entonces, también la paralizó, la investigó y terminó poniéndole una multa de 15 millones de euros por la recopilación ilícita de datos personales y la ausencia de sistemas de verificación de la edad de los menores.
¿Quién es Liang Wenfeng? Así es el fundador de DeepSeek y "nuevo rostro" de la IA en China
Ver más
Sin embargo, para la doctora en informática Cristina Puente, la UE no se queda atrás. "No tiene la potencia para crear un ChatGPT, pero este modelo lo que demuestra es que no hacen falta tantos recursos para conseguir un modelo eficiente", sostiene esta profesora que reconoce que "Europa debería animarse" porque "DeepSeek abre opciones".
¿Y Alia, el "ChatGPT español"?
Por ahora, en Europa destaca el trabajo de la alemana Aleph Alpha con su modelo de lenguaje Luminous, la francesa Mistral AI y su Le Chat para competir contra ChatGPT de OpenAI o la británica Stability AI y su modelo generativo Stable Diffusion que crea imágenes a partir de texto. En España, pocos días antes del aterrizaje de DeepSeek, el Gobierno presentó Alia, un modelo de inteligencia artificial en código abierto diseñado desde el sector público. "Sacar modelos locales me parece una vía interesante porque el camino para evitar sesgos es que cada comunidad tenga sus modelos nutridos con rasgos de cada zona porque va a acoplarse mejor a las necesidades", explica Ortiz de Zárate.
Su objetivo es ser una herramienta accesible, inclusiva y adaptada a la diversidad lingüística ya que es capaz de operar en castellano y en las lenguas cooficiales del Estado: catalán, euskera, valenciano y gallego. Por ahora, están en marcha dos proyectos pilotos basados en Alia: un chatbot para la Agencia Tributaria, que permitirá resolver dudas y agilizar gestiones fiscales; y otro programa que se centrará en la mejora del diagnóstico de insuficiencias cardíacas en Atención Primaria. Eso sí, el equipo detrás de este modelo fundacional ya ha dejado claro que no está preparado por ahora para ser una alternativa a la creación de OpenAI. "A Alia lo han intentado hacer utilizando el mismo sistema de ChatGPT y no tiene sentido porque necesita muchísimos recursos. Pero, se puede orientar y tiene capacidad para dar frutos de algo interesante", concluye Puente.