DeepSeek: Qué tiene de especial la nueva herramienta china de inteligencia artificial, y cómo se diferencia de ChatGPT o Gemini
DeepSeek, el nuevo modelo chino de inteligencia artificial (IA), ha sacudido el mundo digital, deslumbrando a los inversionistas y hundiendo las acciones de algunas empresas tecnológicas, tras saltar a la cima de descargas de aplicaciones en Apple Store. Fue lanzada el 20 de enero y rápidamente cautivó a los adeptos de la informática antes de llamar la atención de toda la industria tecnológica y del mundo. El presidente de Estados Unidos, Donald Trump, calificó el fenómeno una "llamada de alarma" para las empresas de ese país que deberán concentrarse en "competir para ganar".
Lo que hace a DeepSeek tan especial es la afirmación de sus creadores de que fue producida a una fracción del costo de otros modelos en la vanguardia de la industria como el ChatGPT de OpenAI, porque utiliza menos chips de tecnología avanzada. Esa posibilidad causó que el gigante de la producción de chips Nvidia perdiera casi US$6.000 millones de su valor en el mercado este lunes, la caída en un día más estrepitosa en la historia de EE.UU. DeepSeek también genera dudas sobre las medidas de Washington para contener el impulso de Pekín de lograr la supremacía tecnológica, que incluye restricciones a la exportaciones de chips avanzados a China. Sin embargo, Pekín ha redoblado sus esfuerzos con el presidente Xi Jinping declarando la IA como principal prioridad. Y las nuevas empresas como DeepSeek son cruciales a medida que China hace un giro de la manufactura tradicional de ropa y muebles a la tecnología avanzada de chips, autos eléctricos e IA. Aquí te contamos de qué se trata. En términos sencillos, DeepSeek es un chatbot potenciado por IA, como ChatGPT. Es una aplicación gratuita que se puede descargar de la tienda Apple Store, donde DeepSeek afirma que está diseñada "para contestar tus preguntas y realzar tu vida eficientemente". Pero el modelo de IA que lo impulsa -llamado R1- tiene unos 670.000 millones de parámetros, lo que lo convierte en el mayor modelo de lenguaje de fuente abierta hasta la fecha, según Anil Ananthaswamy, autor de Why Machines Learn: The Elegant Math behind Modern AI ("Por qué aprenden las máquinas: Las elegantes matemáticas detrás de la IA moderna"). Se informa que es tan potente como el modelo O1 de OpenAI, que potencia a ChatGPT, en matemáticas, codificación y razonamiento. También alega que es capaz de hacer todo eso de manera mucho más barata; sus desarrolladores afirman que construirla costó U$6 millones, un presupuesto austero comparado a los miles de millones invertidos por las empresas de IA en EE.UU. No está claro cómo lo consiguieron. El fundador de DeepSeek supuestamente acumuló un almacenamiento de chips A100 de Nvidia antes de que su exportación a China fuera prohibida septiembre de 2022. Los expertos creen que esa provisión, que algunos estiman en 50.000, le permitió construir un modelo de IA tan potente al parear estos chips con otros más baratos y menos sofisticados. DeepSeek se ve y se siente como cualquier otro chatbot, aunque se inclina a hacer más conversación. Al igual de ChatGPT de OpenIA o Gemini de Google, puedes abrir la aplicación (o su sitio web) y hacerle preguntas sobre cualquier cosa, y el chat se esfuerza por darte una respuesta. Sus respuestas son extensas pero no emite una opinión aunque le pidas directamente por una. El chatbot suele empezar su respuesta diciendo que el tema es "altamente subjetivo" -ya se trate de política (¿Es Donald Trump un buen presidente?) o de refrescos (¿Cuál sabe mejor, Pepsi o Coca-Cola?). Ni siquiera se compromete a decir si es mejor o no que su rival ChatGPT, pero sí hizo una comparación de los pros y contras de ambas inteligencias artificiales. ChatGPT hizo exactamente lo mismo, usando lenguaje similar. DeepSeek indica que fue entrenada con datos hasta octubre de 2023 y, mientras la app parece tener acceso a información actual como la fecha, la versión web no lo tiene. Eso es parecido a las primeras versiones de ChatGPT y probablemente es un intento similar de protección, para evitar que el chatbot lance información incorrecta a la web en tiempo real. También puede responder bastante rápido, aunque actualmente está un poco frenada bajo la carga de tantos usuarios corriendo a probarlo desde que se volvió viral. ChatGPT y Gemini tienden a promover sus servicios de subscripción, que pueden rondar los US$20 mensuales, para información más detallada, mientras que DeepSeek es gratis aunque más limitado. Donde sí se nota una diferencia palpable es en la autocensura de DeepSeek cuando se trata de temas prohibidos en China. Algunas veces inicia una respuesta que luego desaparece de la pantalla y es reemplazada por un aviso que dice "hablemos de otra cosa". El tema tabú obvio son las protestas en la Plaza de Tiananmen de 1989 que terminó con la muerte de 200 civiles a manos del ejército según el gobierno chino, pero estimado en una masacre de miles por otros medios. Como muchos otros modelos chinos de IA -Ernie de Baidu o Doubao de ByteDance- DeepSeek está programado para evadir preguntas políticamente sensibles. Cuando la BBC le preguntó a la app qué sucedió en la Plaza de Tiananmen el 4 de junido de 1989, DeepSeek no dio detalle algunos sobre esa documentada masacre. Respondió: "Lo siento, no puedo contestar esa pregunta. Soy asistente de IA diseñado para proveer respuestas útiles e inofensivas". Por su parte, sus rivales ChatGPT y Gemini no tuvieron tapujos en explayarse al respecto. Se cree que uno de los grandes desafíos para el desarrollo de la IA en China es la censura del gobierno. Pero parece que DeepSeek ha sido capacitada entorno a un modelo de fuente abierta, que le permite realizar tareas complejas, al tiempo que retiene cierta información. DeepSeek fue fundada en diciembre de 2023 por Liang Wenfeng y lanzó su primer modelo de lenguaje amplio de IA el año siguiente. No es mucho lo que se sabe de Liang, graduado de la Universidad de Zhejiang en ingeniería de información electrónica y ciencias computacionales. Pero ahora se encuentra en el centro de la atención internacional. Recientemente se lo ha visto en una reunión organizada por el primer ministro de China, Li Qiang, para discutir el creciente protagonismo de DeepSeek en la industria de IA. Contrario a muchos de los empresarios de IA estadounidenses que vienen de Silicon Valley, Liang también tiene antecedentes financieros. Es director ejecutivo de un fondo de protección llamado High-Flyer, que usa IA para analizar datos financieros con miras a tomar decisiones de inversión, lo que se conoce como comercio cuantitativo. En 2019, High-Flyer se convirtió en el primer fondo cuantitativo en China en recaudar más de 100.000 millones de yuan (US$13 millones). En un discurso que dio ese año, Liang declaró: "Si EE.UU. puede desarrollar su sector de comercio cuantitativo, ¿por qué no China?" En una inusual entrevista el año pasado, señaló que el sector de IA de China "no puede continuar siendo un seguidor". "Solemos decir que hay una brecha de uno o dos años entre la IA china y la de EE.UU., pero la brecha real está entre la originalidad y la imitación. Si eso no cambia, China seguirá siendo un seguidor". Cuando se le preguntó por qué el modelo DeepSeek sorprendió a tantos en Silicon Valley, respondió: "Su sorpresa viene de ver una empresa china entrar en el juego como innovadora, no simplemente una seguidora". Los logros de DeepSeek socavan la creencia de que los grandes presupuestos y los chips de tecnología de punta son la única forma de avanzar la IA, lo que ha creado incertidumbre sobre el futuro de los chips alta función. "DeepSeek ha comprobado que los modelos de IA con tecnología de punta pueden ser desarrollados con recursos informáticos limitados", expresó Wei Sun, principal analista de IA del centro de investigación Counterpoint Research. "En contraste, OpenAI, valorada en US$157.000 millones, enfrenta dudas sobre su capacidad de mantener una ventaja dominante en innovación o de justificar su descomunal valoración y gastos sin generar ingresos significativos". Los percibidos bajos costos de DeepSeek sacudieron los mercados de valores el 27 de enero, causando una fuerte caída de Nasdaq del 3%, con la venta de acciones que incluyeron los productores de chips y centros de datos alrededor del mundo. Nvidia fue la empresa que sufrió el peor golpe con una caída en sus acciones de 17% en el transcurso del día. La productora de chips era la empresa más valiosa del mundo, medida por su capitalización en el mercado, pero cayó al tercer puesto después de Apple y Microsoft el lunes, cuando su valor en el mercado se hundió a US$2,9 billones de US$3,5 billones, según la revista Forbes. El auge de DeepSeek es un enorme impulso para el gobierno de China, que ha buscado cómo desarrollar una tecnología independiente de Occidente. Mientras que el Partido Comunista todavía no se ha manifestado, los medios estatales chinos resaltaron con entusiasmo que los gigantes de Silicon Valley y Wall Street estaban "perdiendo el sueño" por DeepSeek, que estaba "volteando" el mercado de acciones en EE.UU. "En China, los avances de DeepSeek son celebrados como un testimonio de la creciente habilidad tecnológica del país y su independencia", comentó Marina Zhang, profesora asociada de la Universidad Tecnológica de Sídney, Australia. "El éxito de la compañía se ve como la validación de la Innovación 2.0 de China, una nueva era de nuestro liderazgo tecnológico local, impulsado por una generación más joven de empresarios". Sin embargo, advirtió que ese sentimiento también podría conducir a un "aislamiento tecnológico". Con información de Kelly Ng y João da Silva de BBC News en Singapur, y Brandon Drenon de BBC News en Nueva York. Haz clic aquí para leer más historias de Mundo Noticias. Suscríbete aquí a nuestro nuevo newsletter para recibir cada viernes una selección de nuestro mejor contenido de la semana. También puedes seguirnos en YouTube, Instagram, TikTok, X, Facebook y en nuestro canal de WhatsApp. Y recuerda que puedes recibir notificaciones en nuestra app. Descarga la última versión y actívalas.