
Deepseek, un modelo de inteligencia artificial con desarrollo chino relativamente desconocido, es ahora la aplicación más popular en la tienda de aplicaciones de Apple de EE.UU. UU. Basada en la exageración asociada con el lanzamiento de un modelo de IA que supera los modelos de OpenAi y otras compañías en algunos puntos de referencia mientras se capacita en mayores Chips a un costo mucho más bajo. Ha causado las acciones de Nvidia, que se ha convertido en una de las compañías más valiosas de la historia gracias al auge de la IA, que cae y está provocando un pánico más generalizado en el mercado estadounidense. Marc Andreessen ha llamado a este «momento Sputnik de AI», refiriéndose al primer satélite ruso que se adelantó y aceleró el programa espacial de los Estados Unidos.
Las personas en el espacio de IA y aquellos que lo siguen de cerca comenzaron a enloquecerse cuando el nuevo modelo de Deepseek, Deepseek R1, fue lanzado la semana pasada, y que Freakout ahora aparentemente ha capturado al mundo entero, impactando el mercado de valores, haciendo que las personas se pregunten si las compañías estadounidenses se preguntan si las compañías estadounidenses Al igual que Operai y Nvidia realmente pueden dominar la industria de la IA, si la burbuja de IA finalmente está apareciendo, y si esto es un signo de inminente dominación y censura del mundo chino. Deepseek es particularmente notable porque es gratuito, modificable y menos costoso de ejecutar, lo que ha preocupado a los expertos por la viabilidad de los productos de suscripción ya no rentables de OpenAI.
Voy a ser por adelantado contigo aquí y decir que 404 Media no brindar ningún consejo financiero y que si tuviera respuestas definitivas a alguna de estas preguntas, estaría jugando en el mercado de valores en lugar de bloguear, sino en un día cuando Las tomas van a llegar rápido y furiosa mi opinión es esta: la industria de la IA continúa desarrollándose muy rápido, es difícil extrapolar cómo se desarrollará en función de un solo evento, incluso si es monumental, y el hecho de que Deepseek proviene de China, un adversario percibido de los Estados Unidos/Occidente está haciendo halcones y xenófobos, y tanques de espuma en la boca.
Respiremos profundamente y comencemos con el mayor titular, que es que Nvidia Stock cayó más del 12 por ciento temprano esta mañanasu peor desempeño desde 2020. El fabricante de GPU Nvidia se convirtió en una compañía de billones de dólares porque está haciendo en gran medida las fichas las que impulsan el auge generativo de la IA. Estos no son solo los chips que las personas necesitan para generar texto, imágenes, audio, etc. localmente en sus máquinas, sino los grupos de entrenamientos masivos de millas de chips en los que estos modelos fundamentales están entrenados. En julio, por ejemplo, Elon Musk anunció con orgullo Que Xai comenzó a entrenar «el grupo de entrenamiento de IA más poderoso del mundo», compuesto por 100.000 H100 NVIDIA.
En su mayor parte, las compañías de IA en los Estados Unidos han competido en la idea general de que más datos y más cómputo crean modelos y herramientas de IA más avanzadas e «inteligentes». Una de las estrategias generales, por lo tanto, ha sido que compañías como OpenAi, Google y Meta para alimentar más y más datos en sus modelos y competir para construir centros de datos increíblemente costosos e intensivos en recursos. Pero el año pasado, comenzamos a ver. Algunas dudas Acerca del consenso existente sobre las leyes de escala de IA, que hasta hace poco mostró hace poco que el rendimiento de los modelos de IA mejoró a medida que aumentó el tamaño del modelo, los datos y el calculador, con algunas personas, incluida la cofundadora de IA abierta, Ilya Sutskever y Andreessen, diciendo que eso Las compañías de IA están comenzando a ver rendimientos decrecientes. A pesar de estas dudas, las compañías de IA todavía estaban compitiendo por el cálculo, lo que en gran medida significa acceso a los chips de Nvidia. Musk quiere hacer crecer el clúster de Xai a un millón de GPU eventualmente, y el CEO de Broadcom dijo recientemente que predice que otras compañías intentarán construir grupos gigantescos igualmente.
Esta demanda de hardware altamente especializado y difícil de producir ha hecho que NVIDIA sea increíblemente valiosa y de manera crítica para construir IA. Debido a que el gobierno de los Estados Unidos cree que Estados Unidos, no China, debe ser el líder mundial en IA, también es por eso. Introdujo restricciones de exportación que prohíben a NVIDIA vender sus chips más avanzados a las empresas chinas. Esto es parte de por qué ves OpenAi, Oracle y SoftBank Proponiendo arrojar $ 500 mil millones a proyectos como Stargateun proyecto masivo de infraestructura de datos de IA para el que pueden o no tener el dinero.
El principal por la que la gente está entusiasmada/asustada/vomitando en este momento es que Deepseek fue desarrollado y lanzado bajo las restricciones de exportación de Estados Unidos que impiden que las empresas chinas obtengan los últimos y más poderosos chips de Nvidia. Como Cableado explicadoDeepseek fue escindido de Fire-Flyer, un fondo de cobertura chino que adquirió originalmente GPU para analizar los datos financieros, antes de invertir su dinero y recursos en el desarrollo de la IA. Que un nuevo jugador en este espacio pudo construir un modelo de IA sin acceso a las últimas y mejores chips de Nvidia (Aunque las personas en China han encontrado formas de obtenerlos A pesar de la restricción), el uso de estrategias de aprendizaje de refuerzo nuevas y más eficientes, ha socavado la idea de que compañías como Nvidia o OpenAI han construido un «foso» en torno a sus compañías que asegurarán su liderazgo en la carrera de IA para siempre y, por extensión, se han socavado La noción de la supremacía mundial estadounidense de IA. También al menos plantea la posibilidad de que una empresa china haya encontrado una manera mejor, más eficiente y más barata de capacitar a los modelos de IA que cualquier compañía estadounidense ha descubierto hasta ahora.
Como otros han señaladoes difícil decir exactamente lo que Deepseek gastó realmente para hacer su modelo sin confiar a él a ciegas. El verdadero costo puede estar oculto en las formas en que no entendemos, y definitivamente se está beneficiando al construir sobre la investigación muy costosa (principalmente de compañías estadounidenses) que fue antes que él. Pero si las empresas de IA pueden construir modelos competitivos a una fracción del costo en un número relativamente pequeño de GPU menores, gran parte del valor de Nvidia y las millas de millones de dólares que las compañías de IA están quemando de repente parece excesivo y derrochador. (incluso para los impulsores de IA), de ahí que el stock caiga.
¿Esto significa que NVIDIA, OpenAi y otras compañías de IA están condenadas? Una vez más, este no es un consejo financiero, pero el mercado parece ser espasmo basado en vibraciones, y definitivamente antes de que tengamos una gran comprensión del impacto de Deepseek. La refutación más obvia de los titulares de bolsas Nvidia en esta situación es que las nuevas eficiencias de Deepseek solo se beneficiarán a los titulares de IA. Si estos nuevos métodos dan a Deepseek excelentes resultados con un cálculo limitado, los mismos métodos le darán a OpenAI y otras compañías de IA más recursos más bien recursos en sus enormes grupos de capacitación, y es posible que las empresas estadounidenses se adapten a estos nuevos métodos muy rápidamente. Incluso si las leyes de escalada realmente han llegado al techo y los grupos de entrenamiento gigante no necesitan ser tan gigantes, no hay razón para que pueda ver por qué otras compañías no pueden ser competitivas bajo este nuevo paradigma. Probablemente también deberíamos esperar que este sea el caso, ya que podría reducir el impacto ambiental de la IA.
No tengo un perro en esta pelea, pero el argumento que agregaría aquí es que este tipo de salto parece totalmente normal, y parecemos variaciones en los últimos años. A la gente le encanta bailar prematuramente en la tumba de Operai cada vez que se lanza un modelo nuevo y brillante. Meta’s Llama, France’s Mistral y Claude de Anthrope han parecido que están avanzando en un momento u otro y son favorecidos por diferentes usuarios para diferentes usos, solo para que otro modelo sea lanzado por OpenAi u otra compañía que salta a la nueva y caliente tecnología. y los hace parecer viejos.
La diferencia es que Deepseek es de China y que a muchas personas, incluido el gobierno de los Estados Unidos, no les gusta que la idea de que China sea dominante en cualquier arena, y mucho menos una supuestamente consecuente como la IA. Esto es obvio dada la histeria en las redes sociales en este momento, los mercados, y la forma en que las personas hablan sobre la censura de Deepseek y la posibilidad de que pueda estar vinculado a la vigilancia china o al gobierno chino de alguna manera. Steven Heidel, quien trabaja en Operai, tuiteó el domingo «A los estadounidenses les encanta entregar sus datos al PCCh a cambio de cosas gratuitas», que se ha vuelto viral y sirvió como base para la discusión sobre el software de vigilancia profunda como el posible software de vigilancia, el «nuevo tiktok», etc . Lo que es particularmente notable aquí es que es que Deepseek se ha lanzado de una manera que se puede ejecutar localmente sin una conexión a Internet.
En varios subreddits de IA, donde Deepseek es de lo que todas las personas han estado hablando durante días, algunos usuarios ahora sugieren que la conversación está siendo manipulada por «propaganda«De algunas cuentas. Las personas han compartido repetidamente capturas de pantalla en las redes sociales de Deepseek que se niegan a interactuar con preguntas sobre la Plaza de Tiananmen y otros temas sujetos a censura en China, con la implicación de que este es el ecosistema de información en el que viviríamos si China dominara la raza de IA.
Es bastante justo, supongo, pero como los desarrolladores de los modelos de IA «sin censura» han sido gritando desde los tejados desde el principio: Cualquier modelo de IA que el usuario no pueda controlar por completo está sujeto a censura. OpenAi es un mojigato, y se negará a involucrar a los usuarios en muchos temas, a veces por razones declaradas en la política de OpenAi, ya veces por razones que nunca entenderemos porque OpenAi es una caja negra.
“¿Por qué debería la IA de código abierto que se ejecuta en mi computadora, puede decidir por sí mismo cuando quiere responder a mi pregunta? Se trata de propiedad y control. Si le hago una pregunta a mi modelo, quiero una respuesta, no quiero que discuta conmigo”, dijo Eric Hartford, desarrollador de modelos de IA sin censura. el año pasado.
En todo caso, Deepseek asigna un mejor futuro de IA para aquellos preocupados por la censura porque fue lanzado como un modelo de «pesas abiertas», lo que significa que las personas podrían modificarlo para hablar sobre la Plaza de Tiananmen y cualquier otra cosa que quieran.
No sabemos cómo se sacudirá todo esto, pero la liberación de Deepseek parece ser un momento sísmico para la industria de la IA. Y ciertamente se utilizará, correcto o incorrectamente, como un garrote político para resaltar la urgencia de la competencia por la supremacía de IA entre Estados Unidos y China.
Sobre el autor
Emanuel Maiberg está interesado en comunidades y procesos poco conocidos que dan forma a la tecnología, los alborotadores y los pequeños carne de res. Envíelo por correo electrónico a emanuel@404media.co