La competencia global por la inteligencia artificial entró en una nueva etapa: además de desarrollar modelos capaces de responder preguntas, generar código y procesar documentos extensos, las empresas buscan reducir el costo de cada consulta. DeepSeek, compañía china con sede en Hangzhou, colocó esa discusión sobre la mesa tras lanzar DeepSeek-V4 Preview y reducir en 75% el precio de acceso a su modelo V4-Pro mediante una interfaz de programación o API.
DeepSeek presentó V4 Preview el 24 de abril de 2026 en dos versiones: V4-Pro y V4-Flash. La primera cuenta con 1.6 billones de parámetros totales y activa 49 mil millones durante su operación. La segunda tiene 284 mil millones de parámetros totales y utiliza 13 mil millones por consulta. Ambas admiten una ventana de contexto de un millón de tokens, una capacidad diseñada para trabajar con documentos extensos, bases de código y tareas que requieren varias instrucciones consecutivas.
Un token es una unidad mínima de texto que puede representar una palabra, una parte de una palabra, un número o un signo de puntuación. Las plataformas cobran según la cantidad de tokens que reciben y generan. Después del ajuste anunciado por DeepSeek, V4-Pro cuesta 0.435 dólares por cada millón de tokens de entrada cuando no se utiliza información almacenada en caché y 0.87 dólares por cada millón de tokens de salida. V4-Flash baja todavía más: 0.14 dólares por millón de tokens de entrada y 0.28 dólares por millón de tokens de salida.
Las tarifas permiten dimensionar el cambio sin hacer cuentas alegres. El costo exacto de una tarea depende de la extensión del texto, el número de respuestas, el uso de memoria caché, el modo de razonamiento y las llamadas adicionales a herramientas externas. Por ello, no es posible afirmar que un modelo será siempre 99% más barato que otro. La diferencia debe medirse caso por caso, con el mismo prompt y bajo condiciones comparables.
El movimiento de DeepSeek ocurre mientras otros desarrolladores chinos también presionan los precios. La plataforma OpenRouter registra a MiMo-V2.5-Pro, modelo de Xiaomi lanzado el 22 de abril de 2026, con una ventana de contexto de un millón de tokens y tarifas de 0.435 dólares por millón de tokens de entrada y 0.87 dólares por millón de tokens de salida. OpenRouter lo presenta como una herramienta enfocada en programación, automatización y tareas de larga duración.
La reducción de costos no depende solamente de una estrategia comercial. DeepSeek informó que V4 utiliza compresión de información y un mecanismo de atención dispersa. En términos sencillos, el modelo busca concentrarse en las partes relevantes de un texto largo en lugar de procesar con la misma intensidad cada fragmento disponible. El objetivo es bajar el consumo de memoria y la cantidad de cálculos necesarios para generar una respuesta.
El lanzamiento también tiene una dimensión industrial. DeepSeek adaptó V4 para trabajar con chips Ascend de Huawei, fabricante chino que busca ampliar su presencia en centros de datos dedicados a inteligencia artificial. Reuters reportó que ByteDance, Tencent y Alibaba se acercaron a Huawei para explorar nuevos pedidos de procesadores Ascend 950 después de la presentación del modelo. El movimiento refleja el interés de China por desarrollar una cadena tecnológica propia, desde el chip hasta la aplicación final.
La transición, sin embargo, no significa que NVIDIA haya quedado fuera del mapa. Reuters señaló que el Ascend 950PR supera al H20 de NVIDIA, un procesador diseñado para cumplir con las restricciones comerciales aplicables en China, pero todavía se encuentra por debajo del H200, uno de los chips más avanzados de la compañía estadounidense. Huawei también enfrenta límites de producción debido a las restricciones para adquirir equipo especializado de manufactura.
El debate tiene antecedentes. El 27 de enero de 2025, la popularidad de DeepSeek y sus afirmaciones sobre eficiencia provocaron una venta masiva de acciones tecnológicas. NVIDIA perdió alrededor de 17% de su valor en una jornada, equivalente a casi 593 mil millones de dólares de capitalización bursátil. El ajuste fue el mayor registrado para una empresa en un solo día hasta ese momento. Al día siguiente, la acción recuperó parte del terreno perdido.
Para empresas, desarrolladores y medios de comunicación, el cambio abre una opción práctica: asignar cada tarea al modelo adecuado. Los modelos de menor costo pueden servir para resumir documentos públicos, estructurar borradores, clasificar información o generar versiones iniciales de código. En trabajos con datos personales, contratos, expedientes, estrategias comerciales o información confidencial, el precio no debe ser el único criterio.
Antes de integrar una plataforma, conviene revisar dónde se almacenan los datos, bajo qué jurisdicción opera el proveedor, si las conversaciones se utilizan para entrenamiento, qué controles administrativos ofrece y cuánto cuesta una tarea completa. En el día a día, la tarifa por millón de tokens es apenas el primer filtro; también cuentan la precisión, la velocidad, la estabilidad y la posibilidad de auditar resultados.
DeepSeek mantiene abiertos los pesos de V4 bajo una licencia MIT, lo que permite que empresas y desarrolladores utilicen, modifiquen y comercialicen el modelo. La compañía también anunció que sus servicios oficiales adoptaron el contexto de un millón de tokens como estándar. Esa combinación de precio, apertura y compatibilidad con hardware chino amplía la competencia en un mercado que hasta hace poco estaba concentrado en plataformas estadounidenses.
La nueva carrera de la inteligencia artificial no se limita a determinar qué modelo obtiene la mejor calificación en una prueba técnica. También busca responder una pregunta más terrenal: cuánto cuesta resolver una tarea útil sin sacrificar seguridad ni calidad. En ese terreno, DeepSeek y Xiaomi ya pusieron a revisar números a empresas, desarrolladores y proveedores de infraestructura.