Deepseek V3.1 Lanzamiento Novedades

Deepseek v3.1 es oficial: todas las noticias


Deepseek V3.1 Notas

Cuando se presentó el Depseek Chatbot hace unos meses, el mundo de la IA tembló. Chatbot chino no está solo Código abierto, pero también es gratisEntrena más fácilmente y con un hardware infinitamente más modesto que sus principales rivales (chatgpt, gemelas y llamas). Esto lo hizo popular en poco tiempo, aunque principalmente entre los fanáticos de la IA.

Desde entonces, el modelo ha mejorado en algunas cosas a través de diferentes actualizaciones menores, pero ahora acaba de dar un salto oficial hacia una nueva versión. Deepseek v3.1 ya es una realidad y le mostraremos sus noticias, ¿Estás preparado?

Deepseek v3.1 puede analizar libros hasta 400 páginas y todo funciona en un solo modelo unificado

Deepseek V3.1 Aumenta La Longitud Del Contexto Y Unifica Los Modelos Ia

A través de una modesta publicación en WeChat, el 19 de agosto, la compañía detrás de Deepseek anunció que su modelo alcanzó oficialmente la versión 3.1. La novedad principal es La expansión de la ventana de contexto, que ahora es de 128,000 tokenAdemás de aumentar el número de parámetros a 685,000 millones.

Con esto, Deepseek v3.1 puede Administrar entradas y salidas de datos mucho más extensasequivalente a un libro de 300 a 400 páginas. Esto es particularmente útil cuando Analizar los documentos técnicos y cuando se realice una investigación profundaAdemás de ayudar a contener conversaciones extensas sin perder el hilo. Según los desarrolladores, Deepseek V3 ya era compatible internamente con este contexto ampliado, pero en este momento estaba oficialmente habilitado para diferentes herramientas.

Junto a esto, Depseek ha eliminado todas las referencias al modelo R1 En la interfaz de chatbot, que avanza que la transición a un modelo híbrido único ya es una realidad. Dicho de una manera más simple: en Deepseek v3.1 ya no hay un modelo de razonamiento y otro para actividades sin razonamiento, sino Todo se ha integrado en un excelente modelo unificado.

Lás Primeras pruebas de rendimiento También anunciaron, porque Deepseek v3.1 obtuvo un Puntaje 71.6% en la prueba de programación de auxiliares. Esto lo coloca sobre Claude Opus 4, asegurándose de que Deepseek se considere como Uno de los modelos de código abierto más potentes Actualmente disponible. También ha habido mejoras en términos de razonamiento lógico y matemático, aunque no tan grande si se compara con R1-0528, la versión anterior.

En cuanto a la implementación de sus abejas en otras herramientas o la recopilación de su solicitud de usar fuera de línea, Deepseek V3.1 puede operar en múltiples formatos de precisión, como versiones anteriores. Puede funcionar en el modo BF16, FP8 y F32Por lo tanto, dando una mayor flexibilidad a los usuarios, dependiendo del entorno en el que se implementará. El código fuente Se puede descargar a través de abrazoY tiene una licencia de código abierto aprobada por MIT.

El público esperaba el lanzamiento de R2, pero Depseek aún no está listo para esa actualización

Deepseek R2 RetrasadoDeepseek R2 Retrasado

Aunque V3.1 es una actualización que muchos apreciarán, los usuarios más fieles en Deepseek Esperaban que el próximo gran lanzamiento fuera el modelo R2. Esto llegaría con real Mejoras en las habilidades de razonamiento de CLMPero un Informe publicado en Financial Times Indica la razón por la que aún no ha llegado.

Según el documento, la compañía detrás de Depseek está teniendo Problemas de chips ascendidos de Huawei. La compañía quiere reducir su dependencia de Nvidia y alinear la estrategia china de ser autosuficiente en términos de inteligencia artificial. Sin embargo, El entrenamiento de chips ascend no dio buenos resultadosespecialmente para problemas de compatibilidad.

Deepseek ha decidido continuar con los chips Nvidia por un poco más de tiempo, por lo que se lanzó v3.1. R2 continuará en la hoja de ruta, con los ejes como hardware principalPero No se lanzará hasta que se resuelvan los problemas.



Scroll al inicio