Estamos emocionados de compartir los resultados de nuestra colaboración con SGLang. 🎉



Juntos, optimizamos la inferencia de DeepSeek R1 para su implementación en GB200 NVL72, logrando un aumento de 2x y 3x por GPU en comparación con clústeres H100 casi del doble de tamaño.

Esto es cómo se ve la inferencia de MoE en la frontera.
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • 8
  • Republicar
  • Compartir
Comentar
0/400
notSatoshi1971vip
· 08-04 13:15
¿Rendimiento duplicado? Esta vez es posible.
Ver originalesResponder0
ProbablyNothingvip
· 08-03 01:09
Aumento de rendimiento Me lamo, me lamo
Ver originalesResponder0
WhaleWatchervip
· 08-01 23:52
¡El rendimiento se ha duplicado, increíble!
Ver originalesResponder0
Rugpull幸存者vip
· 08-01 23:52
¿Está de nuevo en la mejora del rendimiento, verdad?
Ver originalesResponder0
OnChainDetectivevip
· 08-01 23:52
hmm rastreé esas métricas de gpu... algo no cuadra aquí
Ver originalesResponder0
MetaverseVagabondvip
· 08-01 23:50
¡Por fin he superado el H100!
Ver originalesResponder0
ClassicDumpstervip
· 08-01 23:46
Otra vez se fue a la luna, ¿verdad?
Ver originalesResponder0
WhaleMinionvip
· 08-01 23:36
El rendimiento de la GPU ha explotado.
Ver originalesResponder0
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)