Retour à Informations sur l’IA
Rumeurs de sortie de DeepSeek R2 : faits saillants spéculatifs et changements possibles

Rumeurs de sortie de DeepSeek R2 : faits saillants spéculatifs et changements possibles

Informations sur l’IA Admin 6 vues

DeepSeek R2 est un modèle génératif de nouvelle génération prévu par la société chinoise d’IA DeepSeek (DeepSeek). L’heure de sortie initiale n’a pas été officiellement divulguée, mais selon les médias tels que le Financial Times et Reuters, le processus de lancement du modèle pourrait être retardé en raison de facteurs tels que l’adaptation matérielle, l’optimisation des performances et la préparation des données, et il n’y a pas encore de calendrier de sortie officiel.


1. Raisons possibles du retard des rumeurs sur DeepSeek R2

  • Défi national de la formation aux puces
  • Selon le Financial Times, citant des personnes familières avec le dossier, DeepSeek avait prévu d’utiliser la puce Ascend de Huawei pour la formation tout au long du processus, mais a rencontré des problèmes de stabilité et de compatibilité, entraînant de multiples interruptions dans le processus de formation. Le rapport a souligné que l’équipe a finalement utilisé des puces Nvidia pour terminer l’entraînement à la place, en utilisant Ascend uniquement dans la phase d’inférence.
  • Selon
  • Reuters, le fondateur de DeepSeek, Liang Wenfeng, n’est pas entièrement satisfait des performances actuelles de R2 et a demandé à l’équipe de l’optimiser davantage, ce qui aurait pu prolonger le cycle de développement.
  • Les médias
  • de l’industrie
  • ont déclaré que les données d’annotation à grande échelle requises pour R2 étaient complexes et dépassaient le calendrier prévu.


2. Heure de sortie et

  • fenêtre de sortie
  • prévue par
  • l’industrie Selon des sources de l’industrie, le R2 pourrait être publié entre la mi-août et la fin août 2025, et l’architecture matérielle pourrait utiliser le cluster de puces Ascend 910B, avec des performances revendiquées proches de 91 % du cluster Nvidia A100.
  • Certains
  • analystes estiment que les affirmations actuelles concernant l’heure de publication sont encore des rumeurs et recommandent d’attendre une confirmation officielle.


3. Importance pour l’industrie et impact

  • potentiel
  • La R2 est considérée comme une mise à niveau importante après la R1 et la V3, qui devrait améliorer les capacités de raisonnement multilingue et optimiser les coûts d’inférence.
  • Certains
  • analystes ont souligné que ce retard pourrait refléter les lacunes des puces d’IA domestiques dans la formation de modèles à grande échelle, et également exposer les défis de la promotion des stratégies de localisation.


FAQ Q

 : A-t-il été confirmé que R2 est reporté ?

R : La nouvelle officielle du report n’a pas été confirmée, et les informations pertinentes proviennent principalement des médias et des rapports de l’industrie.

Q : Quels sont les concurrents du R2 ?

A : Y compris la série Alibaba Qwen et d’autres produits de nouvelle génération de fabricants de grands modèles nationaux et étrangers.

Q : S’agira-t-il uniquement de puces nationales ?

R : Selon les rapports, la phase d’entraînement repose principalement sur les puces Nvidia, et les puces domestiques sont actuellement principalement utilisées pour l’inférence.

Outils Recommandés

Plus