Retour au blog

Moonshot publie Kimi K2.7-Code : un modèle 1T paramètres open source qui pense 30% moins

Moonshot publie Kimi K2.7-Code : un modèle 1T paramètres open source qui pense 30% moins

1 000 milliards de paramètres, 30 % de tokens de “thinking” en moins — et zéro annonce officielle

Moonshot AI a publié en silence sur Hugging Face son nouveau modèle de code : Kimi K2.7-Code. Pas de post de lancement, pas de conférence de presse — juste les poids du modèle.

Les specs

Caractéristique Valeur
Taille 1 000 milliards de paramètres (1T MoE)
Paramètres actifs 32B
Contexte 256K tokens
Licence Modified MIT
Hébergement Self-hostable
Claim principal ~30 % moins de tokens “thinking”

Pourquoi le nombre de tokens “thinking” est important

Dans la génération de code, les modèles de raisonnement (comme Claude ou o3) utilisent des tokens de “thinking” — des calculs internes avant la réponse finale. Moonshot affirme réduire ce volume de 30 %, ce qui signifie :

  • Réponses plus rapides
  • Coûts d’infrastructure réduits
  • Latence moindre pour les applications temps réel

Le timing n’est pas un hasard

Cette publication intervient la même semaine où : - Anthropic annonce des hard caps sur le billing des agents Claude - Un correctif de 2 lignes documenté par la communauté a réduit la consommation de tokens de $12 par appel - L’efficacité des tokens devient la nouvelle frontière de compétition

“Ce n’est pas une note de bas de page — c’est la nouvelle métrique de frontière.” — On The Wire

Notre lecture : La course à la capacité pure (plus de paramètres, plus de contexte) laisse place à la course à l’efficacité. Le gagnant ne sera pas celui qui a le plus gros modèle, mais celui qui fait le plus avec moins de tokens.

Source : On The Wire, Hugging Face

—VISUAL PROMPT— A dark tech scene (#0C0908). A glowing brain made of code fragments, with some sections dimmed or crossed out — representing “30% less thinking.” Golden particles (#D4A86A) stream from the brain like saved energy. The background is a clean dark gradient with subtle circuit board patterns. The mood is “efficiency” — lean, optimized, smart. No text, no logos, no badges. Clean futuristic aesthetic.

Vous avez un projet similaire ?

Obtenez un diagnostic gratuit de votre présence en ligne et des recommandations personnalisées.

Diagnostic Gratuit

Ne partez pas sans votre cadeau !

Téléchargez gratuitement notre guide "Diagnostic Digital" pour découvrir comment améliorer votre présence en ligne.