BitNet b1.58 : LLM ternaires ultra efficaces
About this video
Check out this video I made with revid.ai
Try the AI TikTok Video Generator
Create your own version in minutes
Video Transcript
Full text from the video
Bitnet marque une rupture architecturale. On passe du FP16 classique à des poids ternaires
contrats à moins un, zéro et un. Mathématiquement, cela représente
que zéro virgule cinquante-huit bits par paramètre, permettant de faire tourner un modèle
de cent milliards de paramètres sur un seul CPU, avec une consommation énergétique réduite
de plus de soixante-dix pourcents. Côté implémentation, Microsoft introduit des kernels GPU
W2A8, donc c'est des poids de deux bits activation huit bits. Il exploite l'instruction
matérielle DP4A et une permutation mémoire par bloc pour optimiser le décodage.
Résultat, une accélération jusqu'à trois virgule six par rapport au BF16 sur A100,
Most Upvoted Videos
Most Viewed Videos
Rehman Dakait Full Song & Dance Video
Rehman Dakait Full Song & Dance Video
Cleopatra’s Lost Tomb Mystery
Eternal Bloom
Cleopatra’s Lost Tomb Mystery
शिव और कृष्ण की भक्ति गीत
Cleopatra’s Lost Tomb Mystery
Duarte e as Contas Esquecidas
Roblox Frustrations: A Gamer's Rant
Genug: Das Volk zieht die Grenze
Roblox Frustrations: A Gamer's Rant
Boston Massacre Sparks Revolution
Cleopatra’s Lost Tomb Mystery
Roblox Frustrations: A Gamer's Rant
Roblox Frustrations: A Gamer's Rant
Angels Sang to the New King
240,909+ Short Videos
Created By Over 14,258+ Creators
Whether you're sharing personal experiences, teaching moments, or entertainment - we help you tell stories that go viral.