Calculateur de mémoire LLM pour Mac
Estimez en quelques secondes la mémoire unifiée que votre Mac (M1, M2, M3 ou M4) va utiliser pour faire tourner un modèle Hugging Face dans un environnement MLX.
Indiquez l’identifiant du modèle et la longueur de contexte, et obtenez immédiatement la demande mémoire associée, activations et cache KV inclus, calibrée pour l’architecture mémoire unifiée d’Apple Silicon.
Compatible aussi avec Torch et Transformers. Anticipez le déploiement de vos modèles, évitez les saturations mémoire et tirez le meilleur des capacités IA de votre Mac.
Un modèle qui ne fonctionne pas ? Une fonctionnalité manquante ? Écrivez-nous : support@insightkeeper.ai
Configuration du modèle :
Saisissez un identifiant de modèle
- Nombre de couches:
- —
- Nombre de têtes d’attention:
- —
- Dimension des têtes:
- —
- Précision:
- —
Évaluation mémoire :
- Poids du modèle:
- —
- Cache KV:
- —
- Cache d’activations:
- —
- Surcoût d’inférence:
- —
- Total:
- —