Stiripesurse.ro

Loading RSS Feed

DeepSeek V4: cel mai mare model open weights din lume vine cu prețuri surprinzătoare

Laboratorul chinez de inteligență artificială DeepSeek a lansat primele două modele din seria sa V4 — DeepSeek-V4-Pro și DeepSeek-V4-Flash — sub formă de versiuni preview, cu licență MIT și context de un milion de tokeni.

Parametri record pentru un model open weights

DeepSeek-V4-Pro este construit pe arhitectura Mixture of Experts și numără 1,6 trilioane de parametri totali, dintre care 49 de miliarde sunt activi simultan, depășind ca dimensiune modele precum Kimi K2 (1,1T) și GLM-5.1 (754B) și devenind astfel cel mai mare model open weights disponibil public.

DeepSeek-V4-Flash, varianta compactă a seriei, are 284 de miliarde de parametri totali și 13 miliarde active, ocupând 160 GB pe platforma Hugging Face față de 865 GB cât necesită versiunea Pro.

Eficiență tehnică remarca…

Citește articolul complet

Articole similare

Articole populare