特爱 - IT资讯分享网

标签: DeepSeek

包含标签 "DeepSeek" 的所有文章：

一文搞懂混合专家（MoE）模型
发表:2025年2月27日 at 05:00
在探索最新的大语言模型（LLM）时，“MoE”这一术语频繁出现在各种标题之中。DeepSeek-V3便是一个实力强劲的混合专家（MoE）模型，其总参数量高达6710亿，且在处理每个标记（token）时，能够智能地激活约370亿的参数，实现高效计算。