特爱 - IT资讯分享网

标签: 大型语言模型

包含标签 "大型语言模型" 的所有文章：

Transformer与混合专家（MoE）：大型语言模型的架构对比
发表:2025年3月20日 at 15:00
在自然语言处理（NLP）领域，Transformer模型凭借其强大的性能成为主流架构。然而，随着模型规模的不断扩大，计算效率和推理速度成为新的瓶颈。为了解决这些问题，混合专家（Mixture of Experts, MoE）架构应运而生。