标签: 模型
包含标签 "模型" 的所有文章:
好书推荐 |《从零构建大模型》:从理论到实践,手把手教你打造自己的大语言模型
发表: at 03:30今天推荐的这本书——《从零构建大模型》(原书名 Build a Large Language Model (From Scratch))正好填补了这一空白。它不仅讲透了大模型的基本原理,更从实际出发,带领读者从最底层一步步构建出一个完整的 GPT风格 的模型,实现训练、微调和部署。
好书推荐 |《大模型应用开发极简入门:基于GPT-4和ChatGPT(第2版)》
发表: at 11:20在人工智能技术飞速迭代的今天,大语言模型(LLM)已成为推动技术落地的核心引擎。然而,如何从零开始掌握大模型应用开发的核心逻辑?如何将GPT-4、ChatGPT等前沿技术转化为实际生产力?《大模型应用开发极简入门:基于GPT-4和ChatGPT(第2版)》一书为开发者提供了系统化的答案。作为热销2万册的经典升级版,本书不仅是初学者的“最小可用知识”手册,更是进阶者构建复杂AI应用的实战指南。
一文看懂Embedding模型
发表: at 10:50Embedding模型是一种将离散的符号数据(如单词、句子、图像等)映射到连续的向量空间中的技术,这些向量能够捕捉数据之间的语义、结构等关系。简单来说,就是把原本难以直接处理的符号数据,转换成计算机更容易理解和操作的数值向量形式~
Transformer 过时了!MIT 液体神经网络 LNN 才是新趋势!
发表: at 13:30MIT突破性成果登顶Nature子刊!科学家受线虫微型大脑启发,研发出革命性19节点液态神经网络系统。这一脑启发的AI架构在自动驾驶控制任务中展现出惊人表现:仅用传统神经网络万分之一规模的神经元数量,即实现更优性能表现。
机器学习最核心的十大算法模型深度解析
发表: at 12:00在人工智能与大数据蓬勃发展的今天,机器学习算法作为智能决策的核心引擎,正深刻改变着各行各业。从金融风控到医疗诊断,从图像识别到自然语言处理,这些算法构成了现代智能系统的基石。
深度学习五大模型:CNN、Transformer、BERT、RNN、GAN解析
发表: at 04:00今天探讨它们各自适用的场景,让您知道在何种情况下选择何种模型;同时分析它们的优势与局限,助您全面评估这些模型的性能。
小白轻松拿捏!深度解析卷积神经网络CNN
发表: at 21:00从今天开始,我们就来介绍下卷积神经网络(Convolutional Neural Networks, CNN),它可以说是深度学习最具代表性的模型之一。
一文搞懂混合专家(MoE)模型
发表: at 05:00在探索最新的大语言模型(LLM)时,“MoE”这一术语频繁出现在各种标题之中。DeepSeek-V3便是一个实力强劲的混合专家(MoE)模型,其总参数量高达6710亿,且在处理每个标记(token)时,能够智能地激活约370亿的参数,实现高效计算。
可视化AI模型CNN和Transformer
发表: at 04:00Scalable. Interactive. Interpretable. At Georgia Tech, we innovate scalable, interactive, and interpretable tools that amplify human's ability to understand and interact with billion-scale data and machine learning models.
小白也能懂的混合专家模型(MoE)深度解析
发表: at 20:30混合专家模型(MoE)作为一种强大的模型架构,正在成为大模型时代的热门话题。本文将带你深入了解MoE的神秘面纱,从其基本概念、核心组件,到训练方法和应用场景,用通俗易懂的语言和生动的实例,让你即使没有深厚的技术背景,也能轻松掌握MoE的关键技术细节。