资讯
最近分享的文章
好书推荐 |《从零构建大模型》:从理论到实践,手把手教你打造自己的大语言模型
发表: at 03:30今天推荐的这本书——《从零构建大模型》(原书名 Build a Large Language Model (From Scratch))正好填补了这一空白。它不仅讲透了大模型的基本原理,更从实际出发,带领读者从最底层一步步构建出一个完整的 GPT风格 的模型,实现训练、微调和部署。
《线性代数应该这样学》线性代数教材那么多,这本凭什么畅销10万册?
发表: at 18:00图灵花了近10年时间陆陆续续引进了众多经典数学教材,《线性代数应该这样学(第3版)》便是其一,这本书被斯坦福大学等全球 40 多个国家、300 余所高校采用的数学教材,成为公认的阐述线性代数经典佳作。
谷歌 Gemma 3 开源!多模态、128K 上下文,小模型大能量
发表: at 13:30谷歌近期开源了Gemma 系列新成员Gemma 3,它是一个多模态模型,参数规模从1B 到27B,引入了视觉理解能力、更广泛的语言覆盖范围和128K 上下文,还显著提高了数学、聊天、指令跟随和多语言能力,使 Gemma3-4B-IT 在基准测试中与Gemma2-27B-IT 竞争,并与Gemini-1.5-Pro 相媲美。
好书推荐 |《大模型应用开发极简入门:基于GPT-4和ChatGPT(第2版)》
发表: at 11:20在人工智能技术飞速迭代的今天,大语言模型(LLM)已成为推动技术落地的核心引擎。然而,如何从零开始掌握大模型应用开发的核心逻辑?如何将GPT-4、ChatGPT等前沿技术转化为实际生产力?《大模型应用开发极简入门:基于GPT-4和ChatGPT(第2版)》一书为开发者提供了系统化的答案。作为热销2万册的经典升级版,本书不仅是初学者的“最小可用知识”手册,更是进阶者构建复杂AI应用的实战指南。
Git 本地与 GitHub 远程仓库同步操作详解
发表: at 11:10Git 是现代软件开发中广泛使用的版本控制工具,而 GitHub 则是最流行的远程仓库托管平台之一。理解如何在本地与远程仓库之间进行高效的同步操作,对于团队协作和代码管理至关重要。
介绍一款专属于程序员的字体,太酷了!
发表: at 10:50字体Maple Mono,它不仅仅只在 VSCode 中使用,而是一款专为程序员量身打造的字体,在多种编程场景下都能发挥出色的效果。
Anthropic官方推荐!LangChain MCP双协议支持全球800+工具
发表: at 15:00适配了Anthropic Model Context Protocol (MCP) 所有的工具,既可以进行本地通信stdio,也可以及远程通信SSE,与LangChain LangGraph生态无缝适配。
一文搞懂多头注意力(PyTorch)
发表: at 11:30多头注意力(Multi-Head Attention)是对传统注意力机制的一种改进,旨在通过分割输入特征为多个“头部”(head)并独立处理每个头部来提高模型的表达能力和学习能力。多头注意力是 Transformer 模型的核心组件,能够并行学习输入序列不同位置之间的依赖关系。
一文看懂Embedding模型
发表: at 10:50Embedding模型是一种将离散的符号数据(如单词、句子、图像等)映射到连续的向量空间中的技术,这些向量能够捕捉数据之间的语义、结构等关系。简单来说,就是把原本难以直接处理的符号数据,转换成计算机更容易理解和操作的数值向量形式~
Transformer 过时了!MIT 液体神经网络 LNN 才是新趋势!
发表: at 13:30MIT突破性成果登顶Nature子刊!科学家受线虫微型大脑启发,研发出革命性19节点液态神经网络系统。这一脑启发的AI架构在自动驾驶控制任务中展现出惊人表现:仅用传统神经网络万分之一规模的神经元数量,即实现更优性能表现。