资讯
最近分享的文章
开源大模型食用指南
发表: at 10:00本项目是一个围绕开源大模型、针对国内初学者、基于 Linux 平台的中国宝宝专属大模型教程,针对各类开源大模型提供包括环境配置、本地部署、高效微调等技能在内的全流程指导,简化开源大模型的部署、使用和应用流程,让更多的普通学生、研究者更好地使用开源大模型,帮助开源、自由的大模型更快融入到普通学习者的生活中。
最小熵原理解释:词向量的维度合理解释
发表: at 12:00词向量模型可能有的疑惑:词向量的维度大概多少才够?
央视力荐的三部数理化纪录片,解锁孩子的理科基因
发表: at 10:00理科差是不是就等于未来选的少呢?如果想让孩子的数理化学习开个好头,比起报班,你可能更需要这份纪录片清单。
直到我真正理解了“Token”和“分词器”,才是我学懂Transformer的第一次顿悟!
发表: at 14:00你有没有这种感觉?看了很多Transformer、LLM的文章,却总觉得云里雾里?今天我们来聊聊大型语言模型(LLM)中的一个核心概念——Token。直到我真正理解了“Token”和“分词器”,这才是我学懂Transformer的第一次顿悟,这可能是我整个大模型学习过程中唯一一次一口气看懂的内容。
加速LLM大模型推理,KV缓存技术详解与PyTorch实现
发表: at 13:00随着大型语言模型(LLM)规模和复杂度的指数级增长,推理效率已成为人工智能领域亟待解决的关键挑战。当前,GPT-4、Claude 3和Llama 3等大模型虽然表现出强大的理解与生成能力,但其自回归解码过程中的计算冗余问题依然显著制约着实际应用场景中的响应速度和资源利用效率。
GraphQL 入门看这篇就够了
发表: at 11:55本文首先介绍了 GraphQL,再通过 MongoDB + graphql + graph-pack 的组合实战应用 GraphQL,详细阐述如何使用 GraphQL 来进行增删改查和数据订阅推送,并附有使用示例,边用边学印象深刻。
用这两款神器,轻松搞定数据备份与同步:Restic + Rclone
发表: at 03:00在数字时代,数据就是我们的“命根子”。照片、文档、代码,甚至是服务器上的业务数据,一旦丢失,后果不堪设想。你是不是也曾因为误删文件、硬盘损坏或服务器故障而抓狂?别慌,今天给大家安利两款开源神器——restic 和 rclone,它们能帮你轻松实现数据的备份与同步,让你的数据安全无忧!
用ADK开发一个新闻资讯Agent:超简单!
发表: at 08:00今天笔者带大家如何使用ADK(Agent Development Kit)开发一个新闻资讯助手Agent。这个过程非常简单,即使是编程新手也能轻松上手!
Bottle,微型Web框架的轻量之选!
发表: at 13:00一大堆Web框架,选谁?选轻量的!Bottle就是这种不拖泥带水的类型。代码短小精悍,功能却不打折。适合刚入门Python,想写个小网站、API,甚至偶尔突发奇想造个小工具。别想着它有Django那种“家底厚”,人家讲究的是一个“轻”,一个“快”。这回聊聊Bottle怎么玩,怎么写代码,怎么踩坑。别眨眼,马上开干。
Next.js的隐秘挑战:Netlify面对的六大难题
发表: at 12:00在现代Web开发的舞台上,Next.js无疑是一个备受瞩目的明星框架。然而,对于许多开发者而言,Next.js的使用并非一帆风顺。Netlify的工程师们在为数十万个Next.js网站提供支持的过程中,揭示了该框架在实际应用中所面临的六个重大挑战。