归档
所有已归档文章
Euporie:一款功能强大、使用便捷的终端 Jupyter 交互工具,能让Jupyter Notebook在终端下运行
发表: at 12:00在现代数据科学领域,Jupyter Notebook 已成为不可或缺的工具,它以其强大的交互性、可读性和可移植性而闻名。然而,在某些场景下,例如远程服务器、容器环境或仅仅个人偏好,使用终端进行操作更便捷。 Euporie 应运而生,它将 Jupyter 的强大功能带入终端,让用户告别鼠标,在命令行中畅游数据科学世界。
月访问破亿,Omni Calculator这家英文计算器网站靠什么做到月入百万美元?
发表: at 14:00如果您在SEO行业摸爬滚打多年,您总是会发现一些“神站”:他们没有复杂的功能、没有华丽的设计,也没有大团队运营。网站就是靠Google自然流量就能获取每天数百万点击,月入百万美元。千寻盘今天介绍一个低调但超赚钱的站点:Omni Calculator。
PyQt完整入门教程
发表: at 13:00PyQt5是一个用于创建图形用户界面(GUI)的Python库。它是基于Qt库的,Qt是一个用于创建跨平台应用程序的C++库。PyQt5允许开发人员使用Python语言创建功能强大的应用程序,使用Python开发的优点是高效。
专为键盘学习者设计的背单词工具,考四六级和其他英语等级的同学有福了
发表: at 11:00传统的背单词软件往往存在几个问题:需要下载安装、界面复杂、功能冗余、缺乏针对性练习。手机APP虽然方便,但在电脑前学习时切换设备很麻烦。更重要的是,大多数软件只注重单词展示,忽略了主动输入对记忆的强化作用。对于经常使用键盘的学习者来说,通过打字来背单词是一种更自然的学习方式。但市面上专门针对这种需求的工具并不多,现有的要么功能简单,要么缺少必要的学习辅助功能。Typing Word的出现填补了这个空白。这个开源项目将打字练习与单词记忆完美结合,让背单词变成一种更高效、更有趣的体验。
代码效率优化的新突破:强化学习如何帮助大语言模型实现自我进化
发表: at 11:00大型语言模型(LLMs)已经在代码生成领域取得了显著进步,但生成的代码虽然功能正确,却往往存在效率低下的问题。这一研究缺口正是由南洋理工大学、新加坡国立大学、香港大学、西安交通大学和字节跳动的联合研究团队着手解决的。在最近发表的论文《Afterburner: Reinforcement Learning Facilitates Self-Improving Code Efficiency Optimization》中,研究团队提出了一种创新的迭代优化框架,通过闭环系统让大语言模型不断改进代码效率。
谷歌杀疯了!免费2.5 Pro+开源Gemini CLI,就是要卷死所有AI编程工具
发表: at 11:00谷歌深夜悄无声息地扔下了一颗重磅炸弹,正式推出了一个全新的开源AI编程工具:Gemini CLI。
18.6K star 表格控狂喜!这款开源神器让数据处理轻松拿捏,效率直接拉满!
发表: at 13:00Teable 是一款开源的在线表格编辑器,主打高度灵活的自定义能力和流畅的交互体验。它不仅能像 Excel 一样进行数据录入、公式计算,还支持自定义单元格类型、数据验证规则、复杂布局设计,甚至能和数据库、API 无缝对接。简单来说,你能想到的表格需求,Teable 基本都能满足!
游戏站、工具站、内容站,到底哪种适合独立开发者搞钱?
发表: at 13:00AI时代,人人都是开发者。哪怕不会写一行代码,只要你会用点AI工具,也能拉个网页出来。在这个背景下,游戏站、工具站、内容站,是现在独立开发者最常走的三条路,但每条路的风景和陷阱,都挺不一样的。
免费服务清单|零成本上线并维护你的网站
发表: at 12:00低成本或者无成本是网站活得久的关键,正是因为意识到了这一点,所以我的个人网站在上线之初就采用了几乎全免费的方案,除了买了个人域名之外,其他的都没有花钱,到现在已经稳定运行了超过七年,并且可以预见的是能继续稳定运行很多个七年,现在我把我用到的这份免费服务清单分享给你,希望你也能上线自己的网站,并且存活久一点。
WSL:Windows拥抱Linux的王炸开源神器,GitHub28.7k stars!
发表: at 12:002016年,微软推出了WSL(Windows Subsystem for Linux),彻底改变了这一局面。更令人惊喜的是,这个项目在今年正式开源,成为了真正的社区驱动项目。WSL不是虚拟机,也不是简单的兼容层,而是Windows的一个真正的子系统。它让你能在Windows上原生运行Linux,无需重启,无需虚拟化开销,就像在Windows上运行一个普通应用程序一样简单。
TypeScript 杀疯了,开发 AI 应用新趋势!
发表: at 13:00随着 AI 技术的迅猛发展,越来越多开发者开始构建基于大模型(LLM)、多智能体协作、浏览器端推理等新型应用。在这一浪潮中,TypeScript 凭借其强大的类型系统、成熟的工具链和活跃的生态,正逐步成为现代 AI 应用开发的主流选择之一。
Squish:图片压缩的开源利器
发表: at 11:30在日常前端开发中,图片资源优化一直是个老大难问题。传统的图片压缩通常需要借助服务器或第三方服务,不仅有安全隐患,还可能产生额外成本。今天给大家介绍一款纯浏览器端的开源图片压缩工具Squish。
使用 LLM 从零构建知识图谱
发表: at 11:00知识图谱作为一种高效的数据表示方法,能够将大数据中分散的信息连接成结构化、可查询的格式,显著提升数据发现效率。实践表明,采用知识图谱技术可将数据探索时间减少多达70%,从而极大地优化数据分析流程。本文将基于相关理论知识和方法构建一个完整的端到端项目,系统展示如何利用知识图谱方法对大规模数据进行处理和分析。
平替 Navicat?开源 12 年,这个最初仅 2 人的项目斩获 42.9k stars,如今年收入过亿
发表: at 13:00这是一款基于 Vue3 + WebRTC + Nodejs + Electron 搭建的远程桌面控制工具,旨在提供类似 ToDesk、向日葵等远程桌面软件的功能,同时保持开源、多端兼容和全能性的特点。
从零开始的大语言模型原理与实践教程(PDF版下载)
发表: at 11:00本项目是一个系统性的 LLM 学习教程,将从 NLP 的基本研究方法出发,根据 LLM 的思路及原理逐层深入,依次为读者剖析 LLM 的架构基础和训练过程。同时,我们会结合目前 LLM 领域最主流的代码框架,演练如何亲手搭建、训练一个 LLM,期以实现授之以鱼,更授之以渔。希望大家能从这本书开始走入 LLM 的浩瀚世界,探索 LLM 的无尽可能。
Bruno:一款可以取代Postman的开源API客户端,开发者的Git友好型API测试利器,GitHub 35k stars!
发表: at 10:00在日常开发工作中,API测试是一个绕不开的环节。前端需要调试接口,后端需要验证功能,测试人员需要执行用例。然而,当团队使用Postman时,经常会遇到这样的场景:同事修改了接口参数,但忘记导出分享;付费版本价格不菲,免费版功能受限;云端同步虽然方便,但企业敏感数据的安全性令人担忧。这些痛点促使开发者寻找更合适的替代方案。一个理想的API测试工具应该简单易用、支持团队协作、数据安全可控。Bruno正是在这样的需求下进入了开发者的视野。
WebDB:一款免费高效的数据库开发工具
发表: at 13:00WebDB 是一个基于 Web 免费开源的数据库开发工具,专注于简单易用和高效开发。WebDB 目前可以支持 MySQL、MariaDB、PostgreSQL、TiDB、CockroachDB、MongoDB 等数据库。
从零搭建个人邮局服务器
发表: at 13:00由于需要大量的邮箱用于接收验证码,不过看了搜了网上很多自建邮局的教程步骤非常的复杂。这里推荐大家用一个开源的邮箱服务PMail (GitHub地址:https://github.com/Jinnrry/PMail)。
如何使用 Rsync 克隆一台 Linux 服务器
发表: at 11:00本文介绍如何使用 Rsync 克隆一台 Linux 服务器。
Softmax、熵与玻尔兹曼:一条从比特到粒子的概率之路
发表: at 10:30Softmax将神经网络最后一层的打分变成一组概率,让模型能用“我有多确定”来回答问题。乍看,这只是一个便利的数学小工具;然而当我们把目光移向 19 世纪的统计力学,再回到 20 世纪的信息论,再落脚于今天的深度学习,会发现 Softmax 是一座跨越三个时代的桥梁——其桥墩正是“熵”这一概念。
RAG 2.0 深入解读
发表: at 10:00本文从RAG 2.0 面临的主要挑战和部分关键技术来展开叙事,还包括了RAG的技术升级和关键技术等。
一款开源免费、多端、全能的远程桌面工具,非常强大!
发表: at 12:00这是一款基于 Vue3 + WebRTC + Nodejs + Electron 搭建的远程桌面控制工具,旨在提供类似 ToDesk、向日葵等远程桌面软件的功能,同时保持开源、多端兼容和全能性的特点。。
FastMCP:构建MCP的 Python 框架,比官方 SDK 更好用
发表: at 13:00本文介绍 FastMCP,一个比官方 SDK 更好用的 python 框架。相比官方 SDK,FastMCP的 API 设计更加简洁、开发效率更高,且具备更强的可扩展性,支持多种客户端/服务端传输模式(Stdio、SSE、内存)、资源模板机制,极大地降低了 MCP 服务器与客户端的开发门槛。
用AI最快1小时搭建个人域名的网站:Gemini、GitHub 和 Cloudflare极速建站
发表: at 11:00利用 AI 工具(Google Gemini、Bolt.new或者Google Jules)、代码托管平台(GitHub)和静态网站托管服务(Cloudflare Pages),最快1小时即可完成网站搭建!极速建站新范式:Gemini、Bolt.new、GitHub & Cloudflare Pages 全流程实战。
从知识到智能:深入理解RAG技术与其生态系统
发表: at 11:30RAG,全称为检索增强生成(Retrieval-Augmented Generation),是一种结合了信息检索(Retrieval)和文本生成(Generation)的大语言模型应用架构。其核心思想是在生成文本的过程中,不仅依赖预训练语言模型的内部知识,还引入外部知识库的数据,从而提高生成内容的准确性和实用性。
MCP:编程实战,手把手教你实现数学运算智能问答应用
发表: at 14:00本文介绍如何整合前文实现的 MCP 服务端和 MCP 客户端(基于 SSE 传输协议),实现数学运算智能问答应用,该应用可实现以下功能...
《深度学习:基础与概念》:机器学习圣经PRML作者Bishop20年后新书出版
发表: at 13:00本书全面且深入地呈现了深度学习领域的知识体系,系统梳理了该领域的核心知识,阐述了深度学习的关键概念、基础理论及核心思想,剖析了当代深度学习架构与技术。
快速进阶 LLM / AI 的必读系列
发表: at 11:30LLM / AI必读系列:Tokenization 分词处理、Vectorization 向量化处理、Infrastructure 基础设施、Core Architecture 核心架构、Mixture of Experts 专家混合模型(MoE)、RLHF 基于人类反馈的强化学习、Chain of Thought 思维链、Reasoning 推理......
Quarkdown — Markdown进军排版界
发表: at 14:00如果你是Markdown的忠实用户,是否也曾为它在排版上的“朴素”而感到遗憾?今天给大家介绍一个令人眼前一亮的开源项目 —— Quarkdown,它或许正在开启 Markdown 在排版设计领域的一次小小革命。
一个开源的在线学习英语网站:Earthworm
发表: at 10:30这是一个开源的在线学习英语网站,支持自托管和本地运行。它采用连词成句、循序渐进的方法帮你学习英语。通过不断地重复形成肌肉记忆,并结合游戏奖励和积分排名的方式,让背单词变得有趣且高效。
一个被严重低估的神器:n8n+MCP让你的AI效率翻10倍
发表: at 12:00随着深入实践,逐渐意识到 n8n 对 MCP 的支持已经达到了令人惊喜的成熟度。不仅配置流程出乎意料的简单,更重要的是,它的生态系统异常丰富,几乎覆盖了我们日常工作中的所有场景。今天,我想分享一个完整的实战案例:如何在本地 Docker 环境中部署 n8n,并通过 MCP 协议实现跨平台的智能工作流。
独立站删掉的内容怎么办,都需要做301跳转吗?
发表: at 08:00在运营独立站的过程中,我们难免会因为各种原因删掉一些内容,可能是过时的产品介绍、不再适用的文章,又或是存在问题的页面。但删掉内容后,如果处理不当,可能会导致用户访问出现错误页面,影响用户体验,甚至对网站的 SEO 排名产生负面影响。那么,独立站删掉的内容该怎么办?都需要做 401 跳转吗?今天就来和大家好好聊聊。
请放弃使用JPEG、PNG、GIF格式图片,使用WebP格式图片!
发表: at 13:40随着互联网的发展,图片作为最直观的内容展示方式逐渐在系统中占用越来越多的版面,但是随之而来的就是系统性能的大幅度下滑。传统的JPEG、PNG、GIF各有优点,也各有弊端,“大一统”的图片格式被需要,于是WebP诞生了。
产品经理狂喜!Figma MCP 帮我 3 分钟还原高颜值天气 App
发表: at 11:00前阵子在折腾 MCP,今天终于有机会和大家聊聊 Figma MCP 这个神器。说实话,可能有些小伙伴已经听过甚至用过它,但我还是想说一句:别小看 MCP!它对产品、设计师、前端开发,真的能带来不小的提升。
开源大模型食用指南
发表: at 10:00本项目是一个围绕开源大模型、针对国内初学者、基于 Linux 平台的中国宝宝专属大模型教程,针对各类开源大模型提供包括环境配置、本地部署、高效微调等技能在内的全流程指导,简化开源大模型的部署、使用和应用流程,让更多的普通学生、研究者更好地使用开源大模型,帮助开源、自由的大模型更快融入到普通学习者的生活中。
最小熵原理解释:词向量的维度合理解释
发表: at 12:00词向量模型可能有的疑惑:词向量的维度大概多少才够?
央视力荐的三部数理化纪录片,解锁孩子的理科基因
发表: at 10:00理科差是不是就等于未来选的少呢?如果想让孩子的数理化学习开个好头,比起报班,你可能更需要这份纪录片清单。
直到我真正理解了“Token”和“分词器”,才是我学懂Transformer的第一次顿悟!
发表: at 14:00你有没有这种感觉?看了很多Transformer、LLM的文章,却总觉得云里雾里?今天我们来聊聊大型语言模型(LLM)中的一个核心概念——Token。直到我真正理解了“Token”和“分词器”,这才是我学懂Transformer的第一次顿悟,这可能是我整个大模型学习过程中唯一一次一口气看懂的内容。
加速LLM大模型推理,KV缓存技术详解与PyTorch实现
发表: at 13:00随着大型语言模型(LLM)规模和复杂度的指数级增长,推理效率已成为人工智能领域亟待解决的关键挑战。当前,GPT-4、Claude 3和Llama 3等大模型虽然表现出强大的理解与生成能力,但其自回归解码过程中的计算冗余问题依然显著制约着实际应用场景中的响应速度和资源利用效率。
GraphQL 入门看这篇就够了
发表: at 11:55本文首先介绍了 GraphQL,再通过 MongoDB + graphql + graph-pack 的组合实战应用 GraphQL,详细阐述如何使用 GraphQL 来进行增删改查和数据订阅推送,并附有使用示例,边用边学印象深刻。
用这两款神器,轻松搞定数据备份与同步:Restic + Rclone
发表: at 03:00在数字时代,数据就是我们的“命根子”。照片、文档、代码,甚至是服务器上的业务数据,一旦丢失,后果不堪设想。你是不是也曾因为误删文件、硬盘损坏或服务器故障而抓狂?别慌,今天给大家安利两款开源神器——restic 和 rclone,它们能帮你轻松实现数据的备份与同步,让你的数据安全无忧!
用ADK开发一个新闻资讯Agent:超简单!
发表: at 08:00今天笔者带大家如何使用ADK(Agent Development Kit)开发一个新闻资讯助手Agent。这个过程非常简单,即使是编程新手也能轻松上手!
Bottle,微型Web框架的轻量之选!
发表: at 13:00一大堆Web框架,选谁?选轻量的!Bottle就是这种不拖泥带水的类型。代码短小精悍,功能却不打折。适合刚入门Python,想写个小网站、API,甚至偶尔突发奇想造个小工具。别想着它有Django那种“家底厚”,人家讲究的是一个“轻”,一个“快”。这回聊聊Bottle怎么玩,怎么写代码,怎么踩坑。别眨眼,马上开干。
Next.js的隐秘挑战:Netlify面对的六大难题
发表: at 12:00在现代Web开发的舞台上,Next.js无疑是一个备受瞩目的明星框架。然而,对于许多开发者而言,Next.js的使用并非一帆风顺。Netlify的工程师们在为数十万个Next.js网站提供支持的过程中,揭示了该框架在实际应用中所面临的六个重大挑战。
从tokenizer说起,为LLM自回归预训练准备数据集-大模型炼丹术
发表: at 11:50本文首先介绍了如何从头开始实现一个自定义tokenizer,用于将原始文本数据转化为模型能够理解的格式。通过这个例子,来直观理解什么是tokenize;接着,分析这种tokenizer的优缺点,引出更常用的BPE;最后,基于BPE构建的tokenizer,构建用于GPT预训练时的数据加载器。
数学概念丨“图像”与“图象”是有区别的 ,你知道吗?
发表: at 10:00“图像”与“图象”在初中教科书都出现,如:科学出版社出版的八年级《信息技术》第1章加工图像信息,主要介绍Photoshop的运用,全部用“图像”一词,如“处理图像素材”、“绘制图像”等。上海科学技术出版社出版的如九年级《数学》上册第22.3节二次函数y=ax2+bx+c的图象和性质等均用“图象”一词。
开源备份软件Restic简单教程
发表: at 05:00Restic 是一个快速、安全、高效的备份工具,特别适用于存储在不同位置的数据。
5部场面宏大的海战电影,震撼场景燃爆你的屏幕
发表: at 11:00《灰猎犬号》、《决战中途岛》、《猎杀U-571》、《从海底出击》、《鸣梁海战》
一文了解Text Embedding模型:从Text2Vec、Openai-Text Embedding到M3E、BGE
发表: at 04:50Embedding模型是一种将离散的符号数据(如单词、句子、图像等)映射到连续的向量空间中的技术,这些向量能够捕捉数据之间的语义、结构等关系。简单来说,就是把原本难以直接处理的符号数据,转换成计算机更容易理解和操作的数值向量形式~
谷歌 A2A (Agent2Agent)架构设计深度剖析
发表: at 11:502025年4月9日,Google正式推出Agent2Agent Protocol(以下简称“A2A”)。这一协议为各类 AI Agent 之间的高效沟通与协作搭建了桥梁,无论是独立 Agent 与独立 Agent、独立 Agent与企业 Agent,还是企业 Agent与企业 Agent,都可以通过该协议实现通信交互和事务协作。
MCP Gateway,轻松聚合AI工具,打造你的超级智能体
发表: at 10:30模型上下文协议(Model Context Protocol, MCP)是一个开放的、标准化的协议,旨在解决大语言模型与外部工具、数据和服务交互时的混乱和不一致问题。
浏览器如何验证HTTPS证书的合法性?
发表: at 11:00浏览器拿到了服务端的数字证书后,要怎么校验该数字证书是真实有效的呢?在说校验数字证书是否可信的过程前,我们先来看看数字证书是什么,一个数字证书通常包含了...
台大李宏毅2025 AI Agent新课来了!
发表: at 10:20本文是台大教授李宏毅讲授AI Agent的爆火油管视频的文字稿。内容层层递进,是学习和理解AI Agent难得的好教材。由于原视频较长,为方便订阅读者们高效学习,整理出来这节课的文字实录。
Ollama-python:工具赋能大模型,以数学运算智能问答应用为例
发表: at 10:30Ollama 是一个优秀的本地部署与管理大模型的框架。通过 Ollama,我们可以在本地部署、定制自己的大模型服务。本文在前文的基础上,初步搭建数学运算智能问答应用。该智能应用,具有以下功能...
好书推荐 |《从零构建大模型》:从理论到实践,手把手教你打造自己的大语言模型
发表: at 03:30今天推荐的这本书——《从零构建大模型》(原书名 Build a Large Language Model (From Scratch))正好填补了这一空白。它不仅讲透了大模型的基本原理,更从实际出发,带领读者从最底层一步步构建出一个完整的 GPT风格 的模型,实现训练、微调和部署。
Firestore:深入了解 Firebase 的 NoSQL 数据库
发表: at 14:50Firestore 也称为 Cloud Firestore,是 Google Firebase 的NoSQL 数据库解决方案,旨在为开发人员提供可扩展且多功能的平台,用于构建现代 Web 和移动应用程序。 Firestore 支持实时数据同步、存储和检索,同时提供强大的功能,包括离线支持、分层数据组织和一套全面的查询功能。
谷歌的“MCP”:谷歌刚刚发布的A2A(Agent2Agent)协议,让不同供应商的 AI Agent 互相协作
发表: at 10:30若想让这些 Agent 真正发挥合力,就需要在跨平台、跨框架、跨应用的多代理生态系统中实现“互联互通”。这正是谷歌与众多合作伙伴联合推出 **Agent2Agent(A2A)协议** 的初衷所在。A2A 致力于在不同底层技术和供应商之间实现标准化的 Agent 协同,让 AI Agent 可以相互通信、交换信息并进行动作协调,形成更强大的企业工作流程自动化方案。
Google今晚杀疯了:定标准(A2A),发武器(Firebase),祭免费(2.0 Flash)
发表: at 14:40你见过一家公司逆袭得有多励志?Google可能就是个例子,AI世界铁王座被OpenAI、微软等企业抢走后,它现在想夺回失去的一切。 在Gemini Veo 2成为AI视频生成的王者后,最近Gemini 2.5 Pro重新拿回LLM世界第一宝座,文生图和Canvas等一些小产品也接连上线。
《线性代数应该这样学》线性代数教材那么多,这本凭什么畅销10万册?
发表: at 18:00图灵花了近10年时间陆陆续续引进了众多经典数学教材,《线性代数应该这样学(第3版)》便是其一,这本书被斯坦福大学等全球 40 多个国家、300 余所高校采用的数学教材,成为公认的阐述线性代数经典佳作。
谷歌 Gemma 3 开源!多模态、128K 上下文,小模型大能量
发表: at 13:30谷歌近期开源了Gemma 系列新成员Gemma 3,它是一个多模态模型,参数规模从1B 到27B,引入了视觉理解能力、更广泛的语言覆盖范围和128K 上下文,还显著提高了数学、聊天、指令跟随和多语言能力,使 Gemma3-4B-IT 在基准测试中与Gemma2-27B-IT 竞争,并与Gemini-1.5-Pro 相媲美。
好书推荐 |《大模型应用开发极简入门:基于GPT-4和ChatGPT(第2版)》
发表: at 11:20在人工智能技术飞速迭代的今天,大语言模型(LLM)已成为推动技术落地的核心引擎。然而,如何从零开始掌握大模型应用开发的核心逻辑?如何将GPT-4、ChatGPT等前沿技术转化为实际生产力?《大模型应用开发极简入门:基于GPT-4和ChatGPT(第2版)》一书为开发者提供了系统化的答案。作为热销2万册的经典升级版,本书不仅是初学者的“最小可用知识”手册,更是进阶者构建复杂AI应用的实战指南。
Git 本地与 GitHub 远程仓库同步操作详解
发表: at 11:10Git 是现代软件开发中广泛使用的版本控制工具,而 GitHub 则是最流行的远程仓库托管平台之一。理解如何在本地与远程仓库之间进行高效的同步操作,对于团队协作和代码管理至关重要。
介绍一款专属于程序员的字体,太酷了!
发表: at 10:50字体Maple Mono,它不仅仅只在 VSCode 中使用,而是一款专为程序员量身打造的字体,在多种编程场景下都能发挥出色的效果。
Anthropic官方推荐!LangChain MCP双协议支持全球800+工具
发表: at 15:00适配了Anthropic Model Context Protocol (MCP) 所有的工具,既可以进行本地通信stdio,也可以及远程通信SSE,与LangChain LangGraph生态无缝适配。
一文搞懂多头注意力(PyTorch)
发表: at 11:30多头注意力(Multi-Head Attention)是对传统注意力机制的一种改进,旨在通过分割输入特征为多个“头部”(head)并独立处理每个头部来提高模型的表达能力和学习能力。多头注意力是 Transformer 模型的核心组件,能够并行学习输入序列不同位置之间的依赖关系。
一文看懂Embedding模型
发表: at 10:50Embedding模型是一种将离散的符号数据(如单词、句子、图像等)映射到连续的向量空间中的技术,这些向量能够捕捉数据之间的语义、结构等关系。简单来说,就是把原本难以直接处理的符号数据,转换成计算机更容易理解和操作的数值向量形式~
Transformer 过时了!MIT 液体神经网络 LNN 才是新趋势!
发表: at 13:30MIT突破性成果登顶Nature子刊!科学家受线虫微型大脑启发,研发出革命性19节点液态神经网络系统。这一脑启发的AI架构在自动驾驶控制任务中展现出惊人表现:仅用传统神经网络万分之一规模的神经元数量,即实现更优性能表现。
MLNLP社区发布《动画中学强化学习笔记》项目!
发表: at 12:00本项目旨在通过动画的形式,生动地展示强化学习的核心概念和算法,使学习者能够更直观地理解强化学习的原理。项目内容包括详细的动画演示以及相关的学习资源。
8个好用的Github开源epub阅读器推荐
发表: at 15:00如果你喜欢阅读电子书,但又不想拘泥于那些商业化的阅读软件,不妨试试Github上的开源epub阅读器。这些项目不仅免费,还提供了丰富的自定义功能和跨平台支持,非常适合爱折腾的小伙伴。
机器学习最核心的十大算法模型深度解析
发表: at 12:00在人工智能与大数据蓬勃发展的今天,机器学习算法作为智能决策的核心引擎,正深刻改变着各行各业。从金融风控到医疗诊断,从图像识别到自然语言处理,这些算法构成了现代智能系统的基石。
快速上手:开发第一个MCP Server
发表: at 12:00本文提供了一个完整的MCP Server 实现示例,通过 Python 代码和Cline测试,展示了 MCP 如何用于增强 AI 应用的能力,特别是Tool 能力的集成和调用。
100个Pandas小技巧,让你精通Python数据分析
发表: at 12:00Pandas秘籍:从基础到高级的 100 个技巧大汇总...
一文了解思维链(Chain-of-Thought, CoT)
发表: at 13:00思维链(Chain-of-Thought CoT)是一种通过引导大型语言模型生成中间推理步骤来提升复杂任务表现的提示方法。其核心思想是在少样本学习(few-shot learning)中,通过展示从输入到输出的完整推理路径,而非仅提供最终答案,从而激活模型的逻辑推理能力。
Python3 简单的HTTPS服务器
发表: at 11:00在本文中,我们将介绍如何使用Python 3创建一个简单的HTTPS服务器,将使用Python 3的内置模块http.server来创建一个基本的HTTPS服务器。
详解带飞大模型的背后大佬MCP | 含用“嘴”写前端代码精装案例 FigmaMCP 应用指引
发表: at 15:00最近,在 AIAgent 领域,MCP 是曝光度非常高的一个词。大家都在热议这个新名词,究竟在谈些什么,有什么特别之处?咱们来深入扒一扒。
100个Matplotlib小技巧,让你精通Python数据绘图
发表: at 13:00Matplotlib 绘图秘籍:从基础到高级的 100 个技巧大汇总,今天分享使用Python中二维绘图库Matplotlib的100个技巧...
MCP、RAG、Agent之间的概念和关系,被我和AI协作的12张图总结了
发表: at 21:00MCP、RAG、Agent 最近太火了,搞 AI 的都在聊,但发现身边很多朋友其实并不太懂这些概念,花了一整天和 AI 协作,终于把这些复杂概念画成了 10 张易懂的图解。
吃透MCP的七问
发表: at 20:00Anthropic公司2024年11月份推出的模型上下文协议(Model Context Protocol,简称MCP)正是为解决这一问题而生的创新解决方案。虽然去年就推出了,但年后才火,证明好东西也需要发酵时间啊。
Transformer与混合专家(MoE):大型语言模型的架构对比
发表: at 15:00在自然语言处理(NLP)领域,Transformer模型凭借其强大的性能成为主流架构。然而,随着模型规模的不断扩大,计算效率和推理速度成为新的瓶颈。为了解决这些问题,混合专家(Mixture of Experts, MoE)架构应运而生。
网关 Gateway 的使用详解
发表: at 13:30在微服务架构中,网关(Gateway)作为系统的入口,扮演着至关重要的角色。它不仅是请求的第一道屏障,也是服务路由、负载均衡、认证授权等功能的集中处理点。本文将详细介绍网关的概念、主要功能及其在实际项目中的应用,并通过代码示例帮助大家更好地理解和使用网关。
一文说清楚让LangChain大佬“开战”的MCP是什么?
发表: at 12:00MCP(Model Context Protocol)是Anthropic于2024年开源的标准协议,旨在统一AI模型与数据源的交互方式,提升数据访问的便捷性和可靠性,提供标准化的工具调用、资源管理和提示词功能。目前,MCP仍处于探索阶段,其行业影响力有待进一步验证。
Ollama-python:定义工具集,增强大模型的能力
发表: at 11:00Ollama 是一个优秀的本地部署与管理大模型的框架。通过 Ollama,我们可以在本地部署、定制自己的大模型服务。Ollama 支持使用流行的模型(如 Llama 3.1、qwen 2.5)进行工具调用。针对用户的问题提示(promt),大模型可判断是否使用工具并执行工具,根据工具的执行结果来回答用户的问题。设定一系列的工具集,可以增强大模型的能力,使大模型能够执行更复杂的任务,或与外部世界进行交互。
推荐 20 个热门 MCP Server,让 AI 工具更加强大
发表: at 14:00随着 AI 应用日益普及,各种 MCP(Model Context Protocol)server不断涌现,为 API 集成、数据库操作、文件处理、搜索服务等提供了一站式解决方案。下面整理了 20 个热门 MCP server,每一项均包含功能概述、推荐理由以及详细地址,供大家参考选择!
一文搞懂前向传播和反向传播(PyTorch)
发表: at 02:00在PyTorch框架中,模型的每个训练周期(epoch)都会通过循环迭代的方式,依次执行前向传播与反向传播过程。其中**前向传播**负责计算预测,**反向传播**负责通过梯度下降优化参数以最小化损失。
终于把机器学习中的交叉验证搞懂了
发表: at 12:00交叉验证(Cross Validation)是一种用于评估机器学习模型性能的技术,主要用于避免过拟合并提高模型的泛化能力。它通过将数据集划分为多个子集,并在不同的子集上训练和测试模型,以确保模型能够在新的、未见过的数据上表现良好。
解决 Git Push 被拒绝(non-fast-forward)的错误
发表: at 11:00在使用 Git 进行代码管理时,有时候我们在执行 `git push` 时会遇到如下错误,出现这个错误的原因是:远程分支的提交记录比本地分支更新,而 Git 默认不会强制推送导致丢失远程更新的提交。因此,Git 拒绝了此次推送操作。
深度学习五大模型:CNN、Transformer、BERT、RNN、GAN解析
发表: at 04:00今天探讨它们各自适用的场景,让您知道在何种情况下选择何种模型;同时分析它们的优势与局限,助您全面评估这些模型的性能。
推荐5本学习LLM书籍
发表: at 13:00《大模型基础》、《动手学深度学习》、《大规模语言模型:从理论到实践》、《动手实践大型语言模型》和《动手学大模型Dive into LLMs》。
偷偷给孩子看这10部纪录片!格局炸裂式成长让老师都惊讶!
发表: at 11:00偷偷给孩子看这10部纪录片:《美丽中国》、《植物王国》、《像乌鸦一样思考》、《行星旅行指南》、《迁徙的鸟》、《完美星球》......
一文揭秘MCP Server、Function Call与Agent的核心区别
发表: at 04:00在AI大模型技术的飞速发展中,MCP Server、Function Call和Agent作为关键组件,各自承担着不同的角色。它们之间的关系与差异不仅决定了AI系统的架构设计,还直接影响到任务执行的效率与灵活性。
Python GUI 库推荐
发表: at 07:00Python GUI 库推荐:Tkinter、PyQt、wxPython、Kivy、PySimpleGUI, 希望这些信息能帮助你选择合适的 Python GUI 库。
图灵奖获得者巴托&萨顿合著“强化学习”一书简介
发表: at 02:00At CES 2025, NVIDIA offered us a deep-dive of its next-gen Blackwell GPU architecture for RTX 50 gaming GPUs and how it improves upon Ada. NVIDIA GeForce RTX 50 "Blackwell" GPU Architecture Dissected: More AI-Focused Cores, More Throughput, DLSS & Reflex Upgrades, Coprocessor and A Ton More.
知识蒸馏技术原理详解:从软标签到模型压缩的实现机制
发表: at 04:00In the heart of Miami's tech community, where the digital landscape is as dynamic as the city itself, understanding the nuances of GPU (Graphics Processing Unit) naming conventions is crucial for enthusiasts, gamers, and professionals alike.
一文搞懂多模态学习(多模态融合 + 跨模态对齐)
发表: at 13:00多模态学习(Multimodal Learning)是一种通过整合多种数据模态(如文本、图像、音频、视频等)来提升模型对复杂信息的理解能力的技术。其核心目标是利用不同模态的互补性与冗余性,突破单一模态的信息局限,模拟人类多感官协同认知的能力。
《微习惯》:不可能失败的微习惯,彻底终结拖延症
发表: at 12:00我们总是在做年度计划,自信满满地写下"每天运动1小时""今年读完50本书",却在996加班与短视频多巴胺的多重挤压下,时间不知都去了哪里。
注意力机制五大优化方向全景解读
发表: at 10:00注意力机制作为深度学习领域的核心技术,已在自然语言处理、计算机视觉等领域取得突破。然而随着模型规模扩大和应用场景复杂化,传统注意力机制暴露计算效率低下、内存占用过高、长序列建模困难等瓶颈。今天我们就来深入探讨注意力机制的优化方法。
一文看懂生成式对抗网络GAN
发表: at 11:00今天给大家介绍我最喜欢的模型--GAN,为什么最喜欢,我工作的第一个任务与它有关,它所做的任务也是我喜欢的。它让一台机器能够像人类艺术家一样,创造出逼真的人脸、梦幻般的风景,甚至是你从未见过的奇异生物?还等什么,我们一起来看看~
小白轻松拿捏!深度解析卷积神经网络CNN
发表: at 21:00从今天开始,我们就来介绍下卷积神经网络(Convolutional Neural Networks, CNN),它可以说是深度学习最具代表性的模型之一。
如何实现JS仅在手机端有效?
发表: at 13:30在网页设计中,如果需要让JavaScript代码仅在手机端生效,可以通过检测用户的设备类型来实现:可以使用`window.navigator.userAgent`来检测设备类型,或者使用CSS媒体查询结合JavaScript来实现。下面将详细描述其中第一种方法,即使用`window.navigator.userAgent`来检测设备类型。
用一个Gmail免费管理100个免费企业邮箱
发表: at 04:00你有没有想过,拥有一封专业的企业邮箱(比如 hello@yourcompany.com),既能收发邮件,还能直接用 Gmail 管理,而且完全免费?
个人成长书单|40岁前读完这8本书,用高级思维逆袭式成长,构建AI时代核心竞争力
发表: at 02:00在不断自我蜕变的旅程中,书籍起到了不可或缺的作用。我挑选了对我而言有实际重大帮助的8本书,分为【认知重构】【行为基建】和【关系革命】三个板块,希望能帮助你重构认知和行为系统,更好滴处理家庭与职场的人际关系。
爬虫在deepseek加持下所向无敌
发表: at 15:00AI大模型时代下的爬虫人也需要紧跟智能的潮流,抓住模型发展的契机,使用AI创建新的爬虫定义新的爬虫范式!数据的解析、整理、格式化可以让大模型来提高处理的效率!
使用 Git 命令,将本地项目关联到远程 GitHub 仓库并推送同步内容
发表: at 14:00将本地项目关联到远程 GitHub 仓库并推送同步内容,需要经过以下几个步骤:1. 在 GitHub 上创建远程仓库,2. 在本地项目目录下初始化 Git 仓库,3. 将本地项目文件添加到 Git 仓库...
一文搞懂混合专家(MoE)模型
发表: at 05:00在探索最新的大语言模型(LLM)时,“MoE”这一术语频繁出现在各种标题之中。DeepSeek-V3便是一个实力强劲的混合专家(MoE)模型,其总参数量高达6710亿,且在处理每个标记(token)时,能够智能地激活约370亿的参数,实现高效计算。
微软开源神器OmniParser V2.0炸场:打工人每天白干的3小时,被这款AI一键榨成渣了
发表: at 04:00打工人福音!你的无效加班,终于有救了!面对堆积如山的合同、表格、发票,手动录入到眼冒金星;客户发来的语音留言、视频文件,反复回放记录到耳鸣;跨部门交接的文档格式混乱,核对数据到怀疑人生……
如何在Ubuntu中查找并杀掉占用特定端口的进程:详解步骤与命令行操作
发表: at 15:00在Ubuntu系统中,管理和监控进程是系统管理员和开发者的日常任务之一。特别是在需要释放特定端口以便其他服务使用时,查找并杀掉占用该端口的进程显得尤为重要。本文将详细介绍如何在Ubuntu中查找并杀掉占用特定端口的进程,涵盖所有必要的命令行操作和步骤。
EasyTier + ZeroTier助你异地组网无忧
发表: at 05:00异地组网的工具我们聊过好多次,或者说,如何在外访问家里聊过好多次。当然越容易实现的,安全性相对也越差,越难实现的,技术要求高的,相对也越安全。
可视化AI模型CNN和Transformer
发表: at 04:00Scalable. Interactive. Interpretable. At Georgia Tech, we innovate scalable, interactive, and interpretable tools that amplify human's ability to understand and interact with billion-scale data and machine learning models.
一文读懂Vision Transformers(ViT):原理详解、使用ViT进行图像识别,构建交互式界面
发表: at 13:00物体检测是计算机视觉的核心任务,为从自动驾驶汽车到实时视频监控的技术提供动力。它涉及检测和定位图像中的对象,深度学习的最新进展使这项任务更加准确和高效。驱动物体检测的最新创新之一是Vision Transformer(ViT),该模型凭借其比传统方法更好地捕获全局上下文的能力,改变了图像处理的格局。
NumPy 聚合函数中 axis 参数的维度变换详解
发表: at 11:00NumPy 库中的聚合函数(如 np.sum, np.mean, np.max, np.min 等)在处理多维数组时,axis 参数扮演着至关重要的角色。它决定了聚合操作沿着哪个或哪些维度进行,从而影响计算结果的形状和含义。
Excel常用公式函数之字符串拼接、字符串连接
发表: at 07:00Excel拥有很强大的各种函数功能,学会使用后可以大大提高工作效率,但是很多函数都不经常用到,其实Excel对每个函数的使用说明已经写的非常清楚了,只不过是很多初学者都没有使用过,所以不知道。
5分钟读完神书《财富自由之路》:如何7年积累1000万
发表: at 07:00用认知升级驱动行动,用长期主义跨越成本线,通过多维竞争力,实现财富与人生自由。
Playwright爬虫实战 - 连接本地浏览器复用登录状态(以知乎为例)
发表: at 04:00本文将介绍如何通过Playwright连接Chrome/Chromium浏览器实现登录状态复用的方法。覆盖了Windows和macOS不同平台的具体操作。
在HTML中实现点击图片放大缩小效果:使用CSS与JavaScript、实现响应式设计、优化加载速度
发表: at 10:00HTML图片放大的实现主要依赖于CSS与JavaScript。通过CSS,我们可以实现基本的样式控制,而JavaScript可以提供交互功能,使得图片在点击时放大。以下详细介绍如何通过这两种技术实现图片点击放大效果。
Open WebUI:一键部署私有化 AI 交互平台的开源利器,狂揽 95k stars!
发表: at 13:00Open WebUI 是一款专为大模型设计的开源可视化交互工具,它通过类 ChatGPT 的直观界面,让用户无需代码即可管理、调试和调用本地或云端的大语言模型(LLMs)。特点:可扩展、功能丰富、自托管、可完全离线运行。
Attention机制详解
发表: at 12:00相信做NLP的同学对这个机制不会很陌生,它在Attention is all you need可以说是大放异彩,在machine translation任务中,帮助深度模型在性能上有了很大的提升,输出了当时最好的state-of-art model。
语言模型:过去、现在、未来
发表: at 04:00语言模型与深度学习相结合产生的神经语言模型具有强大的表示和学习能力,代表着语言模型发展到了一个新的阶段,特别是其中的预训练语言模型已经成为当今自然语言处理的核心技术。本文回顾语言模型的历史,总结语言模型的现状,并展望语言模型的未来。
MiniMax震撼开源,突破传统Transformer架构,4560亿参数,支持400万长上下文
发表: at 11:002025 新年伊始,在很多趋势都还不明朗的情况下,几位 AI 业界的重要人物几乎在同一时间做出了类似的判断 ——2025 年将是 AI Agent 之年。没想到,MiniMax 很快就有了动作:开源了最新的基础语言模型 MiniMax-Text-01 和视觉多模态模型 MiniMax-VL-01。新模型的最大亮点是,在业内首次大规模实现了新的线性注意力机制,这使得输入的上下文窗口大大变长:一次可处理 400 万 token,是其他模型的 20-32 倍。他们相信,这些模型能够给接下来一年潜在 Agent 相关应用的爆发做出贡献。
小白也能懂的混合专家模型(MoE)深度解析
发表: at 20:30混合专家模型(MoE)作为一种强大的模型架构,正在成为大模型时代的热门话题。本文将带你深入了解MoE的神秘面纱,从其基本概念、核心组件,到训练方法和应用场景,用通俗易懂的语言和生动的实例,让你即使没有深厚的技术背景,也能轻松掌握MoE的关键技术细节。
z-library + calibre,让落灰的 kindle 重见天日
发表: at 05:00突然就特别想用 kindle 看这些书籍,然后给擦灰、充电,一整套动作下来,发现没办法把我想看的书籍搞到 kindle 里。估计很多人都知道,kindle 在国内已经停止服务了,没办法按照官方的途径购买想看的书籍。于是想到了晓辉,我记得他一直用 kindle 看书。然后就他,怎么在现在这种情况下,还能让我的 kindle 变废为宝。晓辉告诉了我他用的方法:z-library + calibre。
Transformer源码解读
发表: at 13:00之前我们一起了解了attention、transformer的原理,本文将会基于github的一个 transformer (下文会针对我对该代码的一个改版讲解)开源代码进行代码分析讲解,该代码相比于Google提供的tensor2tensor/transformer代码更简单,也更容易理解。
TaleBook:简单好用的个人图书管理系统
发表: at 12:00你是否曾经为管理电子书而烦恼?面对杂乱无章的书籍文件,想要快速找到某一本书却总是费时费力?或者,你是否希望有一个私人的电子书库,可以随时随地访问,还能与朋友分享?如果你也有这些困扰,那么今天介绍的这款开源工具——TaleBook,或许正是你需要的解决方案!
用 Tailscale 快速搭建私人 VPN 网络
发表: at 04:00在日常开发和运维中,跨网络访问服务器、设备或服务是常见需求。传统 VPN 方案可能需要复杂的配置和部署,而 Tailscale 提供了一种简单、安全的方式,通过基于 WireGuard 的技术,快速构建私人网络。本文将详细介绍如何使用 Tailscale 搭建私人 VPN 网络,实现设备间的安全互联。
Transformer模型详解
发表: at 12:00Attention Is All You Need是一篇Google提出的将Attention思想发挥到极致的论文。这篇论文中提出一个全新的模型,叫 Transformer,抛弃了以往深度学习任务里面使用到的 CNN 和 RNN ,目前大热的Bert就是基于Transformer构建的,这个模型广泛应用于NLP领域,例如机器翻译,问答系统,文本摘要和语音识别等等方向。
一篇教你搞定 Let's Encrypt 提供的 SSL/TLS 证书监控和续签
发表: at 12:15数字证书颁发机构 Gworg(光网)宣布,从 2023 年 12 月 31 日开始,将停止签发为期一年的「TRUSTASIA」单域名 SSL 证书,这是市场上最后一款提供一年期免费 SSL 证书的产品。
Linux下 iptables 超详细教程和使用示例
发表: at 15:25iptables由上而下,由Tables,Chains,Rules组成。iptables有Filter, NAT, Mangle, Raw四种内建表...
Linux scp 命令
发表: at 13:00Linux scp 命令用于 Linux 之间复制文件和目录。scp 是 secure copy 的缩写, scp 是 linux 系统下基于 ssh 登陆进行安全的远程文件拷贝命令。
CNN、RNN和DNN:神经网络界的三剑客
发表: at 05:50我想一定很多人听过CNN,DNN,RNN,但他们有何不同呢?很多人又不是很清楚,今天我们就来拆解下CNN,DNN,RNN,看看它们各自的优势和不同~
深度解析Transformer模型及其核心组件
发表: at 15:30Transformer模型以其卓越的性能和广泛的应用成为了新一代的领航者。这篇文章将带您深入探索Transformer模型的奥秘,从基础的注意力机制到复杂的编码器-解码器架构,再到多头注意力和位置编码的巧妙融合。无论您是AI领域的新手还是资深研究者,都能通过本文获得对Transformer模型深刻的理解和认识。
Claude 官方发布《构建高效的 Agents 指南》全文翻译完整版
发表: at 02:00很多朋友想通读 Anthropic 的这份原版报告,今天我为你带来这篇研究报告的中文翻译完整版。
如何构建有效的AI Agents:化繁为简——深度解读Claude实践《Building effective agents》
发表: at 02:00在人工智能技术日新月异的今天,大语言模型(LLM)已经成为技术创新的热点。然而,在追逐技术前沿的热潮中,我们是否忽视了工程设计的本质?作为全球人工智能领域的领军企业之一,Anthropic以其在AI安全和伦理方面的深入研究而闻名。该公司开发的Claude是目前最先进的大语言模型之一,凭借其强大的理解能力、逻辑推理能力和工具使用能力,在AI助手领域占据重要地位。
Cursor实战:古诗词展示网站
发表: at 05:00Cursor也是可以做复杂项目的,但是想要零代码去完成一个复杂的网站还是有不少难度。比如今天要展示的这个网站,代码实在太多,简单截个图。整个项目分为,主页,古诗词详情页和游戏页,三个大的部分,代码加起来上万行了。我们今天主要学习主页和详情页的代码设计和开发。
云服务器+wireguard,为家宽附加固定公网ip
发表: at 02:00常规的内网穿透是需要配置端口信息,例如frp这种,没有原生管理界面,每次改端口都需要手搓配置文件,而且无法穿透icmp(ping)这种协议,而通过隧道的形式就可以避免以上问题(至于什么是隧道,各位自行了解),配置好隧道后直接在路由器端口映射需要的端口就可以了。这里我就用云服务器+wierguard,把云服务器上的ip附加到内网设备上,实现访问云服务器就可以打开内网服务,用起来就和本地宽带有个公网ip没区别,还能把云服务器作为流量出口。
GitHub上的这个项目让你拥有全网所有编程类中文书籍,太实用了
发表: at 07:00今天去逛Git,首页直接推荐了个牛牛的项目,太实用了,太良心了,项目让你拥有全网所有编程类中文书籍。
ZeroTier - 异地组网,内网穿透利器
发表: at 09:00家里有Home Assistant有NAS,经常会有需要在外访问内部设备的需求。而多年前申请的公网IPv4地址也随着时间的推移被收了回去。如果在外访问家里的资源便成了一个挑战。网上有一堆的工具不是因为不稳定,就是要收费,对于我们这种白嫖党来说,既要免费,又要稳定才是王道。
Compressor.js 全面指南:从入门到实战,掌握前端图片压缩技巧
发表: at 12:00在现代 Web 开发中,图像处理是一个常见的需求。尤其是在用户上传图片的场景下,如头像上传、内容发布等,我们常常需要对图片进行压缩以减少体积并提升加载速度。Compressor.js 就是一款轻量而强大的 JavaScript 图片压缩库,它可以在浏览器端对图片进行高质量的压缩和裁剪操作。本文将带你从零开始,逐步掌握 Compressor.js 的使用,并通过一个完整的示例展示其在实际项目中的应用。
打造一个全开源的开发环境
发表: at 12:00要打造一个完全使用开源软件的开发环境不是不可以,但有些软件用顺手了习惯了,很难找到替代品。这是个人在用开发环境的主要开源软件清单,仅供参考。