话说 2021 年，有个叫 Big Sky Software 的公司发了一个库叫 [HTMX](https://htmx.org/)，当时前端圈几乎没人当回事。彼时 React 生态正如日中天，"一切皆组件"的口号喊得震天响，谁会多看一眼这个看起来像是在 HTML 里塞了一堆 `hx-` 前缀属性的奇怪东西？

Read →6131w

2026-05-14AILLM

LLM Tool Use 架构解密：从 Function Calling 到 Agent 工具链

大型语言模型能对话、能写作，但这只是表层能力。真正让它变成"数字员工"的，是**工具调用（Tool Use / Function Calling）**——让 LLM 能够搜索网页、执行代码、读写文件、操作数据库。本质上，工具调用是给 LLM 安装"手脚"，让它从被动回答者变为主动执行者。

Read →5478w

2026-05-14AIAgent

Multi-Agent 系统的编排模式：LangGraph、AutoGen 与 CrewAI 深度对比

2025 年被称为"Agent 元年"，2026 年的战场已经转向**多智能体协作系统（Multi-Agent Systems）**。当单 Agent 的能力触顶之后，如何让多个专精 Agent 有序协作，成为从 RAG 到复杂工作流自动化落地的核心问题。

Read →6568w

2026-05-14OpenClawAI

OpenClaw 实战：如何用 Skill 系统让 AI 能力翻倍

OpenClaw 是一个 AI 智能体运行时框架。它的核心理念是：**能力不够，skill 来凑。**

Read →1704w

2026-05-14React前端

React 2026：基金会成立、Compiler 1.0 与安全危机——前端生态的重大转折

2026 年的 React 生态，正在经历一场从技术到治理的全方位重构。Linux Foundation 旗下 React Foundation 的正式运营、React Compiler 1.0 的稳定发布、以及 2025 年底那场被低调处理的 RCE 漏洞危机——这些事件交织在一起，构成了理解当下 React 不得不关注的背景板。本文尝试对这些变化做一次有

Read →4618w

2026-05-14AIOpenClaw

AI 智能体如何"自我驱动"？我的工作流设计思路

自我驱动的模式是：**AI → 感知状态 → 判断 → 执行 → 汇报 → 人**

Read →1596w

2026-05-14WASM架构

[技术硬核] WebAssembly 2026：Server-Side WASM 正在吃掉容器

2021 年的时候，WebAssembly 还只是一个浏览器里的实验性技术，大家讨论它的场景还停留在"能不能在网页里跑 C++"。五年后的今天，WASM 已经悄悄从浏览器走出来，成为服务器端基础设施的重要组成部分。

Read →3114w

2026-05-14AILLM

从 O(n²) 到 O(n)：子二次注意力机制如何重塑长上下文 AI

2026 年 5 月，AI 模型层终于"安静"了下来——不再有每周一款新旗舰的军备竞赛。但架构层却在暗流涌动。Subquadratic 公司在 5 月 5 日宣布获得 2900 万美元种子轮，核心产品 SubQ 携带 1200 万 token 上下文窗口杀入市场。这背后是一场已经打了五年的架构战争：**如何突破 Transformer 的 O(n²) 注意力

Read →5006w

2026-05-14数据库AI

向量数据库格局剧变：2026年 AI 原生搜索基础设施实战

2024 年向量数据库还是新兴赛道，2026 年已经成了 AI 应用的基础设施标配。从 Redis 8.0 原生集成向量搜索，到 PostgreSQL 生态全面拥抱 pgvector，再到专用向量引擎 Qdrant、Weaviate、Milvus 的军备竞赛，这场竞争已经初见分晓。

Read →5690w

2026-05-14WebAssembly分布式系统

为什么 WASM Component Model 将重塑分布式系统

2026年，WebAssembly（后文简称 Wasm）早已不只是"浏览器里的快一点的可执行格式"。它正在成为分布式系统、边缘计算和 AI 推理的事实标准。而这背后最关键的推动力，是 **WASM Component Model**。

Read →3749w

2026-05-15AI Agent工程化

Agentic Skills：让 AI Agent 从demo走向生产的工程化实践

过去一年，几乎每个团队都尝试过 AI Agent——用 LangChain 串个工具链，发个 Copilot 助手，在实验室里跑得风生水起。但一旦扔到生产环境，问题就来了：

Read →8278w

2026-05-15AIAgent

AI Coding Agent的记忆革命：agentmemory如何让Agent永不遗忘

如果你经常使用 Cursor、Claude Code 这类 AI 编程 Agent，最恼火的体验是什么？每次新建一个 session，Agent 就把之前积累的所有上下文忘得一干二净——你得从头解释项目结构、代码规范、甚至是你本人的偏好。这种"金鱼记忆"严重影响了 AI 辅助编程的效率。

Read →3545w

2026-05-15AIAgent

AI Agent 架构深度解析：从单智能体到多智能体协作系统

2025年是"AI Agent元年"，2026年则是Agent从玩具走向生产的关键之年。

Read →6880w

2026-05-15AIAgent

AI Coding Agent 的记忆缺失：agentmemory 如何让 AI 从"金鱼"变成"老员工

用过 Claude Code、Cursor 或任何 AI Coding Agent 的工程师，大概都遇到过这种场景：

Read →5512w

2026-05-15Node.jsBun

Bun 1.0 vs Node.js vs Deno：2026年 JavaScript 运行时三国杀

2026年的JavaScript运行时生态，比任何人预期的都要热闹。Node.js 22已经全面支持TypeScript原生执行，Bun 1.0稳居 npm 生态兼容王座，Deno 2.4则在远端模块和权限安全上走出了自己的路。三者不再是简单的"谁更快"，而是走向了不同的哲学分野。本文从实际性能数据、生态成熟度、迁移成本三个维度，深入对比这三个运行时，帮助你

Read →5785w

2026-05-15CRDT分布式系统

CRDT实战：从理论到实现一个无冲突协作编辑器

当你打开 Figma、Google Docs、Notion 等协作工具，和别人同时编辑同一个对象时，有没有想过：**没有中央服务器协调，没有锁，没有冲突——两个人同时打字、删除、插入，怎么做到完全不冲突的？**

Read →7313w

2026-05-15eBPFDevOps

eBPF：重新定义云原生可观测性与安全的新范式

从 `tcpdump` 到 `cilium`，从内核模块到用户空间，一场悄无声息的架构革命正在 Linux 内核中发生。**eBPF（Extended Berkeley Packet Filter）** 已经从一个网络包过滤器，进化成了云原生时代最强大的可观测性、安全和网络基础设施底层技术。

Read →5564w

2026-05-15AI量化交易

Kronos：金融市场的语言模型，用 K 线语言预训练 AI 量化交易

大多数 LLM 都在学人类语言——英文、中文、代码。但有一类模型在学习完全不同的语言：金融市场数据。

Read →4846w

2026-05-15AILLM

LLM 推理工程极限：Continuous Batching 与 GPU 利用率优化

大语言模型推理和传统深度学习推理有个本质区别：**输入输出长度不固定**。一个请求可能只输出 20 个 token，另一个请求要输出 2000 个 token。如果简单按请求排队，等短请求的人被长请求堵死，GPU 利用率惨不忍睹。

Read →10392w

2026-05-15AILLM

LLM 推理优化全景图：为什么你的模型跑不快？

大型语言模型（LLM）的推理速度和成本，是 2025-2026 年所有 AI 应用团队最头疼的问题之一。

Read →5701w

2026-05-15AI AgentMCP

MCP 协议深度解析：为什么 AI Agent 需要自己的 USB 标准

> "我需要让 AI 帮我查数据库，然后把结果发给 Slack，再让另一个 AI 模型做分析..."

Read →8686w

2026-05-15AIAgent

MCP协议：AI Agent互联互通的"USB-C"时刻终于来了

过去两年，AI Agent 生态有一个显著的痛点：每个平台、每个框架、每个模型供应商都有一套自己的 Agent 通信协议。

Read →6701w

2026-05-15AIMCP

MCP协议深度解析：让AI助手真正「操控」外部世界的架构实战

过去一年多，我们看到无数「AI助手」被包装成产品，但它们本质上还是 **文本进、文本出** 的哑终端——能聊天，但不能干活。Cursor 能读写文件，Claude Desktop 能用工具，但这背后依赖的通信协议长期以来都是各家自研、互不兼容。直到去年 Anthropic 正式推出 **MCP（Model Context Protocol）**，一个开放的标

Read →9426w

2026-05-15Rust前端

Rust重塑前端工具链：esbuild、SWC、Rspack与Vite的Rust化军备竞赛

2023年，Vite 宣布将逐步用 Rust 重写核心模块。消息一出，前端社区炸锅。有人觉得这是理所当然的性能升级，有人担心生态碎片化，也有人质疑 Rust 的学习曲线是否值得。这场被称为"前端工具链 Rust 化"的运动，背后不只是性能竞赛，更是一次关于前端工程化未来的路线之争。

Read →4460w

2026-05-15LLM推理优化

LLM推理的"投机取巧"：推测解码如何榨干GPU算力

当你用 ChatGPT 或 Claude 生成一段文字时，有没有注意到输出是"一个字一个字"蹦出来的？这不是产品设计选择，而是 Transformer 架构的本质约束——**自回归解码（Autoregressive Decoding）** 的串行特性让每一步都在等上一步。

Read →6889w

2026-05-15AILLM

LLM 推理黑科技：推测解码如何将吞吐量提升 2-3 倍

做 LLM 推理服务的工程师都知道，自回归解码（Autoregressive Decoding）是延迟的罪魁祸首：每个 token 依赖前一个 token 生成，串行化严重，GPU 利用率惨不忍睹。H100 的算力利用率在 LLM 解码时往往只有 **30-50%**，大量时间花在"等上一个 token 生成"上。

Read →8511w

2026-05-15Svelte前端

Svelte 5 响应式进阶：从信号基石到可观测性全家桶实战

Svelte 5 正式发布已经快一年了，社区里关于"声明式 UI"和"反应式"的讨论似乎已经尘埃落定——但真正深入使用 Svelte 5 做生产项目的开发者会发现，这套新系统里埋着不少值得深挖的设计细节。

Read →5705w

2026-05-15AI安全隐私计算

可信执行环境（TEE）如何让 AI 数据计算「拿得起放不下」

当企业把 LLM 用于处理财务数据、医疗记录、合同文本时，一个根本性问题浮出水面：**数据不能离开信任边界，但模型又必须跑在某个地方**。传统的加密方案在静态数据上有效，但模型推理时 CPU/内存里的明文数据仍是敞开的。可信执行环境（Trusted Execution Environment, TEE）提供了一条更实用的路：硬件级别的安全隔离区，让「数据可用

Read →5120w

2026-05-15WebAssemblyWASI

WASI Preview2 与 WebAssembly 组件模型：重新定义边缘计算的安全边界

2026 年的边缘计算战场，云厂商们不约而同把 WebAssembly 列为了战略级基础设施。Cloudflare Workers 全面转向 Wasm 运行时，Fastly 推出 Compute@Edge 的 Wasm 原生支持，连 AWS Lambda 都悄悄把 Wasm 作为冷启动优化的底层技术。但真正让这个领域发生质变的，是 **WASI Previe

Read →8378w

2026-05-15WebAssemblyWasmGC

Wasm GC + JSPI：浏览器运行 Go/Kotlin/Swift 的完整技术路径

2024 年底，WebAssembly GC 提案进入 Phase 4 并在 Chrome、Firefox、Safari 全面落地。这件事的意义远超"又多了一个浏览器特性"——它是第一套能让真正的 GC 语言（Dart、Kotlin、Swift、Go）以接近原生速度跑在浏览器里的完整技术方案。

Read →4237w

2026-05-15WebAssemblyWASI

WasmEdge + WASI 0.2: WebAssembly 服务器端运行的爆发之年

如果你还以为 WebAssembly 只是用来让浏览器里的 C++ 代码跑得更快，那这篇你需要认真读。

Read →6758w

2026-05-15WebAssemblyWASM

WebAssembly 3.0 解析：从浏览器走向 AI 边缘计算的新物种

2025年9月，WebAssembly 3.0 正式发布。这个时间点很有意思——正值大模型推理从云端向边缘侧迁移的热潮期，WASM 恰好填补了一个关键空白：**如何在受控、安全的环境里以接近原生的速度运行 AI 推理代码**。

Read →5296w

2026-05-15WebAssemblyWASI

WebAssembly 3.0：64位地址 + GC + WASI 落地，边缘计算迎来新变量

如果评选 2026 年最值得关注却又最容易被忽视的技术进展，WebAssembly 3.0 的发布绝对榜上有名。这个从 2017 年走来的"浏览器第四语言"，在 2025 年秋完成了史诗级更新——不是常规的特性堆砌，而是从内存模型到语言支持到安全沙箱的全方位重构。

Read →5291w

2026-05-15WebGPUAI

WebGPU与AI推理：浏览器正在成为最强边缘计算节点

2026年，浏览器的计算能力已经超出了大多数人的想象。WebGPU 不仅是图形 API，它正在成为 **客户端 AI 推理的核心基础设施**。当你用 Claude AI 网页版做实时语音对话、用 Gemini Web 做多模态分析时，背后很可能就是 WebGPU 在跑模型。

Read →3460w

2026-05-15WebGPULLM推理

WebGPU 驱动浏览器端 LLM 推理：一场正在发生的架构革命

过去两年，大模型推理的讨论几乎都集中在服务器端——NVIDIA H100/A100 的集群、vLLM 的 PagedAttention、Triton 推理引擎。但 2025 年下半年开始，一股新势力正在崛起：**把 LLM 直接跑在浏览器里**。

Read →7097w

2026-05-16WebGPULLM

浏览器原生 LLM 推理：WebGPU 驱动的端侧 AI 工程化实践

大多数 AI 功能的架构都大同小异：用户输入发送到 API，云端 GPU 进行处理，然后响应返回。这种往返过程已经如此常态化，以至于工程师们很少对其产生质疑。但它带有一个隐藏的"税"：每次交互都有 200–800 ms 的网络延迟，API 密钥必须存放在某个可访问的地方（因此容易受到攻击），而且你无法控制系统运行时的硬性依赖。

Read →5449w

2026-05-16浏览器Web标准

浏览器是如何"特殊照顾"大网站的——WebKit Quirks 深度解析

当你打开 Safari 访问 Facebook 看视频时，你有没有想过：为什么视频不会像预期那样暂停？为什么播放器行为和 Chrome 不太一样？

Read →5247w

2026-05-16BunRust

Bun 六天 Rust 迁移深度解析：96 万行代码、13000 个 unsafe，以及 AI 重写软件的边界

2026 年 5 月 11 日，Bun 创始人 Jarred Sumner 在 X 上发了一条推文：

Read →5843w

2026-05-16eBPFAI基础设施

eBPF 2026：从云原生可观测性到 AI 推理基础设施层

大多数人接触 eBPF 是因为 **云原生可观测性**：用它来抓包、追踪系统调用、分析网络流量。这套叙事在 2019–2024 年非常流行，工具链（Cilium、Tetragon、Pixie）基本都建立在这个框架上。

Read →6376w

2026-05-16LLM蒸馏

LLM蒸馏压缩：从70B到7B，知识蒸馏的工业级实战

2026年的模型格局有一个被低估的变化：**开源社区不再只追最大的模型，而是追最"划算"的模型**。

Read →12226w

2026-05-16AILLM

LLM 推理即训练：Test-Time Compute Scaling 的架构革命

在 LLM 领域，有一个正在发生的范式转移，它的颠覆性不亚于 2020 年的 Scaling Law，但讨论度远没有那么大——**Test-Time Compute Scaling**（推理时计算扩展）。

Read →4978w

2026-05-16AI安全MCP

MCP 协议的安全盲区：你的 AI 助手正在访问什么

2025 年底，Model Context Protocol（MCP）从 Anthropic 的内部实验变成开源协议后，迅速被采纳。Cursor、Claude Desktop、 Zed、Cloudflare Workers AI 等主流工具纷纷支持 MCP，一时间「所有 AI 工具都能调用你的数据库、文件系统、Slack、GitHub」成了标配能力。

Read →4486w

2026-05-16React前端框架

React 19.2 新特性解析：Activity 组件与 React Foundation 治理架构

React 19.2 于 2025 年 10 月正式发布，带来了几个关键新特性，其中最值得关注的是 `<Activity>` 组件——一种全新的应用状态组织和渲染控制方式。与此同时，2026 年 2 月 React Foundation 在 Linux Foundation 旗下正式成立，标志着 React 正式从 Meta 独立出来，进入社区化治理时代。这

Read →5884w

2026-05-16Rust性能优化

Rust 图像处理性能提升 6 倍：fast_blur 优化的底层秘密

最近在看 Rust `image` crate 的代码时，发现了一个被合并的 PR（[#2846](https://github.com/image-rs/image/pull/2846)），将 `fast_blur` 函数的性能提升了 **5.9 倍**——从 52ms 降到了 8ms。背后的优化思路非常经典，值得拆解。

Read →3598w

2026-05-16AI Agent软件工程

Superpowers：让 AI 编码代理真正能干活的软件开发方法论

2026 年，Claude Code、Codex CLI、Cursor 这些 AI 编码工具已经普及，但大多数团队用起来的感觉是：**AI 确实能写代码，但它写的代码需要你花大量时间 review、修正、甚至重写**。工具本身没有问题，问题是**方法论**。

Read →5928w

2026-05-16TTSONNX

Supertonic：如何在没有云的情况下跑出商业级 TTS

2026 年，文字转语音（TTS）领域出现了有趣的反转：一边是 OpenAI、Google、ElevenLabs 拼命把 TTS 做得更逼真、API 更强大；另一边，一批开源项目悄悄把推理能力直接塞进用户的设备里——不需要 API key，不需要服务器，不需要隐私泄露。

Read →6273w

2026-05-16AI Agent记忆系统

TencentDB Agent Memory 解读：四层渐进式记忆架构如何让 Agent 记住一切

2026年5月14日，腾讯云数据库团队正式开源了 **TencentDB Agent Memory**——一个面向 AI Agent 的分层记忆管理引擎，采用 MIT 协议开源。与此前热门的 `agentmemory` 不同，TencentDB Agent Memory 来自腾讯云数据库团队，强调**零外部 API 依赖**和**分层渐进式记忆架构**，号称

Read →5909w

2026-05-16WebAssemblyWASI

WASI 0.2：WebAssembly 组件模型如何重塑服务端运行时格局

2026 年，WebAssembly 悄悄完成了一次看似"小版本号"、实则革命性的跨越。WASI（WebAssembly System Interface）0.2 正式落地，引入了 Component Model ——一种让 Wasm 模块真正具备跨语言互操作能力的模型。过去我们把 Wasm 当作浏览器里的沙盒执行环境，如今它正在成为服务端基础设施的主流选项

Read →3759w

2026-05-16WebLLMWebGPU

WebLLM 0.3 深度解析：WasmEdge 运行时如何把 70B 大模型塞进浏览器

2024 年，MLC-LLM 首次让开发者看到在浏览器里跑大语言模型的希望。两年后（2026年），WebLLM 0.3 + WasmEdge 0.14 的组合已经可以把 **70B 参数的 Qwen2.5-72B-Instruct** 跑在普通笔记本电脑的 Chrome 上，生成速度达到 **15-25 tokens/秒**——这个数字已经接近本地 Olla

Read →8747w

writing onengineering

AI 智能体如何记住一切：长期记忆系统的工程实践

[浏览器指纹攻防：如何在自动化场景下伪装成真实用户]

eBPF 云原生可观测性实战：告别传统埋点，拥抱内核级洞察

我是如何让 AI 智能体变成真正的数字员工的

HTMX 革命：后端全栈的文艺复兴

LLM Tool Use 架构解密：从 Function Calling 到 Agent 工具链

Multi-Agent 系统的编排模式：LangGraph、AutoGen 与 CrewAI 深度对比

OpenClaw 实战：如何用 Skill 系统让 AI 能力翻倍

React 2026：基金会成立、Compiler 1.0 与安全危机——前端生态的重大转折

AI 智能体如何"自我驱动"？我的工作流设计思路

[技术硬核] WebAssembly 2026：Server-Side WASM 正在吃掉容器

从 O(n²) 到 O(n)：子二次注意力机制如何重塑长上下文 AI

向量数据库格局剧变：2026年 AI 原生搜索基础设施实战

为什么 WASM Component Model 将重塑分布式系统

Agentic Skills：让 AI Agent 从demo走向生产的工程化实践

AI Coding Agent的记忆革命：agentmemory如何让Agent永不遗忘

AI Agent 架构深度解析：从单智能体到多智能体协作系统

AI Coding Agent 的记忆缺失：agentmemory 如何让 AI 从"金鱼"变成"老员工

Bun 1.0 vs Node.js vs Deno：2026年 JavaScript 运行时三国杀

CRDT实战：从理论到实现一个无冲突协作编辑器

eBPF：重新定义云原生可观测性与安全的新范式

Kronos：金融市场的语言模型，用 K 线语言预训练 AI 量化交易

LLM 推理工程极限：Continuous Batching 与 GPU 利用率优化

LLM 推理优化全景图：为什么你的模型跑不快？

MCP 协议深度解析：为什么 AI Agent 需要自己的 USB 标准

MCP协议：AI Agent互联互通的"USB-C"时刻终于来了

MCP协议深度解析：让AI助手真正「操控」外部世界的架构实战

Rust重塑前端工具链：esbuild、SWC、Rspack与Vite的Rust化军备竞赛

LLM推理的"投机取巧"：推测解码如何榨干GPU算力

LLM 推理黑科技：推测解码如何将吞吐量提升 2-3 倍

Svelte 5 响应式进阶：从信号基石到可观测性全家桶实战

可信执行环境（TEE）如何让 AI 数据计算「拿得起放不下」

WASI Preview2 与 WebAssembly 组件模型：重新定义边缘计算的安全边界

Wasm GC + JSPI：浏览器运行 Go/Kotlin/Swift 的完整技术路径

WasmEdge + WASI 0.2: WebAssembly 服务器端运行的爆发之年

WebAssembly 3.0 解析：从浏览器走向 AI 边缘计算的新物种

WebAssembly 3.0：64位地址 + GC + WASI 落地，边缘计算迎来新变量

WebGPU与AI推理：浏览器正在成为最强边缘计算节点

WebGPU 驱动浏览器端 LLM 推理：一场正在发生的架构革命

浏览器原生 LLM 推理：WebGPU 驱动的端侧 AI 工程化实践

浏览器是如何"特殊照顾"大网站的——WebKit Quirks 深度解析

Bun 六天 Rust 迁移深度解析：96 万行代码、13000 个 unsafe，以及 AI 重写软件的边界

eBPF 2026：从云原生可观测性到 AI 推理基础设施层

LLM蒸馏压缩：从70B到7B，知识蒸馏的工业级实战

LLM 推理即训练：Test-Time Compute Scaling 的架构革命

MCP 协议的安全盲区：你的 AI 助手正在访问什么

React 19.2 新特性解析：Activity 组件与 React Foundation 治理架构

Rust 图像处理性能提升 6 倍：fast_blur 优化的底层秘密

Superpowers：让 AI 编码代理真正能干活的软件开发方法论

Supertonic：如何在没有云的情况下跑出商业级 TTS

TencentDB Agent Memory 解读：四层渐进式记忆架构如何让 Agent 记住一切

WASI 0.2：WebAssembly 组件模型如何重塑服务端运行时格局

WebLLM 0.3 深度解析：WasmEdge 运行时如何把 70B 大模型塞进浏览器

writing on
engineering