26M 参数的模型,学会了调工具

lxiol
📝
Scrcpy v4.0、Needle 26M模型等

原文链接:https://mp.weixin.qq.com/s/kZv6kKCRFli3yy2n0uh1Nw

Scrcpy v4.0、Needle 26M模型等

Scrcpy 出 4.0 了,有人把 Gemini 压缩成 26M 的模型,还有个能绕过 reCAPTCHA 的新玩具。

省流摘要:Scrcpy v4.0、Needle 26M模型、invisible_playwright、pgGraph、Statewright等 7 个开源项目/AI工具速览。涵盖手机投屏、小模型推理、反检测浏览器、图数据库、AI Agent方向。

热门动态

Scrcpy v4.0 — 手机投屏老将的 SDL3 大升级

★256 HN points | C | 地址: https://github.com/Genymobile/scrcpy/releases/tag/v4.0

手机投屏神器 Scrcpy 跳到 4.0 了。这次最大的变化是从 SDL2 迁移到了 SDL3 — 不是换号那种”升大版本”,是连底层渲染库都换了,从架构到 API 全面翻新。

具体更新列表挺长的,我挑几个实用的说:加了摄像头闪光灯和变焦控制(终于不用边投屏边摸手机找闪光开关了),支持强制窗口比例锁定,还有个 –keep-active 参数让投屏断连后不自动退出。另外默认背景色改成了深灰色,之前那个纯白背景在暗色桌面上真的闪眼睛。

用了这么多年 Scrcpy,它一直是我”装了就忘了装过”的那类工具 — 因为它们用得毫无存在感就是最好的体验。这次 v4.0 的 SDL3 迁移意味着后续的功能扩展空间更大,值得关注。

Needle — 把 Gemini 的工具调用蒸馏进 26M 参数的小模型

★988 | TypeScript | 地址: https://github.com/cactus-compute/needle

HN 上 525 分的 Show HN:有人把 Gemini 的工具调用(Tool Calling)能力蒸馏到了只有 26M 参数的模型里。26M 什么概念?比很多嵌入式模型还小,小到能在树莓派上跑,甚至可能塞进浏览器里的 WebAssembly。

它的做法是拿 Gemini 生成大量工具调用样本,然后用这些小样本训练一个小模型去模仿。结果这个小模型在函数调用、API 路由这些场景上表现相当不错 — 不是要和 GPT-4 比,而是在”几乎不占资源”的前提下跑出可用的工具调用能力。

说实话,”蒸馏大模型的能力进小模型”这条路已经有人走过(比如 Microsoft 的 Phi 系列),但 Needle 的独特之处在于它专攻工具调用这一个能力点,不做通用对话,所以效率极高。如果你在做 Agent 架构相关的开发,需要轻量级的函数调用模块,这值得看一眼。

Bambu Lab 和开源社区的”合同”之争

★1315 HN points | 地址: https://www.jeffgeerling.com/blog/2026/bambu-lab-abusing-open-source-social-contract

今天 HN 头条是 Jeff Geerling 的一篇长文,讲 Bambu Lab 在滥用开源社区的社会契约。1315 个 upvote,评论区炸锅了。

事情大致是这样:Bambu Lab 的 3D 打印机固件基于开源代码,但最近的更新一步步限制用户只能使用官方耗材和官方切片软件 — 而核心代码还是开源的。Geerling 的论点很尖锐:你用开源社区的力量做了产品,然后用技术手段把用户锁在你的生态里,这是不是在利用开源的善意?

这个话题让我想起之前 Unity 的 Runtime Fee 风波,还有 Redis 换许可证的事。开源和商业化之间的张力从来就没解决过,每次有公司想”既要又要”的时候,社区就会炸一次。不站队谁对谁错,但这件事值得每个做开源产品的人思考。

Amazon 员工开始”tokenmaxxing”了

★229 HN points | 地址: https://arstechnica.com/ai/2026/05/amazon-employees-are-tokenmaxxing-due-to-pressure-to-use-ai-tools/

229 分的 Ars Technica 报道:Amazon 员工为了应付公司强制使用 AI 工具的要求,开始搞”tokenmaxxing”——就是用 AI 生成大量无意义的代码、文档和邮件,让自己看起来在用 AI,实际是在刷 KPI。

这个词一出来就火了。tokenmaxxing 本质上是”用 AI 对抗 AI”,和之前”做效率工具的人自己反而最忙”的黑色幽默如出一辙。报道里有个工程师说得很直白:”我的 manager 要看我的 AI usage metrics,那我就生成 500 行代码然后删掉,大家都开心。”

说实话,这种”上有政策下有对策”的故事在科技行业屡见不鲜。当 AI 使用量被当成考核指标的时候,人们自然会想办法刷数据。这不是员工的错,也不是 AI 的错,是”把使用量当成果”这个管理思路本身有问题。

ComfyUI — 112K star 的节点式 AI 画图仍然活跃

★112741 | Python | 地址: https://github.com/Comfy-Org/ComfyUI

ComfyUI 还在持续更新,112K star,是目前最主流的 Stable Diffusion 节点式界面。最近它在往移动端和 API 化方向推进,加上那个让人又爱又恨的节点编排系统也在优化。

坦白讲,ComfyUI 的学习曲线比 Automatic1111 陡不少,但一旦上手,灵活性是其他 UI 没法比的。如果你只是偶尔生成图片,可能用不太上它;但如果你在搭建批量生成 pipeline 或者做复杂的 ControlNet 工作流,ComfyUI 几乎是唯一选择。

新发现

invisible_playwright — 打趴 reCAPTCHA 的浏览器自动化

★33 | Python | 地址: https://github.com/feder-cr/invisible_playwright

今天翻到的,一个刚创建的小项目(33 star),但做的事很硬核:它把 Firefox 150 做了底层修改,加上 Playwright 封装,能在 C++ 层面绕过 reCAPTCHA v3 和 FingerprintPro 的检测。

它的做法不是在 JS 层面改 navigator.webdriver 那种掩耳盗铃的手法,而是直接在 Firefox 的 C++ 引擎里修复指纹暴露点,配上真正的 Windows 指纹,还能走 SOCKS5 代理和屏蔽 WebRTC 泄露。项目描述说”real Windows fingerprints”,意思是浏览器指纹和真实 Windows 机器一模一样。

这种”修改浏览器源码来绕过检测”的思路并不新(puppeteer-extra-plugin-stealth 做过类似的事),但 invisible_playwright 的深度和精度更高 — 它直接改浏览器内核而非插件层面。缺点是需要自己编译 Firefox,部署成本不低。如果你在做爬虫或者自动化测试经常被 reCAPTCHA 拦,这个值得关注。

pgGraph — 给你的 Postgres 加上图数据库超能力

★29 | Rust | 地址: https://github.com/Evokoa/pgGraph

29 star 的 Rust 项目,目标是让 Postgres 原生支持图数据操作。不需要 Neo4j 或者其他专门的图数据库,直接在现有的 Postgres 实例上跑图查询。

它的做法是在 Postgres 上建一层扩展,支持 Cypher-like 查询语法,底层用 Rust 做存储和遍历优化。对于很多中小团队来说,专门搭个 Neo4j 太重了,但普通的 SQL join 做多层关联查询又太慢,pgGraph 刚好卡在这个中间位置。

当然,29 star 说明它还非常早期,API 可能还没稳定。但”把图数据库能力融入已有 Postgres”这个方向很实用,尤其适合那些已经有了 Postgres、不想引入新基础设施的团队。先 watch 着,等它成熟了可能真能用上。

Statewright — 给 AI Agent 上”状态机缰绳”

★202 | 地址: https://github.com/statewright/statewright

HN 上 101 分的 Show HN:用可视化状态机给 AI Agent 加”行为护栏”。说白了就是先画一个状态图(比如 idle → planning → executing → reviewing → idle),然后让 Agent 只能在状态图定义的路径里活动,不能乱跳。

这个思路有意思的地方在于它把 AI Agent 的不可预测性和软件工程里的状态机确定性结合起来了。Agent 自带的推理能力负责”在当前状态内怎么执行”,而状态机负责”什么时候该进什么状态”——分工明确。实话说,现在很多 Agent 框架的问题就是太自由了,模型想干什么就干什么,导致排查问题像在占卜。Statewright 的约束反而是一种保护。

202 star,刚起步。如果你在开发生产环境用的 Agent,这种”加缰绳”的思路可能比”给更多自由”更靠谱。

今天 Scrcpy 4.0 是我会第一时间升级的,invisible_playwright 和 Needle 也让我觉得”嗯,有活”。你呢,哪个最让你想点开链接?明天见。


💬 本文评论区已开启,但暂无读者留言。

本文转载自微信公众号,如有侵权请联系删除。

  • 标题: 26M 参数的模型,学会了调工具
  • 作者: lxiol
  • 创建于 : 2026-05-18 13:19:56
  • 更新于 : 2026-05-18 13:19:56
  • 链接: https://blog.lxiol.cn/2026/05/18/26M-参数的模型学会了调工具/
  • 版权声明: 本文章采用 CC BY-NC-SA 4.0 进行许可。