原文链接:https://mp.weixin.qq.com/s/shTViuzx6HXTSzmLRu9e5w
当地的 LLM 生态系统不需要 Ollama;它需要的是 llama.cpp。
Ollama 是目前运行本地大型语言模型的最流行方式。但实际上它本不该如此。它之所以能占据这一地位,是因为它是第一个让那些不想编译 C++或编写服务器配置的人也能使用 llama.cpp 的工具。...
原文链接:https://mp.weixin.qq.com/s/H0HWcz0kWjCPijR_vDDC5g
出海web开发有种情况很普遍:它写了一段代码,能跑,你大概知道它在做什么,然后你 commit 了。没问,没让它解释,因为感觉差不多懂了。
三个月后那段代码出了问题。你打开文件,发现你根本不确定某个判断逻辑为什么这么写,也不知道如果改这里会不会影响其他地方。
然后你花了两小时排...
原文链接:https://mp.weixin.qq.com/s/62CSEo21IWycjeC7pQDSRA
——使用软连接为文件夹、文件创建快捷方式问题描述最近我在Obsidian里通过Claudian插件使用Claude Code的上下文管理机制,包括CLAUDE.md和skills,但Claude Code对这两种文件都有严格的路径要求。
CLAUDE.md(业务规则):
• 文...
原文链接:https://mp.weixin.qq.com/s/R9rcRdZsP4LJaux2x9OAhA
MiniMax M2.7实战
最近这段时间,各家大厂发布新模型的频率确实太快了。
DeepSeek V4、MiniMax M2.7,再到国外的 GPT-5.5、Claude Opus 4.7 轮番轰炸。
尤其是 OpenClaw 的爆火,让 API 突然变成了非常大的刚需。
...
原文链接:https://mp.weixin.qq.com/s/FjPavJml_-PMnHEvCoSQ7w
“你的AI终于从’话痨’变成’干事’的了,但代价是……内存可能不够用。”一、这次更新到底改了啥?
“你的AI终于从’话痨’变成’干事’的了,但代价是……内存可能不够用。”一、这次更新到底改了啥?前两天腾讯QClaw发了V0.2.14,”接入HERMES框架支持”。****
...
原文链接:https://mp.weixin.qq.com/s/0eVu9s92GWYjd5GdIl4x4Q
最近在GitHub上刷到这个开源项目,试了一下感觉很不错。
https://github.com/sirmalloc/ccstatusline
用 Claude Code 的人都知道,默认的终端界面信息量很少。
跑着跑着你也不知道现在用了多少 Token、当前是什么模型、Git...
原文链接:https://mp.weixin.qq.com/s/6OiZqgQ5fADUIKar2hWO1w
Karpathy 列了几个跟 Claude Code 协作时反复踩的坑:LLM 替你做错误假设然后一路狂奔,爱过度复杂化,顺手改无关代码——100 行能解决的非要写 1000 行。
Forrest Chang 看完做了件挺务实的事:不写博客,直接把这些痛点编译成一份 CLAUDE...
原文链接:https://mp.weixin.qq.com/s/AUPgzCy-PlxHW9-nY_qpRA
关于 Chrome 里的 Gemini Nano,国内软文已经吹过一轮了。本文换一个角度:不谈它有多强,只问一件事:它到底是怎么进到你电脑里的。你打开 Chrome,正常上网,什么都没点。十分钟后,4GB 的东西已经悄然埋在你硬盘里了。
关于 Chrome 里的 Gemini...
原文链接:https://mp.weixin.qq.com/s/2cX8KNXPWvJBA8195HwFWQ
不同模型平台各有各的 API、鉴权方式和限制,接入成本极高。直到我发现一个开源工具。它本质上是一个 本地 AI API 网关:把各家官方 Web AI 平台 → 统一转成 OpenAI 兼容接口。
关键词:Chat2API教程、DeepSeek本地调用、Qwen本地API、O...
原文链接:https://mp.weixin.qq.com/s/3huN7vGcWHfVLvGdJ-JbPQ
vMLX:把Mac变成AI工作站——开源MLX推理引擎+MLX Studio桌面版,语音、视觉、代码代理一应俱全
vMLX 是专为 Apple Silicon M 系列芯片开发的本地 AI 推理引擎,开源在 GitHub 项目 jjang-ai/vmlx 下。能在 ...