一招教你免费将DeepSeek、Qwen、Kimi、GLM等主流ai大模型网页转换成本地api任意调用 彻底实现token自由!
不同模型平台各有各的 API、鉴权方式和限制,接入成本极高。直到我发现一个开源工具。
它本质上是一个 本地 AI API 网关:把各家官方 Web AI 平台 → 统一转成 OpenAI 兼容接口。
关键词:Chat2API教程、DeepSeek本地调用、Qwen本地API、OpenAI兼容接口、本地AI代理、多模型统一管理

名称
链接
Chat2API客户端 下载
https://dooo.fun/archives/1644

最近在折腾本地 AI 工作流时,遇到一个非常现实的问题:
不同模型平台各有各的 API、鉴权方式和限制,接入成本极高。
直到我发现一个开源工具 —— Chat2API。
它本质上是一个 本地 AI API 网关:
把各家官方 Web AI 平台 → 统一转成 OpenAI 兼容接口。
这意味着什么?
任何支持 OpenAI API 的工具,都能直接用 DeepSeek、Qwen、Kimi、GLM 等模型。
例如:OpenWebUI、Cline、Roo-Code、Cherry Studio 等。
一、Chat2API 是什么?

Chat2API = 本地 AI API 代理 + 多模型统一管理平台
核心思路非常巧妙:
- 不走官方 API 计费
- 直接驱动 各家官方 Web UI
- 本地转为 OpenAI 标准接口
换句话说:
传统方式
Chat2API方式
每家模型单独接入
一次接入全部模型
API 费用高
0 成本使用
接口不统一
OpenAI 标准统一
二、核心功能详解
1️⃣ OpenAI 兼容 API
提供标准接口:
1 | `http://localhost:8080/v1/chat/completions` |
所有支持 OpenAI API 的工具都能直接连接。
例如:
- OpenWebUI
- Cline
- Roo-Code
- Cherry Studio
- Kilo Code
真正实现 即插即用。
2️⃣ 多服务商支持
目前支持的模型渠道非常全面:
服务商
模型
DeepSeek
DeepSeek-V3.2
GLM
GLM-5
Kimi
kimi-k2.5
MiniMax
MiniMax-M2.5
Perplexity
Sonar / Deep Research
Qwen(国内)
Qwen3系列
Qwen(国际)
Qwen-VL / Turbo
Z.ai
GLM 系列
基本覆盖主流大模型生态。
3️⃣ 上下文管理(重要)
这是很多代理工具没有的功能:
支持:
- 滑动窗口
- Token 限制
- 自动总结压缩
作用:
避免上下文爆炸导致的对话丢失或费用增加。
4️⃣ 工具调用支持(Function Call)
通过提示词工程实现:
- 通用 Tool Call 能力
- 兼容 Cherry Studio / Kilo Code
这意味着:
即使模型不原生支持 Function Call,也能模拟实现。
5️⃣ 模型映射(非常实用)
支持:
- 模型名称通配符
- 首选服务商策略
- 多账户切换
例如:
-
-
1 | `gpt-4 -> DeepSeek``gpt-3.5 -> Qwen` |
客户端完全无感。
6️⃣ 自定义 Header(高级玩法)
可以开启:
- 联网搜索
- 深度思考
- 深度研究模式
属于进阶功能。
7️⃣ 仪表盘监控
可视化查看:
- 请求量
- Token 使用
- 成功率
- 请求日志
对于排查问题非常关键。
三、下载安装
名称
链接
Chat2API客户端 下载
https://dooo.fun/archives/1644
四、详细使用教程
步骤1:启动应用
安装后打开 Chat2API,进入主仪表盘。
步骤2:添加模型供应商
进入 供应商页面 → 添加供应商
以 DeepSeek 为例:

获取 DeepSeek Token
随便发送一句话
按 F12
打开:
1 | `Application → Local Storage` |
找到:
1 | `userToken` |
复制即可。
然后填入 Chat2API。
步骤3:启动本地代理
进入 代理设置
推荐配置:
项目
建议
端口
8080
负载均衡
轮询
故障策略
自动切换
点击 启动代理
当看到运行成功,说明:
1 | `本地 OpenAI API 已上线` |
五、如何接入 OpenWebUI / Cline
填写 OpenAI 接口:
-
-
-
-
1 | `Base URL:``http://localhost:8080/v1``API KEY:``随便填` |
此时你会发现:
👉 已经可以直接使用 DeepSeek / Qwen。
客户端会以为你在用 OpenAI。
六、适合哪些人使用?
特别适合:
- AI 开发者
- 前端工程师
- AI 工作流玩家
- 本地部署爱好者
- 想统一管理多个模型的人
七、总结
Chat2API 本质解决了一个关键痛点:
多模型接入成本过高
它做的事情可以总结为:
- 本地代理
- 统一接口
- 多模型聚合
- 零成本使用
如果你正在搭建 AI 工作流,这是非常值得尝试的工具。
💬 本文评论区已开启,但暂无读者留言。
本文转载自微信公众号,如有侵权请联系删除。
- 标题: 一招教你免费将DeepSeek、Qwen、Kimi、GLM等主流ai大模型网页转换成本地api任意调用 彻底实现token自由!
- 作者: lxiol
- 创建于 : 2026-05-06 19:49:37
- 更新于 : 2026-05-12 16:07:04
- 链接: https://blog.lxiol.cn/2026/05/06/一招教你免费将DeepSeekQwenKimiGLM等主流ai大模型网页转换成本地api任意调用-彻底实现token自由/
- 版权声明: 本文章采用 CC BY-NC-SA 4.0 进行许可。