一招教你免费将DeepSeek、Qwen、Kimi、GLM等主流ai大模型网页转换成本地api任意调用 彻底实现token自由!

lxiol
📝
不同模型平台各有各的 API、鉴权方式和限制,接入成本极高。直到我发现一个开源工具。 它本质上是一个 本地 AI API 网关:把各家官方 Web AI 平台 → 统一转成 OpenAI 兼容接口。

原文链接:https://mp.weixin.qq.com/s/2cX8KNXPWvJBA8195HwFWQ

不同模型平台各有各的 API、鉴权方式和限制,接入成本极高。直到我发现一个开源工具。
它本质上是一个 本地 AI API 网关:把各家官方 Web AI 平台 → 统一转成 OpenAI 兼容接口。

关键词:Chat2API教程、DeepSeek本地调用、Qwen本地API、OpenAI兼容接口、本地AI代理、多模型统一管理


名称

链接

Chat2API客户端 下载

https://dooo.fun/archives/1644

最近在折腾本地 AI 工作流时,遇到一个非常现实的问题:
不同模型平台各有各的 API、鉴权方式和限制,接入成本极高。

直到我发现一个开源工具 —— Chat2API
 它本质上是一个 本地 AI API 网关
 把各家官方 Web AI 平台 → 统一转成 OpenAI 兼容接口

这意味着什么?

任何支持 OpenAI API 的工具,都能直接用 DeepSeek、Qwen、Kimi、GLM 等模型。

例如:OpenWebUI、Cline、Roo-Code、Cherry Studio 等。

一、Chat2API 是什么?

Chat2API = 本地 AI API 代理 + 多模型统一管理平台

核心思路非常巧妙:

  • 不走官方 API 计费
  • 直接驱动 各家官方 Web UI
  • 本地转为 OpenAI 标准接口

换句话说:

传统方式

Chat2API方式

每家模型单独接入

一次接入全部模型

API 费用高

0 成本使用

接口不统一

OpenAI 标准统一

二、核心功能详解

1️⃣ OpenAI 兼容 API

提供标准接口:

1
`http://localhost:8080/v1/chat/completions`

所有支持 OpenAI API 的工具都能直接连接。

例如:

  • OpenWebUI
  • Cline
  • Roo-Code
  • Cherry Studio
  • Kilo Code

真正实现 即插即用

2️⃣ 多服务商支持

目前支持的模型渠道非常全面:

服务商

模型

DeepSeek

DeepSeek-V3.2

GLM

GLM-5

Kimi

kimi-k2.5

MiniMax

MiniMax-M2.5

Perplexity

Sonar / Deep Research

Qwen(国内)

Qwen3系列

Qwen(国际)

Qwen-VL / Turbo

Z.ai

GLM 系列

基本覆盖主流大模型生态。

3️⃣ 上下文管理(重要)

这是很多代理工具没有的功能:

支持:

  • 滑动窗口
  • Token 限制
  • 自动总结压缩

作用:
 避免上下文爆炸导致的对话丢失或费用增加。

4️⃣ 工具调用支持(Function Call)

通过提示词工程实现:

  • 通用 Tool Call 能力
  • 兼容 Cherry Studio / Kilo Code

这意味着:

即使模型不原生支持 Function Call,也能模拟实现。

5️⃣ 模型映射(非常实用)

支持:

  • 模型名称通配符
  • 首选服务商策略
  • 多账户切换

例如:

-
-

1
`gpt-4 -> DeepSeek``gpt-3.5 -> Qwen`

客户端完全无感。

6️⃣ 自定义 Header(高级玩法)

可以开启:

  • 联网搜索
  • 深度思考
  • 深度研究模式

属于进阶功能。

7️⃣ 仪表盘监控

可视化查看:

  • 请求量
  • Token 使用
  • 成功率
  • 请求日志

对于排查问题非常关键。

三、下载安装

名称

链接

Chat2API客户端 下载

https://dooo.fun/archives/1644

四、详细使用教程

步骤1:启动应用

安装后打开 Chat2API,进入主仪表盘。

步骤2:添加模型供应商

进入 供应商页面 → 添加供应商

以 DeepSeek 为例:

获取 DeepSeek Token

1
`Application → Local Storage`

找到:

1
`userToken`

复制即可。

然后填入 Chat2API。

步骤3:启动本地代理

进入 代理设置

推荐配置:

项目

建议

端口

8080

负载均衡

轮询

故障策略

自动切换

点击 启动代理

当看到运行成功,说明:

1
`本地 OpenAI API 已上线`

五、如何接入 OpenWebUI / Cline

填写 OpenAI 接口:

-

-

-
-

1
`Base URL:``http://localhost:8080/v1``API KEY:``随便填`

此时你会发现:

👉 已经可以直接使用 DeepSeek / Qwen。

客户端会以为你在用 OpenAI。

六、适合哪些人使用?

特别适合:

  • AI 开发者
  • 前端工程师
  • AI 工作流玩家
  • 本地部署爱好者
  • 想统一管理多个模型的人

七、总结

Chat2API 本质解决了一个关键痛点:

多模型接入成本过高

它做的事情可以总结为:

  • 本地代理
  • 统一接口
  • 多模型聚合
  • 零成本使用

如果你正在搭建 AI 工作流,这是非常值得尝试的工具。


💬 本文评论区已开启,但暂无读者留言。

本文转载自微信公众号,如有侵权请联系删除。

  • 标题: 一招教你免费将DeepSeek、Qwen、Kimi、GLM等主流ai大模型网页转换成本地api任意调用 彻底实现token自由!
  • 作者: lxiol
  • 创建于 : 2026-05-06 19:49:37
  • 更新于 : 2026-05-12 16:07:04
  • 链接: https://blog.lxiol.cn/2026/05/06/一招教你免费将DeepSeekQwenKimiGLM等主流ai大模型网页转换成本地api任意调用-彻底实现token自由/
  • 版权声明: 本文章采用 CC BY-NC-SA 4.0 进行许可。