mirror of
https://github.com/handsomezhuzhu/api-proxy.git
synced 2026-02-20 11:50:15 +00:00
强制添加禁止缓存头以优化代理请求的缓存控制
This commit is contained in:
25
README.md
25
README.md
@@ -2,31 +2,6 @@
|
||||
|
||||
这是一个轻量级的 API 代理服务,旨在统一和简化对各种 AI 服务 API 的访问。它使用 Go 语言编写,支持 Docker 部署。
|
||||
|
||||
## 🚀 阿里云 ESA (边缘安全加速) 配置指南 (非常重要)
|
||||
|
||||
如果你使用了阿里 ESA 加速本服务,**必须**在 ESA 控制台中进行以下设置,否则会出现 `Origin Time-out` (源站超时) 或 AI 回复卡顿(打字机效果失效)的问题。
|
||||
|
||||
### 1. 缓存配置 (Cache)
|
||||
请进入 **站点管理** -> **缓存配置**,添加以下规则:
|
||||
|
||||
| 配置项 | 推荐设置 | 说明 |
|
||||
| :--- | :--- | :--- |
|
||||
| **边缘缓存过期时间** <br> (Edge Cache TTL) | **不缓存** <br> (或设置为 0秒) | **核心设置**。必须禁止 CDN 节点缓存 AI 的接口响应,否则第二个用户会看到上一个用户的对话,或者直接报错。建议针对 API 目录(如 `/openai/*`)设置。 |
|
||||
| **浏览器缓存过期时间** <br> (Browser Cache TTL) | **不缓存** | 禁止客户端浏览器缓存接口结果。 |
|
||||
| **查询字符串** | **保留** (或 遵循源站) | 某些 AI API 使用 URL 参数传递版本号或签名,不可忽略。 |
|
||||
|
||||
### 2. 回源配置 (Origin) - 解决超时问题的关键
|
||||
ESA 默认的连接超时时间较短(通常 30秒),而 AI 模型(特别是推理模型)可能需要 60秒+ 才能生成第一个字。
|
||||
|
||||
请进入 **站点管理** -> **回源配置**:
|
||||
|
||||
* **读超时时间 (Read Timeout)**: 修改为 **120秒** 或 **300秒**。
|
||||
* *说明*: 如果不改这个,AI 思考超过 30秒时,ESA 会认为源站挂了,直接切断连接并报 `Origin Time-out`。
|
||||
|
||||
### 3. 开发模式 (Debug)
|
||||
如果配置后仍然有问题,可以暂时开启 **“开发模式”**。这会强制所有请求绕过缓存节点直接回源,用于排查是否是缓存规则导致的问题。
|
||||
|
||||
---
|
||||
|
||||
## 功能特性
|
||||
|
||||
|
||||
Reference in New Issue
Block a user