.github/workflows | ||
configs/dev | ||
doc | ||
public | ||
src | ||
.dockerignore | ||
.gitignore | ||
Dockerfile | ||
libs.d.ts | ||
LICENSE | ||
package.json | ||
README.md | ||
tsconfig.json |
Qwen AI Free 服务
支持高速流式输出、支持多轮对话、支持无水印AI绘图、支持长文档解读(正在开发)、图像解析(正在开发),零配置部署,多路token支持,自动清理会话痕迹。
与ChatGPT接口完全兼容。
还有以下四个free-api欢迎关注:
Moonshot AI(Kimi.ai)接口转API kimi-free-api
阶跃星辰 (跃问StepChat) 接口转API step-free-api
ZhipuAI (智谱清言) 接口转API glm-free-api
聆心智能 (Emohaa) 接口转API emohaa-free-api
声明
仅限自用,禁止对外提供服务或商用,避免对官方造成服务压力,否则风险自担!
仅限自用,禁止对外提供服务或商用,避免对官方造成服务压力,否则风险自担!
仅限自用,禁止对外提供服务或商用,避免对官方造成服务压力,否则风险自担!
目录
在线体验
此链接仅临时测试功能,长期使用请自行部署。
https://udify.app/chat/qOXzVl5kkvhQXM8r
效果示例
验明正身
多轮对话
AI绘图
长文档解读
正在开发...
图像解析
正在开发...
10线程并发测试
接入准备
从 通义千问 登录
进入通义千问随便发起一个对话,然后F12打开开发者工具,从Application > Cookies中找到login_tongyi_ticket
的值,这将作为Authorization的Bearer Token值:Authorization: Bearer TOKEN
多账号接入
你可以通过提供多个账号的login_tongyi_ticket,并使用,拼接提供:
Authorization: Bearer TOKEN1,TOKEN2,TOKEN3
每次请求服务会从中挑选一个。
Docker部署
请准备一台具有公网IP的服务器并将8000端口开放。
拉取镜像并启动服务
docker run -it -d --init --name qwen-free-api -p 8000:8000 -e TZ=Asia/Shanghai vinlic/qwen-free-api:latest
查看服务实时日志
docker logs -f qwen-free-api
重启服务
docker restart qwen-free-api
停止服务
docker stop qwen-free-api
Docker-compose部署
version: '3'
services:
qwen-free-api:
container_name: qwen-free-api
image: vinlic/qwen-free-api:latest
restart: always
ports:
- "8000:8000"
environment:
- TZ=Asia/Shanghai
原生部署
请准备一台具有公网IP的服务器并将8000端口开放。
请先安装好Node.js环境并且配置好环境变量,确认node命令可用。
安装依赖
npm i
安装PM2进行进程守护
npm i -g pm2
编译构建,看到dist目录就是构建完成
npm run build
启动服务
pm2 start dist/index.js --name "qwen-free-api"
查看服务实时日志
pm2 logs qwen-free-api
重启服务
pm2 reload qwen-free-api
停止服务
pm2 stop qwen-free-api
接口列表
目前支持与openai兼容的 /v1/chat/completions
接口,可自行使用与openai或其他兼容的客户端接入接口,或者使用 dify 等线上服务接入使用。
对话补全
对话补全接口,与openai的 chat-completions-api 兼容。
POST /v1/chat/completions
header 需要设置 Authorization 头部:
Authorization: Bearer [login_tongyi_ticket]
请求数据:
{
// 模型名称随意填写
"model": "qwen",
"messages": [
{
"role": "user",
"content": "你是谁?"
}
],
// 如果使用SSE流请设置为true,默认false
"stream": false
}
响应数据:
{
"id": "4c4267e7919a41baad8199414ceb5cea",
"model": "qwen",
"object": "chat.completion",
"choices": [
{
"index": 0,
"message": {
"role": "assistant",
"content": "我是阿里云研发的超大规模语言模型,我叫通义千问。"
},
"finish_reason": "stop"
}
],
"usage": {
"prompt_tokens": 1,
"completion_tokens": 1,
"total_tokens": 2
},
"created": 1710152062
}
AI绘图
对话补全接口,与openai的 images-create-api 兼容。
POST /v1/images/generations
header 需要设置 Authorization 头部:
Authorization: Bearer [login_tongyi_ticket]
请求数据:
{
// 可以乱填
"model": "wanxiang",
"prompt": "一只可爱的猫"
}
响应数据:
{
"created": 1711507734,
"data": [
{
"url": "https://wanx.alicdn.com/wanx/1111111111/text_to_image/7248e85cfda6491aae59c54e7e679b17_0.png"
}
]
}
文档解读
正在开发...
图像解析
正在开发...
注意事项
Nginx反代优化
如果您正在使用Nginx反向代理qwen-free-api,请添加以下配置项优化流的输出效果,优化体验感。
# 关闭代理缓冲。当设置为off时,Nginx会立即将客户端请求发送到后端服务器,并立即将从后端服务器接收到的响应发送回客户端。
proxy_buffering off;
# 启用分块传输编码。分块传输编码允许服务器为动态生成的内容分块发送数据,而不需要预先知道内容的大小。
chunked_transfer_encoding on;
# 开启TCP_NOPUSH,这告诉Nginx在数据包发送到客户端之前,尽可能地发送数据。这通常在sendfile使用时配合使用,可以提高网络效率。
tcp_nopush on;
# 开启TCP_NODELAY,这告诉Nginx不延迟发送数据,立即发送小数据包。在某些情况下,这可以减少网络的延迟。
tcp_nodelay on;
# 设置保持连接的超时时间,这里设置为120秒。如果在这段时间内,客户端和服务器之间没有进一步的通信,连接将被关闭。
keepalive_timeout 120;
Token统计
由于推理侧不在qwen-free-api,因此token不可统计,将以固定数字返回。