MigrateRepos/qwen-free-api

Fork 0

mirror of https://github.com/LLM-Red-Team/qwen-free-api.git synced 2024-09-21 19:04:06 +08:00

Vinlic 6abc2d760f update README

2024-03-27 11:35:04 +08:00

7.0 KiB

Raw Blame History

Qwen AI Free 服务

支持高速流式输出、支持多轮对话、支持无水印AI绘图、支持长文档解读（正在开发）、图像解析（正在开发），零配置部署，多路token支持，自动清理会话痕迹。

与ChatGPT接口完全兼容。

还有以下三个free-api欢迎关注：

Moonshot AI（Kimi.ai）接口转API kimi-free-api

ZhipuAI (智谱清言) 接口转API glm-free-api

聆心智能 (Emohaa) 接口转API emohaa-free-api

声明

仅限自用，禁止对外提供服务或商用，避免对官方造成服务压力，否则风险自担！

在线体验

此链接仅临时测试功能，长期使用请自行部署。

https://udify.app/chat/qOXzVl5kkvhQXM8r

效果示例

验明正身

多轮对话

AI绘图

长文档解读

正在开发...

图像解析

正在开发...

10线程并发测试

接入准备

从通义千问登录

进入通义千问随便发起一个对话，然后F12打开开发者工具，从Application > Cookies中找到login_tongyi_ticket的值，这将作为Authorization的Bearer Token值：Authorization: Bearer TOKEN

多账号接入

你可以通过提供多个账号的login_tongyi_ticket，并使用,拼接提供：

Authorization: Bearer TOKEN1,TOKEN2,TOKEN3

每次请求服务会从中挑选一个。

Docker部署

请准备一台具有公网IP的服务器并将8000端口开放。

拉取镜像并启动服务

docker run -it -d --init --name qwen-free-api -p 8000:8000 -e TZ=Asia/Shanghai vinlic/qwen-free-api:latest

查看服务实时日志

docker logs -f qwen-free-api

重启服务

docker restart qwen-free-api

停止服务

docker stop qwen-free-api

Docker-compose部署

version: '3'

services:
  qwen-free-api:
    container_name: qwen-free-api
    image: vinlic/qwen-free-api:latest
    restart: always
    ports:
      - "8000:8000"
    environment:
      - TZ=Asia/Shanghai

原生部署

请准备一台具有公网IP的服务器并将8000端口开放。

请先安装好Node.js环境并且配置好环境变量，确认node命令可用。

安装依赖

npm i

安装PM2进行进程守护

npm i -g pm2

编译构建，看到dist目录就是构建完成

npm run build

启动服务

pm2 start dist/index.js --name "qwen-free-api"

查看服务实时日志

pm2 logs qwen-free-api

重启服务

pm2 reload qwen-free-api

停止服务

pm2 stop qwen-free-api

接口列表

目前支持与openai兼容的 /v1/chat/completions 接口，可自行使用与openai或其他兼容的客户端接入接口，或者使用 dify 等线上服务接入使用。

对话补全

对话补全接口，与openai的 chat-completions-api 兼容。

POST /v1/chat/completions

header 需要设置 Authorization 头部：

Authorization: Bearer [login_tongyi_ticket]

请求数据：

{
    // 模型名称随意填写
    "model": "qwen",
    "messages": [
        {
            "role": "user",
            "content": "你是谁？"
        }
    ],
    // 如果使用SSE流请设置为true，默认false
    "stream": false
}

响应数据：

{
    "id": "4c4267e7919a41baad8199414ceb5cea",
    "model": "qwen",
    "object": "chat.completion",
    "choices": [
        {
            "index": 0,
            "message": {
                "role": "assistant",
                "content": "我是阿里云研发的超大规模语言模型，我叫通义千问。"
            },
            "finish_reason": "stop"
        }
    ],
    "usage": {
        "prompt_tokens": 1,
        "completion_tokens": 1,
        "total_tokens": 2
    },
    "created": 1710152062
}

AI绘图

对话补全接口，与openai的 images-create-api 兼容。

POST /v1/images/generations

header 需要设置 Authorization 头部：

Authorization: Bearer [login_tongyi_ticket]

请求数据：

{
    // 可以乱填
    "model": "wanxiang",
    "prompt": "一只可爱的猫"
}

响应数据：

{
    "created": 1711507734,
    "data": [
        {
            "url": "https://wanx.alicdn.com/wanx/1111111111/text_to_image/7248e85cfda6491aae59c54e7e679b17_0.png"
        }
    ]
}

文档解读

正在开发...

图像解析

正在开发...

注意事项

Nginx反代优化

如果您正在使用Nginx反向代理qwen-free-api，请添加以下配置项优化流的输出效果，优化体验感。

# 关闭代理缓冲。当设置为off时，Nginx会立即将客户端请求发送到后端服务器，并立即将从后端服务器接收到的响应发送回客户端。
proxy_buffering off;
# 启用分块传输编码。分块传输编码允许服务器为动态生成的内容分块发送数据，而不需要预先知道内容的大小。
chunked_transfer_encoding on;
# 开启TCP_NOPUSH，这告诉Nginx在数据包发送到客户端之前，尽可能地发送数据。这通常在sendfile使用时配合使用，可以提高网络效率。
tcp_nopush on;
# 开启TCP_NODELAY，这告诉Nginx不延迟发送数据，立即发送小数据包。在某些情况下，这可以减少网络的延迟。
tcp_nodelay on;
# 设置保持连接的超时时间，这里设置为120秒。如果在这段时间内，客户端和服务器之间没有进一步的通信，连接将被关闭。
keepalive_timeout 120;

Token统计

由于推理侧不在qwen-free-api，因此token不可统计，将以固定数字返回。

7.0 KiB Raw Blame History Unescape Escape

Qwen AI Free 服务

声明

目录

在线体验

效果示例

验明正身

多轮对话

AI绘图

长文档解读

图像解析

10线程并发测试

接入准备

多账号接入

Docker部署

Docker-compose部署

原生部署

接口列表

对话补全

AI绘图

文档解读

图像解析

注意事项

Nginx反代优化

Token统计

7.0 KiB

Raw Blame History