kimi-free-api/README.md

462 lines
14 KiB
Markdown
Raw Normal View History

2024-03-09 15:13:46 +08:00
# KIMI AI Free 服务
2024-03-08 22:04:04 +08:00
2024-04-11 10:15:05 +08:00
<hr>
<span>[ 中文 | <a href="README_EN.md">English</a> ]</span>
2024-03-12 16:42:44 +08:00
![](https://img.shields.io/github/license/llm-red-team/kimi-free-api.svg)
![](https://img.shields.io/github/stars/llm-red-team/kimi-free-api.svg)
![](https://img.shields.io/github/forks/llm-red-team/kimi-free-api.svg)
![](https://img.shields.io/docker/pulls/vinlic/kimi-free-api.svg)
2024-03-12 13:46:06 +08:00
2024-03-14 23:21:22 +08:00
支持高速流式输出、支持多轮对话、支持联网搜索、支持长文档解读、支持图像解析零配置部署多路token支持自动清理会话痕迹。
2024-03-11 01:33:54 +08:00
2024-03-11 18:18:19 +08:00
与ChatGPT接口完全兼容。
2024-03-31 03:46:36 +08:00
还有以下四个free-api欢迎关注
阶跃星辰 (跃问StepChat) 接口转API [step-free-api](https://github.com/LLM-Red-Team/step-free-api)
2024-03-20 01:46:22 +08:00
2024-03-25 04:17:04 +08:00
阿里通义 (Qwen) 接口转API [qwen-free-api](https://github.com/LLM-Red-Team/qwen-free-api)
2024-03-20 01:46:22 +08:00
ZhipuAI (智谱清言) 接口转API [glm-free-api](https://github.com/LLM-Red-Team/glm-free-api)
聆心智能 (Emohaa) 接口转API [emohaa-free-api](https://github.com/LLM-Red-Team/emohaa-free-api)
2024-03-11 17:58:40 +08:00
## 目录
2024-03-29 12:01:24 +08:00
* [免责声明](#免责声明)
2024-03-11 17:58:40 +08:00
* [在线体验](#在线体验)
2024-03-12 16:42:44 +08:00
* [效果示例](#效果示例)
2024-03-11 17:58:40 +08:00
* [接入准备](#接入准备)
2024-03-14 23:21:22 +08:00
* [多账号接入](#多账号接入)
2024-03-11 17:58:40 +08:00
* [Docker部署](#Docker部署)
* [Docker-compose部署](#Docker-compose部署)
2024-04-11 13:54:34 +08:00
* [Vercel部署](#Vercel部署)
2024-03-11 17:58:40 +08:00
* [原生部署](#原生部署)
2024-03-11 18:16:43 +08:00
* [接口列表](#接口列表)
* [对话补全](#对话补全)
* [文档解读](#文档解读)
* [图像解析](#图像解析)
2024-04-10 18:22:00 +08:00
* [refresh_token存活检测](#refresh_token存活检测)
2024-03-14 15:09:46 +08:00
* [注意事项](#注意事项)
* [Nginx反代优化](#Nginx反代优化)
2024-03-11 17:58:40 +08:00
2024-03-29 12:01:24 +08:00
## 免责声明
2024-03-09 14:48:53 +08:00
2024-03-29 12:01:24 +08:00
**本组织和个人不接受任何资金捐助和交易,此项目是纯粹研究交流学习性质!**
2024-03-09 14:48:53 +08:00
2024-03-29 12:01:24 +08:00
**仅限自用,禁止对外提供服务或商用,避免对官方造成服务压力,否则风险自担!**
2024-03-09 14:48:53 +08:00
2024-03-29 12:01:24 +08:00
**仅限自用,禁止对外提供服务或商用,避免对官方造成服务压力,否则风险自担!**
**仅限自用,禁止对外提供服务或商用,避免对官方造成服务压力,否则风险自担!**
2024-03-09 14:48:53 +08:00
2024-03-09 14:30:27 +08:00
## 在线体验
2024-03-09 15:17:22 +08:00
此链接仅临时测试功能,不可长期使用,长期使用请自行部署。
2024-03-09 14:53:58 +08:00
2024-03-09 14:30:27 +08:00
https://udify.app/chat/Po0F6BMJ15q5vu2P
2024-04-11 14:27:27 +08:00
## 测试接口
此接口实例部署在[Render](#render部署)上面,遇到容器回收可能导致响应速度较慢,仅供测试,建议自行部署。
https://kimi-free-api-nut5.onrender.com
2024-03-12 16:42:44 +08:00
## 效果示例
2024-04-10 18:31:52 +08:00
### 验明正身Demo
2024-03-12 16:42:44 +08:00
![验明正身](./doc/example-1.png)
2024-04-10 18:31:52 +08:00
### 多轮对话Demo
2024-03-12 16:45:19 +08:00
![多轮对话](./doc/example-6.png)
2024-04-10 18:31:52 +08:00
### 联网搜索Demo
2024-03-12 16:42:44 +08:00
![联网搜索](./doc/example-2.png)
2024-04-10 18:31:52 +08:00
### 长文档解读Demo
2024-03-12 16:42:44 +08:00
![长文档解读](./doc/example-5.png)
2024-04-10 18:31:52 +08:00
### 图像解析Demo
2024-03-12 16:42:44 +08:00
![图像解析](./doc/example-3.png)
2024-03-09 15:12:29 +08:00
2024-03-14 15:52:27 +08:00
### 响应流畅度一致
2024-03-14 14:43:30 +08:00
2024-03-14 15:52:27 +08:00
![响应流畅度一致](https://github.com/LLM-Red-Team/kimi-free-api/assets/20235341/48c7ec00-2b03-46c4-95d0-452d3075219b)
2024-03-14 14:43:30 +08:00
2024-03-09 14:42:18 +08:00
## 接入准备
2024-03-11 18:06:51 +08:00
从 [kimi.moonshot.cn](https://kimi.moonshot.cn) 获取refresh_token
2024-03-16 14:02:21 +08:00
进入kimi随便发起一个对话然后F12打开开发者工具从Application > Local Storage中找到`refresh_token`的值这将作为Authorization的Bearer Token值`Authorization: Bearer TOKEN`
2024-03-11 18:06:51 +08:00
![example0](./doc/example-0.png)
2024-03-09 14:42:18 +08:00
2024-03-16 14:02:21 +08:00
如果你看到的`refresh_token`是一个数组,请使用`.`拼接起来再使用。
![example8](./doc/example-8.jpg)
2024-03-14 23:21:22 +08:00
### 多账号接入
2024-03-31 04:25:02 +08:00
目前kimi限制普通账号每3小时内只能进行30轮长文本的问答短文本不限你可以通过提供多个账号的refresh_token并使用`,`拼接提供:
2024-03-14 23:21:22 +08:00
`Authorization: Bearer TOKEN1,TOKEN2,TOKEN3`
每次请求服务会从中挑选一个。
2024-03-11 18:16:43 +08:00
## Docker部署
请准备一台具有公网IP的服务器并将8000端口开放。
拉取镜像并启动服务
```shell
docker run -it -d --init --name kimi-free-api -p 8000:8000 -e TZ=Asia/Shanghai vinlic/kimi-free-api:latest
```
查看服务实时日志
```shell
docker logs -f kimi-free-api
```
重启服务
```shell
docker restart kimi-free-api
```
停止服务
```shell
docker stop kimi-free-api
```
### Docker-compose部署
```yaml
version: '3'
services:
kimi-free-api:
container_name: kimi-free-api
image: vinlic/kimi-free-api:latest
restart: always
ports:
- "8000:8000"
environment:
- TZ=Asia/Shanghai
```
2024-04-11 14:27:27 +08:00
### Render部署
**注意部分部署区域可能无法连接kimi如容器日志出现请求超时或无法连接新加坡实测不可用请切换其他区域部署**
**注意免费账户的容器实例将在一段时间不活动时自动停止运行这会导致下次请求时遇到50秒或更长的延迟建议通过 GET `/ping` 请求来维持容器活动**
1. fork本项目到你的github账号下。
2. 访问 [Render](https://dashboard.render.com/) 并登录你的github账号。
3. 构建你的 Web ServiceNew+ -> Build and deploy from a Git repository -> Connect你fork的项目 -> 选择部署区域 -> 选择实例类型为Free -> Create Web Service
4. 等待构建完成后复制分配的域名并拼接URL访问即可。
2024-04-11 13:54:34 +08:00
### Vercel部署
2024-04-11 14:27:27 +08:00
**注意Vercel免费账户的请求响应超时时间为10秒但接口响应通常较久可能会遇到Vercel返回的504超时错误**
2024-04-11 13:54:34 +08:00
点击按钮快速部署:
[![Deploy with Vercel](https://vercel.com/button)](https://vercel.com/import/project?template=https://github.com/LLM-Red-Team/kimi-free-api)
2024-03-11 18:16:43 +08:00
## 原生部署
请准备一台具有公网IP的服务器并将8000端口开放。
请先安装好Node.js环境并且配置好环境变量确认node命令可用。
安装依赖
```shell
npm i
```
安装PM2进行进程守护
```shell
npm i -g pm2
```
编译构建看到dist目录就是构建完成
```shell
npm run build
```
启动服务
```shell
pm2 start dist/index.js --name "kimi-free-api"
```
查看服务实时日志
```shell
pm2 logs kimi-free-api
```
重启服务
```shell
pm2 reload kimi-free-api
```
停止服务
```shell
pm2 stop kimi-free-api
```
## 接口列表
目前支持与openai兼容的 `/v1/chat/completions` 接口可自行使用与openai或其他兼容的客户端接入接口或者使用 [dify](https://dify.ai/) 等线上服务接入使用。
### 对话补全
2024-03-11 01:33:54 +08:00
2024-03-11 18:16:43 +08:00
对话补全接口与openai的 [chat-completions-api](https://platform.openai.com/docs/guides/text-generation/chat-completions-api) 兼容。
2024-03-11 01:33:54 +08:00
2024-03-11 18:16:43 +08:00
**POST /v1/chat/completions**
2024-03-11 01:33:54 +08:00
header 需要设置 Authorization 头部:
```
Authorization: Bearer [refresh_token]
```
请求数据:
```json
{
// 模型名称随意填写如果不希望输出检索过程模型名称请包含silent_search
"model": "kimi",
2024-03-11 01:33:54 +08:00
"messages": [
{
"role": "user",
"content": "测试"
}
],
// 是否开启联网搜索默认false
"use_search": true,
// 如果使用SSE流请设置为true默认false
"stream": false
}
```
2024-03-11 18:16:43 +08:00
响应数据:
```json
{
"id": "cnndivilnl96vah411dg",
"model": "kimi",
"object": "chat.completion",
"choices": [
{
"index": 0,
"message": {
"role": "assistant",
"content": "你好我是Kimi由月之暗面科技有限公司开发的人工智能助手。我擅长中英文对话可以帮助你获取信息、解答疑问还能阅读和理解你提供的文件和网页内容。如果你有任何问题或需要帮助随时告诉我"
},
"finish_reason": "stop"
}
],
"usage": {
"prompt_tokens": 1,
"completion_tokens": 1,
"total_tokens": 2
2024-03-11 18:16:43 +08:00
},
"created": 1710152062
}
```
2024-03-11 17:58:40 +08:00
### 文档解读
2024-03-11 01:33:54 +08:00
2024-03-11 13:35:50 +08:00
提供一个可访问的文件URL或者BASE64_URL进行解析。
2024-03-11 18:16:43 +08:00
**POST /v1/chat/completions**
header 需要设置 Authorization 头部:
```
Authorization: Bearer [refresh_token]
```
2024-03-11 01:33:54 +08:00
请求数据:
```json
{
// 模型名称随意填写如果不希望输出检索过程模型名称请包含silent_search
"model": "kimi",
2024-03-11 01:33:54 +08:00
"messages": [
{
"role": "user",
2024-03-11 10:26:14 +08:00
"content": [
{
"type": "file",
"file_url": {
"url": "https://mj101-1317487292.cos.ap-shanghai.myqcloud.com/ai/test.pdf"
}
},
{
"type": "text",
"text": "文档里说了什么?"
}
]
2024-03-11 01:33:54 +08:00
}
],
// 建议关闭联网搜索,防止干扰解读结果
"use_search": false
}
```
响应数据:
```json
{
"id": "cnmuo7mcp7f9hjcmihn0",
"model": "kimi",
"object": "chat.completion",
"choices": [
{
"index": 0,
"message": {
"role": "assistant",
"content": "文档中包含了几个古代魔法咒语的例子这些咒语来自古希腊和罗马时期的魔法文本被称为PGMPapyri Graecae Magicae。以下是文档中提到的几个咒语的内容\n\n1. 第一个咒语PMG 4.1390 1495描述了一个仪式要求留下一些你吃剩的面包将其分成七块小片然后去到英雄、角斗士和那些死于非命的人被杀的地方。对面包片念咒并扔出去然后从仪式地点捡起一些被污染的泥土扔进你心仪的女人的家中之后去睡觉。咒语的内容是向命运女神Moirai、罗马的命运女神Fates和自然力量Daemons祈求希望他们帮助实现愿望。\n\n2. 第二个咒语PMG 4.1342 57是一个召唤咒语通过念出一系列神秘的名字和词语来召唤一个名为Daemon的存在以使一个名为Tereous的人由Apia所生受到精神和情感上的折磨直到她来到施法者Didymos由Taipiam所生的身边。\n\n3. 第三个咒语PGM 4.1265 74提到了一个名为NEPHERIĒRI的神秘名字这个名字与爱神阿佛洛狄忒Aphrodite有关。为了赢得一个美丽女人的心需要保持三天的纯洁献上乳香并在献祭时念出这个名字。然后在接近那位女士时心中默念这个名字七次连续七天这样做以期成功。\n\n4. 第四个咒语PGM 4.1496 1描述了在燃烧没药myrrh时念诵的咒语。这个咒语是向没药祈祷希望它能够像“肉食者”和“心灵点燃者”一样吸引一个名为[名字]的女人(她的母亲名为[名字]),让她无法安坐、饮食、注视或亲吻其他人,而是让她的心中只有施法者,直到她来到施法者身边。\n\n这些咒语反映了古代人们对魔法和超自然力量的信仰以及他们试图通过这些咒语来影响他人情感和行为的方式。"
},
"finish_reason": "stop"
}
],
2024-03-11 10:26:14 +08:00
"usage": {
"prompt_tokens": 1,
"completion_tokens": 1,
"total_tokens": 2
2024-03-11 10:26:14 +08:00
},
2024-03-11 01:33:54 +08:00
"created": 100920
}
```
2024-03-11 10:26:14 +08:00
### 图像解析
2024-03-11 13:35:50 +08:00
提供一个可访问的图像URL或者BASE64_URL进行解析。
2024-03-11 10:26:14 +08:00
此格式兼容 [gpt-4-vision-preview](https://platform.openai.com/docs/guides/vision) API格式您也可以用这个格式传送文档进行解析。
2024-03-11 18:16:43 +08:00
**POST /v1/chat/completions**
header 需要设置 Authorization 头部:
```
Authorization: Bearer [refresh_token]
```
2024-03-11 10:26:14 +08:00
请求数据:
```json
{
// 模型名称随意填写如果不希望输出检索过程模型名称请包含silent_search
"model": "kimi",
2024-03-11 10:26:14 +08:00
"messages": [
{
"role": "user",
"content": [
{
"type": "image_url",
"image_url": {
"url": "https://www.moonshot.cn/assets/logo/normal-dark.png"
}
},
{
"type": "text",
"text": "图像描述了什么?"
}
]
}
],
// 建议关闭联网搜索,防止干扰解读结果
"use_search": false
}
```
响应数据:
```json
{
"id": "cnn6l8ilnl92l36tu8ag",
"model": "kimi",
"object": "chat.completion",
"choices": [
{
"index": 0,
"message": {
"role": "assistant",
"content": "图像中展示了“Moonshot AI”的字样这可能是月之暗面科技有限公司Moonshot AI的标志或者品牌标识。通常这样的图像用于代表公司或产品传达品牌信息。由于图像是PNG格式它可能是一个透明背景的logo用于网站、应用程序或其他视觉材料中。"
},
"finish_reason": "stop"
}
],
"usage": {
"prompt_tokens": 1,
"completion_tokens": 1,
"total_tokens": 2
2024-03-11 10:26:14 +08:00
},
"created": 1710123627
}
```
2024-04-10 18:22:00 +08:00
### refresh_token存活检测
检测refresh_token是否存活如果存活live未true否则为false请不要频繁小于10分钟调用此接口。
**POST /token/check**
请求数据:
```json
{
"token": "eyJhbGciOiJIUzUxMiIsInR5cCI6IkpXVCJ9..."
}
```
响应数据:
```json
{
"live": true
}
```
2024-03-14 15:09:46 +08:00
## 注意事项
### Nginx反代优化
如果您正在使用Nginx反向代理kimi-free-api请添加以下配置项优化流的输出效果优化体验感。
```nginx
# 关闭代理缓冲。当设置为off时Nginx会立即将客户端请求发送到后端服务器并立即将从后端服务器接收到的响应发送回客户端。
proxy_buffering off;
# 启用分块传输编码。分块传输编码允许服务器为动态生成的内容分块发送数据,而不需要预先知道内容的大小。
chunked_transfer_encoding on;
# 开启TCP_NOPUSH这告诉Nginx在数据包发送到客户端之前尽可能地发送数据。这通常在sendfile使用时配合使用可以提高网络效率。
tcp_nopush on;
# 开启TCP_NODELAY这告诉Nginx不延迟发送数据立即发送小数据包。在某些情况下这可以减少网络的延迟。
tcp_nodelay on;
# 设置保持连接的超时时间这里设置为120秒。如果在这段时间内客户端和服务器之间没有进一步的通信连接将被关闭。
keepalive_timeout 120;
```
### Token统计
2024-03-31 03:46:36 +08:00
由于推理侧不在kimi-free-api因此token不可统计将以固定数字返回!!!!!
2024-03-29 11:29:00 +08:00
## Star History
[![Star History Chart](https://api.star-history.com/svg?repos=LLM-Red-Team/kimi-free-api&type=Date)](https://star-history.com/#LLM-Red-Team/kimi-free-api&Date)