供应 Token 指南 | Skypool Token

Provider Agent 是什么

token-provider-agent 是一个常驻运行的命令行程序，负责把你的机器接入平台、维持在线、接收任务并调用本地模型执行推理。

网页控制台负责创建 API Key、查看节点、活动记录和收入。而真正让你的机器成为 Provider 节点的，是这个 Agent。

准备工作

开始之前，确认以下条件已就绪：

一台能长期运行的机器
已安装并可访问的本地推理框架；默认使用 LM Studio，也支持 vLLM / SGLang / oMLX / llama.cpp / Ollama
默认 LM Studio 模式下，确认本地服务已启动并暴露 OpenAI-compatible /v1/models 和 /v1/chat/completions
一个 Provider API Key（下一节介绍如何获取）
平台提供的 token-provider-agent 二进制文件

设备建议

选择模型时优先看 GPU 可用显存。以下是单卡常见配置建议；不同推理框架、量化精度、上下文长度和系统占用都会影响实际可加载规模，正式启动前仍以本地推理框架的加载结果和 Agent 预检为准。

GPU 可用显存	常见 GPU 示例	推荐模型
<= 12 GB	入门级或较老的消费级 GPU	不推荐
>=16 GB	GeForce RTX 4060 Ti 16GB 版、RTX 5060 Ti 16GB 版、RTX 4070 Ti SUPER、RTX 4080、RTX 4080 SUPER、RTX 5070 Ti、RTX 5080	`qwen3.5:9b`
>=24 GB	GeForce RTX 3090、RTX 4090、RTX 4090 D、RTX 5090 D v2	`gemma4:26b`
>=32 GB	GeForce RTX 5090、RTX 5090 D（非 v2 的 32GB 版本）	`qwen3.6:35b`
>=96 GB	NVIDIA RTX PRO 6000 Blackwell	`qwen3.5:122b`

软件下载

请前往程序下载下载天池 Token 相关程序。

程序下载页中的天池 Token 桌面版和命令行版下载入口

普通 Provider 用户优先下载“天池 Token 桌面版”。桌面版提供图形化入口，支持 Provider 节点启动，更适合本地桌面和工作站日常运行。

只有在需要长期守护、脚本化部署、服务器部署或无桌面环境运行时，再下载“天池 Token 供应：命令行版”。如果选择命令行版，后续示例统一用 ./token-provider-agent 代替实际可执行文件。

本地推理框架也可以从下载页的“第三方程序”列表进入安装页面。默认推荐先使用 LM Studio；专业节点再根据机器和吞吐需求选择 vLLM / SGLang / oMLX / llama.cpp / Ollama。

第一步：获取 Provider API Key

登录网页控制台，进入 Provider 的「API 密钥」页面，创建一条新的 Provider API Key。

创建后页面会直接显示密钥内容（stp-...）。请立即保存，离开页面后无法再次查看。

建议每台机器使用独立的密钥，方便后续排查节点状态、活动记录和收入归属。

第二步：确认推理框架和模型可用

Provider Agent 启动时会检查指定模型是否在推理框架中可用。默认推理框架是 LM Studio，启动前确认三件事：

已从 LM Studio 下载页安装 LM Studio
已在 LM Studio 中下载并加载目标模型
Developer 页面里的本地 API Server 已启动，默认地址是 http://127.0.0.1:1234

--model 参数仍然使用平台侧模型代码，例如 qwen3.5:9b。控制台的 Token 供应示例会同时展示“模型名称”和“模型 ID”：模型名称通常用于搜索、下载或启动本地推理框架；模型 ID 是本地 OpenAI-compatible /v1/models 返回、Provider Agent 预检和真实请求使用的标识。

LM Studio 的安装、下载模型和验证方式见 LM Studio 本地模型准备。

如果你使用 vLLM / SGLang / oMLX / llama.cpp 等 OpenAI-compatible 推理框架，同样确认服务已暴露 /v1/models 和 /v1/chat/completions，并准备好对应的推理框架地址和推理框架 API Key。Agent 会根据 --api-format 在启动预检时从平台 /platform/v1/models 的 runtime_model_options 选择默认模型 ID；如果你在控制台选择了另一个模型 ID，请通过 --runtime-model-id 或 PROVIDER_AGENT_RUNTIME_MODEL_ID 显式传入。

如果你已经有 Ollama 环境，也可以继续使用 --api-format ollama。Ollama 模式下需要先用 ollama pull <model_name> 下载目标模型，并通过 ollama ls 确认本地可见。

不同推理框架的安装、模型名准备、256K 上下文配置和可用性检查方式，见：

第三步：运行启动前检查

正式启动前，先跑一次预检：

./token-provider-agent preflight start --model qwen3.5:9b

预检只做检查，不会启动服务。当前会确认：

推理框架是否可访问
指定模型是否在推理框架中存在

预检失败时，常见原因：

推理框架未启动或地址不正确
模型 ID 拼写错误，或本地 /v1/models 返回的 ID 与控制台展示不一致
Ollama 模型未拉取到本地，或 OpenAI-compatible 服务未暴露预检解析出的上游模型
平台模型目录没有为当前 --model 和 --api-format 提供 runtime_model_options

非 Ollama 推理框架可以在预检时显式带上推理框架地址和框架类型：

./token-provider-agent preflight start --model gemma4:26b --base-url http://127.0.0.1:8000 --api-format omlx --runtime-model-id gemma-4-26b-a4b-it-4bit

如果上游服务需要鉴权，预检和启动时都要同时传入 --runtime-api-key，或设置 PROVIDER_AGENT_RUNTIME_API_KEY。

第四步：启动 Provider Agent

核心启动命令：

./token-provider-agent start --api-key stp-... --model qwen3.5:9b

主要参数：

参数	说明
`--api-key`	网页控制台创建的 Provider API Key
`--model`	平台侧模型代码；Ollama 模式下通常直接等于本地模型名

启动成功后，进程会常驻运行，持续完成以下工作：

注册或恢复节点
上报模型和节点状态
发送心跳保持在线
接收并执行推理任务

所以它是一个常驻服务，不是一次性命令。

参数	说明	默认值
`--node-name`	这台机器在平台上的显示名称	当前主机名
`--base-url`	本地推理框架地址；`ollama` 走原生 `/api`，其它框架走 OpenAI-compatible `/v1`	`http://127.0.0.1:1234`
`--api-format`	推理框架选择，可选 `lmstudio` / `vllm` / `sglang` / `omlx` / `llama.cpp` / `ollama`，大小写不敏感	`lmstudio`
`--runtime-model-id`	可选：本地推理框架实际使用的模型 ID；不填时按平台目录默认选择	未设置
`--runtime-api-key`	非 Ollama 推理框架下的 API Key，会作为 `Authorization: Bearer` 传给 `/v1/...`	未设置
`--provider-base-url`	控制面地址	`https://provider.skypool.xyz`
`--relay-ws-url`	Relay WebSocket 地址	`wss://a.skypool.xyz`
`--state-path`	本地状态文件路径，用于保存节点会话状态	`/tmp/provider-agent-state.json`
`--log-level`	日志级别	`info`
`--p2p-enabled`	启用 P2P 直连；也可显式传入 `true` / `false`	`false`
`--max-p2p-connections`	最大 P2P 连接数	`8`
`--max-total-concurrency`	最大并发任务数	`1`
`--prefill-progress-interval-ms`	首个真实输出前的 prefill 进度刷新间隔（毫秒）	`15000`

CLI 参数	环境变量
`--api-key`	`PROVIDER_AGENT_API_KEY`
`--model`	`PROVIDER_AGENT_MODEL_CODE`
`--node-name`	`PROVIDER_AGENT_NODE_NAME`
`--base-url`	`PROVIDER_AGENT_BASE_URL`
`--api-format`	`PROVIDER_AGENT_API_FORMAT`
`--runtime-model-id`	`PROVIDER_AGENT_RUNTIME_MODEL_ID`
`--runtime-api-key`	`PROVIDER_AGENT_RUNTIME_API_KEY`
`--provider-base-url`	`PROVIDER_AGENT_PROVIDER_BASE_URL`
`--relay-ws-url`	`PROVIDER_AGENT_RELAY_WS_URL`
`--state-path`	`PROVIDER_AGENT_STATE_PATH`
`--log-level`	`PROVIDER_AGENT_LOG_LEVEL`
`--p2p-enabled`	`PROVIDER_AGENT_P2P_ENABLED`
`--max-p2p-connections`	`PROVIDER_AGENT_MAX_P2P_CONNECTIONS`
`--max-total-concurrency`	`PROVIDER_AGENT_MAX_TOTAL_CONCURRENCY`
`--prefill-progress-interval-ms`	`PROVIDER_PREFILL_PROGRESS_INTERVAL_MS`

OpenAI-compatible 推理框架示例

当你的上游服务兼容 OpenAI Chat Completions API 时，选择对应的 --api-format 后启动即可。下面以默认推荐的 LM Studio 为例：

./token-provider-agent start --api-key stp-... --model gemma4:26b --base-url http://127.0.0.1:1234 --api-format lmstudio --runtime-model-id google/gemma-4-26b-a4b --runtime-api-key runtime-...

如果上游服务不需要鉴权，可以省略 --runtime-api-key。如果没有选择其它模型 ID，也可以省略 --runtime-model-id，Agent 会在预检阶段按平台模型目录默认项解析，并用本地 /v1/models 验证它可以被调用。

第五步：确认节点正常工作

可以从三个方面确认。

Agent 进程状态

如果 start 运行后没有立刻退出，说明基础启动已通过。

网页控制台节点列表

进入 Provider 的「节点列表」页面，确认能看到：

你的节点名称
节点状态
最近心跳时间

如果心跳时间持续刷新，说明 Agent 在线运行正常。

活动记录和收入

当请求开始进入后，在「活动记录」和「收入」页面可以看到实际的请求处理情况。如果活动记录已出现请求且 Agent 稳定运行，主流程已接通。

常用命令

查看帮助

./token-provider-agent --help

查看节点状态

./token-provider-agent status --json

确认当前节点状态和生命周期快照。

查看本地模型

./token-provider-agent models --json

确认 Agent 当前能看到哪些本地模型。

导出诊断信息

./token-provider-agent diagnose --json

排查推理框架、连接或本地状态问题时最有用。

查看 P2P 状态

./token-provider-agent p2p status --json

排查直连或传输能力时使用。

停止

./token-provider-agent stop

如果 Agent 在前台运行，也可以直接 Ctrl+C 停止。

常见问题

启动时提示缺少 model code

启动命令缺少 --model 参数，补上后重新执行：

./token-provider-agent start --api-key stp-... --model qwen3.5:9b

预检失败，找不到模型

指定的模型在推理框架中不可用。依次检查：

推理框架已启动
模型 ID 拼写正确，且能在本地 /v1/models 中看到
Ollama 模型已拉取到本地，或 OpenAI-compatible /v1/models 能返回预检解析出的上游模型
平台 /platform/v1/models 中当前平台模型的 runtime_model_options 包含所选 --api-format 和模型 ID

可以用 ./token-provider-agent models --json 查看 Agent 当前能识别的模型列表。

节点没出现在网页控制台

按顺序检查：

Agent 进程是否直接退出了
API Key 是否正确
节点名是否成功传入
status 和 diagnose 输出中是否有明显错误

如果 Agent 启动成功但节点列表为空，通常是接入链路中某一步未完成。

Agent 在运行，但一直没有请求

不要立刻怀疑模型执行有问题，优先检查：

节点是否在线
心跳是否持续更新
模型是否已成功上报
当前是否有流量分配到你的节点

网页控制台的「节点列表」「活动记录」「收入」是最直接的三个观察入口。

API Key 泄露了怎么办

在网页控制台删除旧的 Provider API Key
创建一条新密钥
用新密钥重新启动 Agent

不要继续使用已怀疑泄露的密钥。

最小上手流程

按以下顺序操作，即可完成最基础的接入：

在网页控制台创建 Provider API Key
准备好 token-provider-agent 二进制文件
确认本地推理框架和目标模型可用
运行 ./token-provider-agent preflight start --model qwen3.5:9b
运行 ./token-provider-agent start --api-key stp-... --model qwen3.5:9b
在网页控制台查看「节点列表」
查看「活动记录」和「收入」