Skypool Token
Token online
Sign up
Docs供应 Token

供应 Token 指南

面向供应Token用户的使用指南,涵盖 API Key 获取、推理框架参数、预检、启动、在线确认和排错流程。

Updated:

Provider Agent 是什么

token-provider-agent 是一个常驻运行的命令行程序,负责把你的机器接入平台、维持在线、接收任务并调用本地模型执行推理。

网页控制台负责创建 API Key、查看节点、活动记录和收入。而真正让你的机器成为 Provider 节点的,是这个 Agent。

准备工作

开始之前,确认以下条件已就绪:

  • 一台能长期运行的机器
  • 已安装并可访问的本地推理框架;默认使用 LM Studio,也支持 vLLM / SGLang / oMLX / llama.cpp / Ollama
  • 默认 LM Studio 模式下,确认本地服务已启动并暴露 OpenAI-compatible /v1/models/v1/chat/completions
  • 一个 Provider API Key(下一节介绍如何获取)
  • 平台提供的 token-provider-agent 二进制文件

设备建议

选择模型时优先看 GPU 可用显存。以下是单卡常见配置建议;不同推理框架、量化精度、上下文长度和系统占用都会影响实际可加载规模,正式启动前仍以本地推理框架的加载结果和 Agent 预检为准。

GPU 可用显存常见 GPU 示例推荐模型
<= 12 GB入门级或较老的消费级 GPU不推荐
>=16 GBGeForce RTX 4060 Ti 16GB 版、RTX 5060 Ti 16GB 版、RTX 4070 Ti SUPER、RTX 4080、RTX 4080 SUPER、RTX 5070 Ti、RTX 5080qwen3.5:9b
>=24 GBGeForce RTX 3090、RTX 4090、RTX 4090 D、RTX 5090 D v2gemma4:26b
>=32 GBGeForce RTX 5090、RTX 5090 D(非 v2 的 32GB 版本)qwen3.6:35b
>=96 GBNVIDIA RTX PRO 6000 Blackwellqwen3.5:122b

软件下载

请前往 程序下载 下载天池 Token 相关程序。

程序下载页中的天池 Token 桌面版和命令行版下载入口

普通 Provider 用户优先下载“天池 Token 桌面版”。桌面版提供图形化入口,支持 Provider 节点启动,更适合本地桌面和工作站日常运行。

只有在需要长期守护、脚本化部署、服务器部署或无桌面环境运行时,再下载“天池 Token 供应:命令行版”。如果选择命令行版,后续示例统一用 ./token-provider-agent 代替实际可执行文件。

本地推理框架也可以从下载页的“第三方程序”列表进入安装页面。默认推荐先使用 LM Studio;专业节点再根据机器和吞吐需求选择 vLLM / SGLang / oMLX / llama.cpp / Ollama。

第一步:获取 Provider API Key

登录网页控制台,进入 Provider 的「API 密钥」页面,创建一条新的 Provider API Key。

创建后页面会直接显示密钥内容(stp-...)。请立即保存,离开页面后无法再次查看。

建议每台机器使用独立的密钥,方便后续排查节点状态、活动记录和收入归属。

第二步:确认推理框架和模型可用

Provider Agent 启动时会检查指定模型是否在推理框架中可用。默认推理框架是 LM Studio,启动前确认三件事:

  • 已从 LM Studio 下载页 安装 LM Studio
  • 已在 LM Studio 中下载并加载目标模型
  • Developer 页面里的本地 API Server 已启动,默认地址是 http://127.0.0.1:1234

--model 参数仍然使用平台侧模型代码,例如 qwen3.5:9b。控制台的 Token 供应示例会同时展示“模型名称”和“模型 ID”:模型名称通常用于搜索、下载或启动本地推理框架;模型 ID 是本地 OpenAI-compatible /v1/models 返回、Provider Agent 预检和真实请求使用的标识。

LM Studio 的安装、下载模型和验证方式见 LM Studio 本地模型准备

如果你使用 vLLM / SGLang / oMLX / llama.cpp 等 OpenAI-compatible 推理框架,同样确认服务已暴露 /v1/models/v1/chat/completions,并准备好对应的推理框架地址和推理框架 API Key。Agent 会根据 --api-format 在启动预检时从平台 /platform/v1/modelsruntime_model_options 选择默认模型 ID;如果你在控制台选择了另一个模型 ID,请通过 --runtime-model-idPROVIDER_AGENT_RUNTIME_MODEL_ID 显式传入。

如果你已经有 Ollama 环境,也可以继续使用 --api-format ollama。Ollama 模式下需要先用 ollama pull <model_name> 下载目标模型,并通过 ollama ls 确认本地可见。

不同推理框架的安装、模型名准备、256K 上下文配置和可用性检查方式,见:

第三步:运行启动前检查

正式启动前,先跑一次预检:

Bash
./token-provider-agent preflight start --model qwen3.5:9b

预检只做检查,不会启动服务。当前会确认:

  • 推理框架是否可访问
  • 指定模型是否在推理框架中存在

预检失败时,常见原因:

  • 推理框架未启动或地址不正确
  • 模型 ID 拼写错误,或本地 /v1/models 返回的 ID 与控制台展示不一致
  • Ollama 模型未拉取到本地,或 OpenAI-compatible 服务未暴露预检解析出的上游模型
  • 平台模型目录没有为当前 --model--api-format 提供 runtime_model_options

非 Ollama 推理框架可以在预检时显式带上推理框架地址和框架类型:

Bash
./token-provider-agent preflight start --model gemma4:26b --base-url http://127.0.0.1:8000 --api-format omlx --runtime-model-id gemma-4-26b-a4b-it-4bit

如果上游服务需要鉴权,预检和启动时都要同时传入 --runtime-api-key,或设置 PROVIDER_AGENT_RUNTIME_API_KEY

第四步:启动 Provider Agent

核心启动命令:

Bash
./token-provider-agent start --api-key stp-... --model qwen3.5:9b

主要参数:

参数说明
--api-key网页控制台创建的 Provider API Key
--model平台侧模型代码;Ollama 模式下通常直接等于本地模型名

启动成功后,进程会常驻运行,持续完成以下工作:

  • 注册或恢复节点
  • 上报模型和节点状态
  • 发送心跳保持在线
  • 接收并执行推理任务

所以它是一个常驻服务,不是一次性命令。

更多启动参数

如果需要自定义连接地址或调优参数,还可以使用:

参数说明默认值
--node-name这台机器在平台上的显示名称当前主机名
--base-url本地推理框架地址;ollama 走原生 /api,其它框架走 OpenAI-compatible /v1http://127.0.0.1:1234
--api-format推理框架选择,可选 lmstudio / vllm / sglang / omlx / llama.cpp / ollama,大小写不敏感lmstudio
--runtime-model-id可选:本地推理框架实际使用的模型 ID;不填时按平台目录默认选择未设置
--runtime-api-key非 Ollama 推理框架下的 API Key,会作为 Authorization: Bearer 传给 /v1/...未设置
--provider-base-url控制面地址https://provider.skypool.xyz
--relay-ws-urlRelay WebSocket 地址wss://a.skypool.xyz
--state-path本地状态文件路径,用于保存节点会话状态/tmp/provider-agent-state.json
--log-level日志级别info
--p2p-enabled启用 P2P 直连;也可显式传入 true / falsefalse
--max-p2p-connections最大 P2P 连接数8
--max-total-concurrency最大并发任务数1
--prefill-progress-interval-ms首个真实输出前的 prefill 进度刷新间隔(毫秒)15000

--ollama-base-url 仍被兼容,但已经废弃;新配置统一使用 --base-url

这些启动参数也可以通过环境变量传入:

CLI 参数环境变量
--api-keyPROVIDER_AGENT_API_KEY
--modelPROVIDER_AGENT_MODEL_CODE
--node-namePROVIDER_AGENT_NODE_NAME
--base-urlPROVIDER_AGENT_BASE_URL
--api-formatPROVIDER_AGENT_API_FORMAT
--runtime-model-idPROVIDER_AGENT_RUNTIME_MODEL_ID
--runtime-api-keyPROVIDER_AGENT_RUNTIME_API_KEY
--provider-base-urlPROVIDER_AGENT_PROVIDER_BASE_URL
--relay-ws-urlPROVIDER_AGENT_RELAY_WS_URL
--state-pathPROVIDER_AGENT_STATE_PATH
--log-levelPROVIDER_AGENT_LOG_LEVEL
--p2p-enabledPROVIDER_AGENT_P2P_ENABLED
--max-p2p-connectionsPROVIDER_AGENT_MAX_P2P_CONNECTIONS
--max-total-concurrencyPROVIDER_AGENT_MAX_TOTAL_CONCURRENCY
--prefill-progress-interval-msPROVIDER_PREFILL_PROGRESS_INTERVAL_MS

布尔参数支持 1trueyeson 表示开启,支持 0falsenooff 表示关闭。完整命令列表可通过 --help 查看。

OpenAI-compatible 推理框架示例

当你的上游服务兼容 OpenAI Chat Completions API 时,选择对应的 --api-format 后启动即可。下面以默认推荐的 LM Studio 为例:

Bash
./token-provider-agent start --api-key stp-... --model gemma4:26b --base-url http://127.0.0.1:1234 --api-format lmstudio --runtime-model-id google/gemma-4-26b-a4b --runtime-api-key runtime-...

如果上游服务不需要鉴权,可以省略 --runtime-api-key。如果没有选择其它模型 ID,也可以省略 --runtime-model-id,Agent 会在预检阶段按平台模型目录默认项解析,并用本地 /v1/models 验证它可以被调用。

第五步:确认节点正常工作

可以从三个方面确认。

Agent 进程状态

如果 start 运行后没有立刻退出,说明基础启动已通过。

网页控制台节点列表

进入 Provider 的「节点列表」页面,确认能看到:

  • 你的节点名称
  • 节点状态
  • 最近心跳时间

如果心跳时间持续刷新,说明 Agent 在线运行正常。

活动记录和收入

当请求开始进入后,在「活动记录」和「收入」页面可以看到实际的请求处理情况。如果活动记录已出现请求且 Agent 稳定运行,主流程已接通。

常用命令

查看帮助

Bash
./token-provider-agent --help

查看节点状态

Bash
./token-provider-agent status --json

确认当前节点状态和生命周期快照。

查看本地模型

Bash
./token-provider-agent models --json

确认 Agent 当前能看到哪些本地模型。

导出诊断信息

Bash
./token-provider-agent diagnose --json

排查推理框架、连接或本地状态问题时最有用。

查看 P2P 状态

Bash
./token-provider-agent p2p status --json

排查直连或传输能力时使用。

停止

Bash
./token-provider-agent stop

如果 Agent 在前台运行,也可以直接 Ctrl+C 停止。

常见问题

启动时提示缺少 model code

启动命令缺少 --model 参数,补上后重新执行:

Bash
./token-provider-agent start --api-key stp-... --model qwen3.5:9b

预检失败,找不到模型

指定的模型在推理框架中不可用。依次检查:

  1. 推理框架已启动
  2. 模型 ID 拼写正确,且能在本地 /v1/models 中看到
  3. Ollama 模型已拉取到本地,或 OpenAI-compatible /v1/models 能返回预检解析出的上游模型
  4. 平台 /platform/v1/models 中当前平台模型的 runtime_model_options 包含所选 --api-format 和模型 ID

可以用 ./token-provider-agent models --json 查看 Agent 当前能识别的模型列表。

节点没出现在网页控制台

按顺序检查:

  1. Agent 进程是否直接退出了
  2. API Key 是否正确
  3. 节点名是否成功传入
  4. statusdiagnose 输出中是否有明显错误

如果 Agent 启动成功但节点列表为空,通常是接入链路中某一步未完成。

Agent 在运行,但一直没有请求

不要立刻怀疑模型执行有问题,优先检查:

  • 节点是否在线
  • 心跳是否持续更新
  • 模型是否已成功上报
  • 当前是否有流量分配到你的节点

网页控制台的「节点列表」「活动记录」「收入」是最直接的三个观察入口。

API Key 泄露了怎么办

  1. 在网页控制台删除旧的 Provider API Key
  2. 创建一条新密钥
  3. 用新密钥重新启动 Agent

不要继续使用已怀疑泄露的密钥。

最小上手流程

按以下顺序操作,即可完成最基础的接入:

  1. 在网页控制台创建 Provider API Key
  2. 准备好 token-provider-agent 二进制文件
  3. 确认本地推理框架和目标模型可用
  4. 运行 ./token-provider-agent preflight start --model qwen3.5:9b
  5. 运行 ./token-provider-agent start --api-key stp-... --model qwen3.5:9b
  6. 在网页控制台查看「节点列表」
  7. 查看「活动记录」和「收入」