RTX 3090 可运行目标模型，Excel 处理需固定工作流。

面向测试与产品评审，汇总 RTX 3090 24GB 运行 Qwen3.6-27B-Q4_K_M 的实测结果。该配置已完成 40000 行 Excel 代表任务；模型服务来自本机部署，本次流程不调用外部模型 API，可按断网或内网隔离方式使用。稳定复现需要预设规则、写回、diff、报告和校验，不适合只靠临时开放式指令。

RTX 3090 是否可运行 可以运行

64K q4_0 KV，约 40 tok/s，未见 OOM。

已完成的代表任务 固定规则 Excel 处理

40000 行、12 个写回列，六类产物齐全。

是否需要预设工作流需要

开放式指令不可靠，验收看独立校验。

本次未覆盖 并发与长期运行

权限、审计、持续运行和真实样本抽检另测。

RTX 3090 24GB Qwen3.6-27B-Q4_K_M 40.62-41.66 tok/s 40000 行 / 11.95MB / 12 个写回列 validator PASS / 六类产物齐全

数据边界 Hermes、OpenClaw、Claude Code 均可配置为只调用本机 `llama-server` 模型服务；Excel 输入、规则和产物留在本机/云主机目录，不需要发送给外部模型 API。模型、客户端和依赖提前部署后，流程可断网执行；若进入敏感数据流程，出站封禁和日志审计需要单独验收。

操作范例：从上传到取回结果

按实际 JupyterLab 操作说明：业务侧不需要把整张 Excel 发给外部模型 API，也不需要让模型现场发明脚本；关键是把输入文件、规则、固定 workflow 和独立校验器放在同一个工作目录，再由客户端触发。

先让 SOTA Agent 生成工作流

在哪里做：正式跑本地 3090 之前，先和高能力规划 agent 讨论需求。SOTA Agent 指当前能力最强一档的规划工具，负责把业务规则整理成固定 workflow 文件；后续本地模型只负责执行和检查。

需要给 SOTA Agent 什么

给字段说明、处理规则、异常样例、希望新增的列、验收标准；涉及敏感数据时，只给脱敏样本或字段结构。

需要交付什么

`rules.md`、`apex_excel_workflow.py`、`run_excel_closed_loop.sh`、`validate_excel.py`，以及一段给本地 agent 执行的固定 prompt。

交付后怎么用

人工确认 workflow 文件后，把它们放进本地 3090 工作目录；后续每次业务处理只替换 Excel 和规则，不让本地模型现场重新设计流程。

先确认模型服务已经启动

在哪里做：JupyterLab 的 Terminal 里。日常使用时先检查，不一定每次都重启；如果没有返回模型，再由技术侧启动服务。

怎么启动

启动的是本机 `llama-server`，只监听 `127.0.0.1:8000`，不调用外部模型 API。

MODEL=/home/featurize/work/apex_models/Qwen3.6-27B-GGUF/Qwen3.6-27B-Q4_K_M.gguf
SERVER=/home/featurize/work/apex_env/llama.cpp/build/bin/llama-server
nohup "$SERVER" \
  -m "$MODEL" \
  --host 127.0.0.1 \
  --port 8000 \
  -c 65536 \
  --cache-type-k q4_0 \
  --cache-type-v q4_0 \
  > /home/featurize/work/apex_logs/llama_server.log 2>&1 &

看到什么算好了

`curl http://127.0.0.1:8000/v1/models` 能看到 `Qwen3.6-27B-Q4_K_M.gguf`，`nvidia-smi` 显示 RTX 3090 正在占用显存。

打开本次工作目录

在哪里做：JupyterLab 左侧文件面板。所有输入、规则、workflow、输出文件都放在同一个目录，避免 agent 到处找文件。

本次范例目录

/home/featurize/work/apex_routeA_resume_20260522_screenshot_095250/source_smoke

目录里应该有什么

`input_cases.xlsx`、`rules.md`、`apex_excel_workflow.py`、`run_excel_closed_loop.sh`、`validate_excel.py`。

上传待处理 Excel

在哪里做：JupyterLab 左侧文件面板顶部的上传按钮。截图里已用框选和蓝色箭头标注「点这个上传按钮」。

需要做什么

把业务 Excel 上传进 `source_smoke` 目录，并统一命名为 `input_cases.xlsx`。这样后面的 workflow 和 prompt 不需要每次改文件名。

做完看到什么

左侧文件列表里能看到 `input_cases.xlsx`。

输入或调整 workflow 规则

「输入 workflow」指先把固定文件放好，再按业务规则编辑 `rules.md`。

主要修改位置

打开 `rules.md`，写清楚哪些列要写回、分类规则是什么、哪些原始列不能改、异常怎么标记。

哪些文件保持固定

`apex_excel_workflow.py` 是固定处理程序，`validate_excel.py` 是独立验收器，日常流程只运行它们，不现场重写它们。

在 agent 客户端里粘贴提示词

在哪里做：Claude Code / Hermes / OpenClaw 的输入区或终端输入区。截图里已用框选和蓝色箭头标注「把要求粘在这一行」。

提示词范例

Run exactly ./run_excel_closed_loop.sh,
then verify validation_result.txt contains EXCEL_10MB_VALIDATION_PASS
and verify output_cases.xlsx, diff.csv, report.md, validation_result.txt,
inspect.json, workflow_trace.json all exist.
Reply APEX_G2R_CLAUDE_DONE after verification.

prompt 的作用

只让 agent 运行固定入口并检查结果，不让它临时发明 Excel 处理脚本。

拿回生成的文件

在哪里拿：还是同一个 JupyterLab 工作目录。截图里已用框选和蓝色箭头标注「结果文件在这一行」。

业务要下载的文件

`output_cases.xlsx` 是修改后的 Excel。

复核用文件

`diff.csv` 看改了哪些行列，`report.md` 看摘要，`validation_result.txt` 看到 `EXCEL_10MB_VALIDATION_PASS` 才算通过。

操作门槛判断

首次部署需要先准备模型、`llama-server`、客户端和 Python 依赖；日常重复任务可以简化为「上传 Excel、确认规则、粘贴 prompt 或点一条固定命令、下载 `output_cases.xlsx`」。

使用 agent 前先编辑什么

操作门槛主要取决于是否已有一套固定文件。日常业务只需要替换输入 Excel、确认规则文件，再让 agent 运行固定入口；处理逻辑、校验逻辑和产物清单不随 prompt 临时变化。

先固定 workflow，再让本地 agent 执行

SOTA 是 State of the Art 的缩写，可理解为「当前能力最强一档」的模型或 agent。第一次搭建业务时，先让 SOTA 规划 agent 和业务负责人确认字段、规则、异常处理方式和验收标准，并生成下列文件。确认后，把文件锁定为本地 3090 环境的 workflow 模板。

如果涉及敏感数据，SOTA 阶段只给字段结构、规则说明和脱敏样本；真实 Excel 进入本地 3090 环境后再处理。任务是否完成，以 `output_cases.xlsx`、`diff.csv`、`report.md`、`validation_result.txt`、`inspect.json`、`workflow_trace.json` 是否齐全，以及 validator 是否 PASS 为准。

业务侧可替换 `input_cases.xlsx`

上传的新 Excel。统一命名可以减少 prompt 和脚本改动；如果业务文件名变化，先复制或重命名成这个入口名。

业务侧确认 `rules.md`

写明要新增或写回哪些列、分类规则、异常处理和不允许修改的原始列。规则变化时改这一份文件。

技术侧维护 `apex_excel_workflow.py`

由 SOTA 规划 agent 生成或协助起草、人工确认后的固定处理程序。它读取 Excel 和规则，生成写回列、diff、报告和 trace；日常业务不让本地 agent 临时重写它。

agent 只运行 `run_excel_closed_loop.sh`

由 SOTA 规划 agent 设计并经人工锁定的一键入口：inspect、run、validate、检查六类产物。Claude Code / Hermes / OpenClaw 都围绕这一条命令适配。

验收独立 `validate_excel.py`

不由 agent 改写。验收以 `EXCEL_10MB_VALIDATION_PASS`、行数、diff 行数和文件大小为准。

`rules.md` 范例

# Excel 处理规则

## 输入文件
input_cases.xlsx

## 不允许修改
- 原始业务列只读保留
- 不删除原 sheet

## 写回列
- normalized_currency：统一币种
- amount_band：金额分层
- risk_level：风险等级
- next_action：处理动作
- quality_flag：数据质量标记
- review_reason：人工复核原因

## 输出与验收
- 输出 output_cases.xlsx
- 输出 diff.csv、report.md、inspect.json、workflow_trace.json
- validate_excel.py 必须返回 EXCEL_10MB_VALIDATION_PASS

使用前编辑顺序

1. 上传 Excel，命名为 input_cases.xlsx
2. 按业务规则编辑 rules.md
3. 保持 run_excel_closed_loop.sh 和 validate_excel.py 不变
4. 给 agent 粘贴固定 prompt，要求只运行 driver 和验收
5. 从同目录取回 output_cases.xlsx，并查看 validation_result.txt

Agent 选用

三条客户端复用同一输入、规则、工作流和校验器，并统一指向本机 `http://127.0.0.1:8000/v1` 模型服务；差异主要在触发方式、权限控制、终端收尾和配置成本。

配置成本与差异

本次流程预置 `run_excel_closed_loop.sh`，由客户端触发并复核，不让模型临时编写脚本。Claude Code 配置步骤最少；Hermes 需要固定 provider；OpenClaw 需要真实 Jupyter TTY，且退出收尾仍有待处理项。

共同任务指令：
Run exactly ./run_excel_closed_loop.sh,
verify validation_result.txt contains EXCEL_10MB_VALIDATION_PASS,
verify all six artifacts exist,
then reply with the client-specific DONE marker.

可复核附件

这些附件用于本地阅读和抽查。标记版 Excel、diff 和摘要材料是本地复核辅助版；远端原始产物和 marker 以项目测试日志记录为准。