Featurize 1 x RTX 3090 · Qwen3.6-27B-Q4_K_M · llama-server 64K q4_0 KV
RTX 3090 24GB 已跑通 Qwen3.6-27B-Q4_K_M
本轮验证关注这套硬件和模型组合的实际可用性:测试记录显示,Featurize 1 x RTX 3090 上的 Qwen3.6-27B-Q4_K_M 已通过 llama-server 64K q4_0 KV 启动,并完成一项固定规则、多字段写回的代表任务。该任务处理 40000 行、11.95MB、12 个写回列,产物齐全,独立校验通过。
当前证据支持将 RTX 3090 24GB 纳入采购评估:目标模型已可运行,代表任务已闭环,后续重点是部署方式、访问控制、持续运行和故障恢复方案。
结论摘要
3090 24GB 运行 Qwen3.6-27B-Q4_K_M 后,完成代表任务闭环,产物齐全并通过校验。
本轮覆盖模型服务、显存占用、任务触发、批量处理、变更明细、处理报告、执行追踪和独立校验。
围绕硬件采购、部署方式、访问控制、持续运行和异常恢复收口;试点范围按本轮代表任务设计。
事实依据
部署 Qwen3.6-27B-GGUF Q4_K_M,使用 llama-server 64K 与 q4_0 KV。
固定规则、多字段样本,模拟需要读取规则、批量写回、留痕复核的内部任务。
2026-05-21 新实例短请求 smoke,未见 OOM;显存记录 18453 / 24576 MiB。
不是只看客户端是否正常结束、模型速度或 server 没崩。
验证任务
选用固定规则、多字段 Excel 写回,验证本地模型能否读取规则、触发处理、生成可复核产物。它代表的是数据不宜外发、但适合自动化处理的内部任务类型。
验证结果
3090 + Qwen3.6-27B-Q4_K_M 完成代表任务闭环;三条 agent 均生成全量产物并通过校验。
推进建议
进入采购评估与受控试点准备;后续补齐持续运行、异常恢复、访问控制、审计和人工复核流程。
为什么选 Excel 做代表任务
Excel 不是业务边界,而是便于校验的代表样本:规则明确,输入输出清楚,处理结果可抽查。agent 读取任务、规则、表头、样本和统计信息后,触发同一个本地处理流程完成批量写回,再用产物和校验结果判断 3090 + Qwen3.6-27B-Q4_K_M 是否具备采购依据。
读取任务
读取规则、目标列、样本行和不能修改原始输入列的约束。
触发工具
按 agent 特性触发 `run_excel_closed_loop.sh`。
写回 Excel
处理流程批量生成 `output_cases.xlsx` 和 `diff.csv`。
生成报告
输出 `report.md`、`inspect.json` 和 `workflow_trace.json`。
独立校验
`validate_excel.py` 给出最终 PASS 或 FAIL。
Agent 选择
本轮三者都能完成代表任务,区别不是结果能不能过,而是谁更适合承接后续同类固定规则任务。Claude Code 操作最少、结果最清楚;Hermes 每次运行前要先确认模型服务和配置;OpenClaw 文件合格,但结束状态还要人工确认。
理由很简单:触发直接、结束状态清楚、重复运行成本低。Hermes 先作为配置型备选,OpenClaw 先把结束状态固定下来。
任务完整做完,结果文件齐,可直接用于同类固定规则任务试点。
也能做完,但重复运行前要先确认模型服务地址和启动配置。
文件结果合格,但跑完以后状态不够清楚,仍要人工确认。
命令直接触发固定流程,不需要先重新接模型服务。
每次要先确认模型服务地址、连接方式和启动参数。
文件出来后,还要人工判断程序是否真正结束。
优先用它承接同类固定规则处理任务和人工复核流程。
把入口和启动方式固定后,再作为备选执行方式。
把跑完后的状态做清楚,再考虑作为备用执行方式。
测试任务和规则覆盖
测试任务是批量处理一份固定规则 Excel:原始输入列不动,只写回风险等级、审核队列、审批动作、材料要求、异常原因等结果列。规则覆盖异常金额、未知币种、KYC 缺失、材料缺失、制裁筛查、PEP、高风险地区和大额交易。
示例不代表真实客户数据。项目样本由本地脚本生成,附件中的 Excel 可下载抽查,规则可在页面内查看。
测试通过线
必须同时看到修改后的 Excel、变更明细、处理报告、结构检查、执行追踪和独立校验器 PASS。
EXCEL_10MB_VALIDATION_PASS rows=40000 diff_rows=40000 size_mb=11.95
如果只有客户端成功、没有产物和校验结果,就不能算业务闭环。
规则覆盖表
| 规则范围 | 检查内容 | 写回结果 | 证明价值 |
|---|
测试记录筛选
下面保留关键测试事实,便于按 Agent、状态和场景继续追溯。本轮实际产物和可下载材料统一放在页面最后。
| 对比 | 测试项 | Agent | 状态 | 输入与产物 | 结论 |
|---|
结论边界和上线前补项
已证明
当前 3090 能运行 Qwen3.6-27B-Q4_K_M,并完成一项固定规则、多字段代表任务:模型服务可用,产物齐全,独立校验通过。
仍需补齐
采购和上线前还要确认持续运行、异常恢复、访问控制、审计、数据接入和人工复核责任边界。
下一步
按当前试点范围准备采购评估;本轮结论已经覆盖目标模型运行能力和代表任务闭环。
附件与可复核材料
先看复核要点,再下载文件抽查。结论以项目测试日志、validator 和结构检查为准;本页附件是便于阅读和抽查的本地复核辅助版。
复核材料
先点开证据看懂,再下载文件抽查
页面内材料用于快速理解本轮测试做了什么、为什么算通过、哪里仍有边界;Excel 和 CSV 用于进一步抽查具体行与写回列。远端原始产物路径保留在工程测试日志中。
页面内查看
复核人先看这些
下载抽检
需要打开文件时下载这些
三份 Excel 为本地可读标记版,按项目规则和 validator 生成,用于抽查写回列;不等同于远端原始文件。