Featurize 1 x RTX 3090 · Qwen3.6-27B-Q4_K_M · llama-server 64K q4_0 KV

RTX 3090 24GB 已跑通 Qwen3.6-27B-Q4_K_M

本轮验证关注这套硬件和模型组合的实际可用性:测试记录显示,Featurize 1 x RTX 3090 上的 Qwen3.6-27B-Q4_K_M 已通过 llama-server 64K q4_0 KV 启动,并完成一项固定规则、多字段写回的代表任务。该任务处理 40000 行、11.95MB、12 个写回列,产物齐全,独立校验通过。

采购评估依据

当前证据支持将 RTX 3090 24GB 纳入采购评估:目标模型已可运行,代表任务已闭环,后续重点是部署方式、访问控制、持续运行和故障恢复方案。

报告日期:2026-05-21 测试阶段:采购前云主机验证 验证对象:RTX 3090 24GB + Qwen3.6-27B-Q4_K_M 代表任务:固定规则、多字段 Excel 写回 推进建议:进入采购评估与受控试点准备

结论摘要

结论:具备承接同类固定规则任务的依据

3090 24GB 运行 Qwen3.6-27B-Q4_K_M 后,完成代表任务闭环,产物齐全并通过校验。

依据:验证了完整处理链路

本轮覆盖模型服务、显存占用、任务触发、批量处理、变更明细、处理报告、执行追踪和独立校验。

动作:进入采购评估

围绕硬件采购、部署方式、访问控制、持续运行和异常恢复收口;试点范围按本轮代表任务设计。

事实依据

验证对象 RTX 3090 24GB

部署 Qwen3.6-27B-GGUF Q4_K_M,使用 llama-server 64K 与 q4_0 KV。

代表负载 11.95MB / 40000 行

固定规则、多字段样本,模拟需要读取规则、批量写回、留痕复核的内部任务。

模型服务 约 40.62-41.66 tok/s

2026-05-21 新实例短请求 smoke,未见 OOM;显存记录 18453 / 24576 MiB。

通过标准 独立校验器 PASS

不是只看客户端是否正常结束、模型速度或 server 没崩。

模型服务未见 OOM 或崩溃
显存记录18453 / 24576 MiB
任务规模40000 行 / 12 目标列
校验结果Excel 产物 PASS

验证任务

选用固定规则、多字段 Excel 写回,验证本地模型能否读取规则、触发处理、生成可复核产物。它代表的是数据不宜外发、但适合自动化处理的内部任务类型。

验证结果

3090 + Qwen3.6-27B-Q4_K_M 完成代表任务闭环;三条 agent 均生成全量产物并通过校验。

推进建议

进入采购评估与受控试点准备;后续补齐持续运行、异常恢复、访问控制、审计和人工复核流程。

为什么选 Excel 做代表任务

Excel 不是业务边界,而是便于校验的代表样本:规则明确,输入输出清楚,处理结果可抽查。agent 读取任务、规则、表头、样本和统计信息后,触发同一个本地处理流程完成批量写回,再用产物和校验结果判断 3090 + Qwen3.6-27B-Q4_K_M 是否具备采购依据。

1

读取任务

读取规则、目标列、样本行和不能修改原始输入列的约束。

2

触发工具

按 agent 特性触发 `run_excel_closed_loop.sh`。

3

写回 Excel

处理流程批量生成 `output_cases.xlsx` 和 `diff.csv`。

4

生成报告

输出 `report.md`、`inspect.json` 和 `workflow_trace.json`。

5

独立校验

`validate_excel.py` 给出最终 PASS 或 FAIL。

Agent 选择

本轮三者都能完成代表任务,区别不是结果能不能过,而是谁更适合承接后续同类固定规则任务。Claude Code 操作最少、结果最清楚;Hermes 每次运行前要先确认模型服务和配置;OpenClaw 文件合格,但结束状态还要人工确认。

结论:同类固定规则任务试点先用 Claude Code

理由很简单:触发直接、结束状态清楚、重复运行成本低。Hermes 先作为配置型备选,OpenClaw 先把结束状态固定下来。

比较维度
Claude Code
Hermes
OpenClaw
本轮定位
先用它承接

任务完整做完,结果文件齐,可直接用于同类固定规则任务试点。

放在备选

也能做完,但重复运行前要先确认模型服务地址和启动配置。

先别上试点

文件结果合格,但跑完以后状态不够清楚,仍要人工确认。

主要差异
少一步准备

命令直接触发固定流程,不需要先重新接模型服务。

多一步配置确认

每次要先确认模型服务地址、连接方式和启动参数。

多一次人工确认

文件出来后,还要人工判断程序是否真正结束。

下一步动作
进入任务试点

优先用它承接同类固定规则处理任务和人工复核流程。

固定配置后备用

把入口和启动方式固定后,再作为备选执行方式。

先修结束状态

把跑完后的状态做清楚,再考虑作为备用执行方式。

测试任务和规则覆盖

测试任务是批量处理一份固定规则 Excel:原始输入列不动,只写回风险等级、审核队列、审批动作、材料要求、异常原因等结果列。规则覆盖异常金额、未知币种、KYC 缺失、材料缺失、制裁筛查、PEP、高风险地区和大额交易。

输入列不动,只写回结果列 示例用于解释规则效果
case_id amount_usd screening / KYC item_category 写回列 结果说明
SIM-0000001 225544 not_screened / expired software_license risk_tier, review_queue, approval_action 处理前为空或旧值
SIM-0000001 225544 not_screened / expired software_license HIGH, ENHANCED_REVIEW, MANUAL_REVIEW 进入增强审核,要求补 KYC、资金来源和筛查证明。
SIM-0000006 -21 not_screened / missing education INVALID_NEGATIVE, DATA_FIX_REQUIRED 负金额被标为数据异常,进入修复和异常统计。

示例不代表真实客户数据。项目样本由本地脚本生成,附件中的 Excel 可下载抽查,规则可在页面内查看。

测试通过线

必须同时看到修改后的 Excel、变更明细、处理报告、结构检查、执行追踪和独立校验器 PASS。

EXCEL_10MB_VALIDATION_PASS rows=40000 diff_rows=40000 size_mb=11.95

如果只有客户端成功、没有产物和校验结果,就不能算业务闭环。

规则覆盖表

规则范围 检查内容 写回结果 证明价值

测试记录筛选

下面保留关键测试事实,便于按 Agent、状态和场景继续追溯。本轮实际产物和可下载材料统一放在页面最后。

对比 测试项 Agent 状态 输入与产物 结论

结论边界和上线前补项

已证明

当前 3090 能运行 Qwen3.6-27B-Q4_K_M,并完成一项固定规则、多字段代表任务:模型服务可用,产物齐全,独立校验通过。

仍需补齐

采购和上线前还要确认持续运行、异常恢复、访问控制、审计、数据接入和人工复核责任边界。

下一步

按当前试点范围准备采购评估;本轮结论已经覆盖目标模型运行能力和代表任务闭环。

附件与可复核材料

先看复核要点,再下载文件抽查。结论以项目测试日志、validator 和结构检查为准;本页附件是便于阅读和抽查的本地复核辅助版。

复核材料

先点开证据看懂,再下载文件抽查

页面内材料用于快速理解本轮测试做了什么、为什么算通过、哪里仍有边界;Excel 和 CSV 用于进一步抽查具体行与写回列。远端原始产物路径保留在工程测试日志中。

校验范围40000 行 / 12 个写回列 / validator PASS
产物闭合三条路径均生成 Excel、diff、报告、校验、结构和追踪
已知边界OpenClaw 文件通过,但结束状态还需人工确认
结论用途支持 3090 采购评估与同类固定规则任务试点准备

页面内查看

复核人先看这些

下载抽检

需要打开文件时下载这些

三份 Excel 为本地可读标记版,按项目规则和 validator 生成,用于抽查写回列;不等同于远端原始文件。

Claude Code 可读标记版 Excel按本轮通过记录生成的复核辅助版,便于查看写回列。
下载 Excel
Hermes 可读标记版 Excel按本轮通过记录生成的复核辅助版,便于查看写回列。
下载 Excel
OpenClaw 可读标记版 Excel按本轮通过记录生成的复核辅助版;OpenClaw 结束状态仍需人工确认。
下载 Excel
变更明细 CSV 复核版按项目规则生成,记录每个 case 被写回的列、风险等级、审核队列、审批动作和异常原因。
下载 CSV
本轮输入子集 Excel从本地合成源样本截取 40000 行,不包含真实客户、账号、Cookie 或未脱敏业务数据。
下载 Excel