模型批题对比实验室

选择 1-3 个链路,上传同一张题目图片,只跑一遍预处理和 Qwen3.6-Plus 抽题,再对比不同判题模型的结果、错因、订正过程、耗时和费用。

返回判题后台
对比模式
当前:单张对比

单张模式用于立刻比较一张题图的多个模型结果;批量模式用于把多张图片排进同一批任务,后台自动逐张执行。

批量并发

正在读取当前并发设置。

当前为单张对比:上传 1 张图片后立即开始对比。
补充自定义模型 可临时追加到本页模型目录

填写 API Key、Base URL 和模型名称后点“添加模型”,新模型会立刻出现在右侧目录中,并默认加入当前选择。

已选 0 / 3 已选图片 0 张 暂无任务 查看历史案例页
正在加载可用模型目录。
可用模型目录 查看模型目录文件
共享流程耗时
最近记录 点击展开最近任务
正在读取最近的模型对比记录。
批量进度 当前没有批量任务
当前没有批量任务。
批量结果
当前没有批量结果。