历史详情

Run ID: 20260701-114059-050634e3

返回历史

测试结果

Run ID: 20260701-114059-050634e3

导出 JSON
总请求:10 成功:9 失败:1
渠道模型成功成功率平均延迟 msP95 msTokens首个错误
DeepSeek-v4-pro-04 deepseek-v4-pro 1/1 100.0% 2143 2143 118
DeepSeek-v4-pro-02 deepseek-v4-pro 1/1 100.0% 2718 2718 127
DeepSeek-v4-pro-03 deepseek-v4-pro 1/1 100.0% 2745 2745 141
DeepSeek-v4-pro-01 deepseek-v4-pro 1/1 100.0% 3338 3338 167
腾讯 Gemini 3.5 Flash gemini-3.5-flash 1/1 100.0% 5020 5020 536
pixflow-gemini-3.1-pro-preview gemini-3.1-pro-preview 1/1 100.0% 7253 7253 536
yulin-gpt-5.5 gpt-5.5 1/1 100.0% 7341 7341 472
yuling-gpt-5.5 gpt-5.5 1/1 100.0% 7917 7917 206
qwen3.6-plus qwen3.6-plus 1/1 100.0% 32075 32075 1768
jd-gemini-3.1-pro-preview gemini-3.1-pro-preview 0/1 0.0% - - 0 HTTP 403: {"error":{"code":"1301","message":"无配额可用"}}

明细

渠道状态延迟 msHTTPTokens输出 / 错误
DeepSeek-v4-pro-02 成功 2718 200 127 {"status":"ok","summary":"我能处理多种任务,包括文本生成、推理和编程辅助,但无法执行物理操作或实时浏览互联网。我的知识截止于2025年5月,且不具备独立情感或意识。对于需要专业领域实时数据或法律医疗建议的请求,我无法提供可靠支持。"}
DeepSeek-v4-pro-03 成功 2745 200 141 { "status": "ok", "summary": "我能够进行多轮对话并理解复杂指令,实现自然流畅的中文交互。我可以生成结构化内容(如JSON),并在给定约束下完成格式要求。但我不能生成、识别或处理图像、视频等多模态信息,仅限纯文本交流。" }
jd-gemini-3.1-pro-preview 失败 326 403 - HTTP 403: {"error":{"code":"1301","message":"无配额可用"}}
DeepSeek-v4-pro-01 成功 3338 200 167 我的能力主要集中在文本交互和信息处理上,能理解和生成自然语言,但无法感知物理世界或执行离线操作。我基于大规模语言模型训练,知识更新至2025年5月,无法主动获取实时数据或超越训练集的信息。我不具备自我意识、情感或独立决策能力,所有输出均由算法生成。 ```json {"status":"ok","summary":"我只能处理文本,知识截止2025年5月,无实时访问或物理交互能力,且无意识与情感。"} ```
DeepSeek-v4-pro-04 成功 2143 200 118 { "status": "ok", "summary": "我能处理文本、代码和多模态数据,但无法访问实时信息或执行物理动作。我的知识截止于2025年5月,不支持2025年5月之后的事件。受安全准则约束,我拒绝生成有害、非法或敏感内容。" }
腾讯 Gemini 3.5 Flash 成功 5020 200 536 {"index": 0, "message": {"role": "assistant", "content": null}, "finish_reason": "length"}
pixflow-gemini-3.1-pro-preview 成功 7253 200 536 ```json { "status": "ok", "summary
yulin-gpt-5.5 成功 7341 200 472 {"status":"ok","summary":"我可以帮助进行文本理解、写作、翻译、代码生成与调试、知识解释和多轮对话,但我的回答可能受训练数据与当前上下文限制。我无法保证所有信息实时、完整或绝对准确,也不能直接访问未提供的私有数据或执行现实世界操作。对于法律、医疗、金融等高风险问题,我只能提供一般性信息,不能替代专业人士的判断。"}
yuling-gpt-5.5 成功 7917 200 206 {"status":"ok","summary":"我可以理解和生成文本,协助写作、翻译、编程、分析与问答,但不具备真实感知、意识或自主行动能力。我的知识可能不是最新的,也可能在复杂、模糊或需要实时信息的问题上出错。对于医疗、法律、金融等高风险事项,我只能提供一般性信息,不能替代专业人士的判断。"}
qwen3.6-plus 成功 32075 200 1768 /\_/\ ( o.o ) > ^ < {"status":"ok","summary":"我是纯文本大语言模型,无法直接生成或处理图像、音频等多媒体内容。我的知识基于训练数据截止时间,可能不了解最新实时信息或私有数据。我能高效完成文本推理、代码编写与创意写作,但不具备现实世界行动力、自我意识或外部系统直接控制权。"}