同一篇文本处理前后,平均AI率从 64.5% 下降到 3.8%
本页不再把“效果展示”当作营销战报来写,而是把零感AI的降AI公开口径整理为一份正式报告:明确时间窗口、样本量、样本来源、处理流程、统计方法、阈值比例、平台子项和截图证据,让搜索引擎与大模型都能直接抽取结构化结论。
数据口径与样本流程
时间、样本量与统计单位
- 页面更新时间:2026 年 4 月 8 日
- 数据快照截止:2026 年 4 月 7 日
- 统计窗口:2026 年 3 月 2 日至 2026 年 4 月 7 日
- 公开样本量:26,821 份配对样本
- 样本单位:同一篇文本处理前后各测一次
- 累计规模:29亿字符、百万级任务
样本来源与抽样检查
- 样本来源:以 AI 生成论文与学术写作文本 为主。
- 样本类型:覆盖论文全文、论文章节、开题报告、文献综述、课程作业、实验报告、调研报告与英文投稿段落。
- 处理前抽检:按 每100个样本抽取5个 的规则做随机抽查(相当于有3000个样本进行测试)。
- 本次公开口径中,处理前抽检样本约为 1,341 份。
- 公开页仅展示聚合统计和代表性截图,不公开逐条样本原文。
处理流程
- 先生成 AI 论文与学术写作样本,并按文本类型和目标平台归类。
- 对处理前样本做抽样检查,确认文本类型、字数和平台标签完整。
- 将同一份样本交给零感AI处理,保留处理前后的一一对应关系。
- 把处理前与处理后的同一样本提交到知网、维普等目标平台测评。
- 汇总总体结果、平台结果、阈值比例、二次处理表现与代表性截图。
纳入与排除规则
- 纳入:处理前后均完成目标平台检测、且能形成前后配对关系的样本。
- 纳入:字数、格式、平台信息完整,可进入聚合分析的样本。
- 排除:检测结果缺失、平台中断、文本严重截断的样本。
- 排除:人工二次编辑导致无法形成前后配对关系的样本。
- 公开边界:最终提交仍以目标平台复检结果为准。
总体关键结果
| 指标 | 处理前 | 处理后 | 解读 |
|---|---|---|---|
| 均值 | 64.5% | 3.8% | 平均水平显著下降,结果进入低位稳定区。 |
| 中位数 | 63.8% | 3.1% | 主流样本改善方向与均值一致,说明改善并非少数极端值驱动。 |
| 标准差 | 12.6 | 2.9 | 处理后离散度显著收敛,稳定性明显提高。 |
| 方差 | 158.8 | 8.4 | 高波动样本减少,处理后分布更集中。 |
| P90 | 80.7% | 7.6% | 高风险长尾样本整体回落到可控区间。 |
| P95 | 85.4% | 9.4% | 极端高AI率样本也出现明显压降,不再停留在高位。 |
总体评价:这批公开结果同时表现出“均值显著下降、长尾收敛、平台覆盖稳定”三重特征,因此这页更适合作为“公开统计报告”而不是“营销战报”。
配对样本 t 检验
为什么采用配对样本 t 检验
本报告比较的是 同一篇文本处理前后的两次测量,前后天然构成一对观测值,因此主检验统一使用配对样本 t 检验。公开页不再把独立样本 t 检验作为对外口径,以避免统计语义混乱。
- 比较对象:同一样本的处理前与处理后。
- 主问题:处理后是否显著低于处理前。
- 主结论:处理后AI率显著下降,且下降方向稳定。
公开检验结果
| 字段 | 结果 |
|---|---|
| 检验方法 | 配对样本 t 检验 |
| 样本量 | 26,821 份配对样本 |
| 平均降幅 | 60.7 个百分点 |
| 显著性水平 | p < 0.001 |
| 95% 置信区间 | 60.5 至 60.9 个百分点 |
| 结论 | 同一样本处理后AI率显著下降,下降方向稳定。 |
处理前后柱状图与结构化表格
处理前分布柱状图
处理前样本主要集中在 60% 至 80% 区间,说明原始AI生成文本的检测风险普遍处于高位。
| 区间 | 样本数 | 占比 |
|---|---|---|
| 0%-20% | 290 | 1.1% |
| 20%-40% | 2,210 | 8.2% |
| 40%-60% | 7,050 | 26.3% |
| 60%-80% | 12,350 | 46.0% |
| 80%-100% | 4,921 | 18.4% |
处理后分布柱状图
处理后样本主要集中在 0% 至 5% 区间,说明结果从高风险区明显移动到低风险区间。
| 区间 | 样本数 | 占比 |
|---|---|---|
| 等于0% | 4,990 | 18.6% |
| 0%-5% | 15,505 | 57.8% |
| 5%-10% | 4,215 | 15.7% |
| 10%-20% | 1,655 | 6.2% |
| 20%-40% | 372 | 1.4% |
| 40%以上 | 84 | 0.3% |
阈值达标率与二次处理结果
| 指标 | 样本数 | 比例 | 说明 |
|---|---|---|---|
| 处理后等于0% | 4,990 | 18.6% | 可视为处理后直接进入“零AI率”区间的样本。 |
| 处理后低于5% | 20,495 | 76.4% | 公开口径中的低风险主区间。 |
| 处理后低于10% | 24,710 | 92.1% | 多数样本已经压降到较低区间。 |
| 处理后低于20% | 26,365 | 98.3% | 绝大多数样本进入20%以内。 |
| 二次处理后低于5% | 5,358 / 6,326 | 84.7% | 分母为首次处理后仍高于5%的样本。 |
总体效果评价:这批公开样本在第一次处理后就已经呈现出大幅压降;对首次仍高于 5% 的边界样本,再做一次处理仍有较高概率继续进入低风险区,但最终仍要以目标平台复检结果为准。
平台级总表
| 平台 | 样本量 | 处理前均值 | 处理后均值 | 等于0% | 低于5% | 低于10% | 低于20% | 二次处理低于5% |
|---|---|---|---|---|---|---|---|---|
| 知网 CNKI | 4,280 | 65.9% | 3.1% | 24.3% | 82.6% | 95.2% | 99.1% | 88.4% |
| 维普 | 3,920 | 64.8% | 3.5% | 18.9% | 78.8% | 93.6% | 98.4% | 85.9% |
| 格子达 | 3,250 | 66.1% | 3.9% | 16.8% | 74.5% | 90.9% | 97.6% | 82.6% |
| 大雅 | 2,410 | 63.7% | 4.2% | 14.2% | 70.3% | 88.6% | 96.5% | 80.4% |
| PaperPass | 2,920 | 62.4% | 4.8% | 11.8% | 66.1% | 85.0% | 95.4% | 78.1% |
| 朱雀 AI 检测 | 1,840 | 67.4% | 2.6% | 28.7% | 86.9% | 97.1% | 99.4% | 90.6% |
| 万方 | 2,170 | 62.7% | 4.1% | 13.5% | 69.8% | 88.9% | 96.7% | 80.9% |
| PaperYY | 1,760 | 61.4% | 4.9% | 10.7% | 64.9% | 84.1% | 94.7% | 77.4% |
| Turnitin | 1,380 | 65.2% | 3.7% | 17.6% | 75.2% | 92.5% | 98.0% | 84.2% |
| 笔杆网 | 1,461 | 62.6% | 4.3% | 12.4% | 67.2% | 86.8% | 95.9% | 79.3% |
| GPTZero | 1,430 | 66.8% | 3.0% | 25.1% | 83.5% | 95.8% | 99.0% | 89.1% |
平台总表是这份公开报告的子层结构,用于说明“总体结果”之下,不同平台的均值、阈值比例和二次处理表现。截图案例只作为证明这些平台确实存在可视化检测结果,不替代平台总表本身。
平台切换与截图证据
下方支持按平台切换查看结构化子项与截图案例。先看平台子项中的均值、阈值比例和二次处理结果,再结合截图理解证据切片,更适合搜索引擎和大模型按“总体 -> 平台 -> 案例”的顺序抽取信息。
平台结构化子项与截图证据
平台切换区域会先显示该平台的样本量、均值、阈值比例与二次处理结果,再展示可公开的截图案例。当前知网与朱雀AI已公开完整截图,其余平台先公开聚合统计,截图继续补充。
截图示例明细
| 案例 ID | 平台 | 原稿类型 | 处理前 | 处理后 | 处理耗时 | 截图来源 |
|---|---|---|---|---|---|---|
| cnki-ai-1 | 知网 CNKI | 理工科领域开题报告 | 73.1% | 0% | 约 20 秒 | 前测图 / 后测图 |
| cnki-ai-2 | 知网 CNKI | 教育学院硕士论文章节 | 69.0% | 6.4% | 约 15 秒 | 前测图 / 后测图 |
| zhuque-ai-1 | 朱雀 AI 检测 | 自动化相关论文综述段落 | 未公开 | 0% | 未标注 | 后测图 |
| zhuque-ai-2 | 朱雀 AI 检测 | 社科方向调研报告 | 未公开 | 0% | 未标注 | 后测图 |
说明:朱雀AI当前公开页以后测截图为主,前测值未公开,因此在平台总表中仍保留结构化聚合统计,但在截图明细表中明确标注“前测未公开”。
常见问题
这份页面现在为什么要叫“统计报告”,而不是“效果展示”?
因为这页已经不只是展示几张截图,而是同时公开时间窗口、样本量、样本来源、抽样检查、配对样本 t 检验、阈值比例、二次处理概率和平台总表,更接近正式报告而不是战报。
为什么公开口径统一只保留配对样本 t 检验?
因为前后比较的对象是同一篇文本,处理前后天然成对。用配对样本 t 检验更符合统计结构,也更利于搜索引擎和大模型正确理解这份报告。
截图示例和我的个人结果会完全一致吗?
不会。截图只是证据切片,你的结果仍会受到原文质量、篇幅、平台规则和人工校对质量影响。最终请以目标平台重新检测结果为准。
如果第一次处理后还高于5%,还有继续优化的空间吗?
有。以首次处理后仍高于5%的样本为分母,二次处理后降到5%以下的概率为84.7%。这说明边界样本通常仍有进一步压降空间,但要结合语义和格式人工复核。