📖 使用教程 👤 shenji-integrated登出

薄内容审计工具

输入 sitemap,多维度判定薄内容(字数 / 正文比 / 出站密度 / 空状态 / 标题重复 / SimHash 近重复),自动给每页"问题诊断 + 建议动作 + 优先级",可选 AI 改写建议,导出多 sheet Excel 报告。

📋 Jobs 历史 / 断点续跑 (进程重启后自动从 SQLite 任务队列恢复,支持暂停/续跑/重试失败项) 点击展开
支持 sitemap index(自动递归解析)和 .gz 压缩
字数 = 中文每字 1,英文/数字每词 1(Word/微信口径)。低于此值判定为薄内容。
留空将自动识别常见正文容器(.article-content / .post-content / .article-preview-container 等共 40+ 种),CSV 里会显示用了哪个
用法:粘贴文章 URL → 点按钮 → 立即看到 RAW / CLEAN / 剥掉的模板块。改完规则可以反复点同一个 URL 验证。