Skip to content

CleanBook离线优先的智能书签清理工具

规则优先 · ML 辅助 · LLM 可选 · 适合开发者与重度书签用户

CleanBook

为什么是 CleanBook

CleanBook 适合已经积累了大量浏览器书签、又不想把数据交给在线服务的用户。它的目标不是做一个“云端收藏平台”,而是把现有书签 快速清理、去重、分类、导出

它是怎么工作的

  1. 从浏览器导出书签 HTML
  2. 运行 cleanbook -i bookmarks.html -o output/
  3. 先走稳定规则,再按需叠加 ML 和可选 LLM
  4. 输出适合继续整理、导入和分析的结果文件

你会得到什么

  • 清理后的 HTML:方便再次导入浏览器
  • JSON 数据:便于二次分析和自动化处理
  • 报告型输出:适合检查分类结果和后续人工微调

最快体验

bash
pipx install cleanbook
cleanbook -i bookmarks.html -o output/

如果你只想走稳定路径:

bash
cleanbook -i bookmarks.html -o output/ --no-ml

适合谁

  • 个人用户:清理历史书签堆积
  • 团队维护者:共享分类规则与 taxonomy
  • 开发者:研究书签处理流水线、规则融合与 CLI 工程化

为什么它值得长期保留

  • 真正离线:默认不依赖云端账号或托管服务
  • 规则优先:稳定、可解释、可复现
  • 扩展有边界:ML 和 LLM 是增强层,不会吞掉整个处理流程

下一步

CleanBook · Offline-first bookmark cleanup