zh常见问题

常见问题 (FAQ)

MICOS-2024 常见问题的快速解答。


一般问题

MICOS-2024 是什么?

MICOS-2024(Metagenomic Intelligence and Comprehensive Omics Suite)是一个端到端宏基因组分析平台。它将质量控制、物种分类、功能注释和多样性分析整合到统一的工作流中。

谁应该使用 MICOS-2024?

  • 生物学家:生物信息学经验最少
  • 生物信息学家:需要标准化、可重现的工作流
  • 临床研究人员:分析微生物组样本
  • 生态学家:研究环境微生物组

MICOS-2024 与其他工具相比如何?

特性MICOS-2024Qiime2MG-RASTmothur
端到端工作流部分部分
WDL 工作流
Docker 支持
CLI 界面Web
流程灵活性

安装问题

推荐的安装方法是什么?

Docker 适合:

  • 最大可重现性
  • 服务器轻松部署
  • 生产环境

Conda 适合:

  • 开发工作
  • 自定义修改
  • 无 Docker 的系统

我需要多少磁盘空间?

组件最低推荐
软件安装5 GB10 GB
Kraken2 数据库70 GB150 GB (PlusPF)
HUMAnN 数据库30 GB50 GB
分析输出100 GB500 GB
总计~200 GB~700 GB

我可以在没有管理员权限的情况下安装吗?

可以!两种安装方法都无需 sudo:

  • Docker:需要将用户添加到 docker
  • Conda:完全安装在用户目录中

我需要 GPU 吗?

不需要。MICOS-2024 基于 CPU。目前不支持 GPU 加速。


分析问题

分析需要多长时间?

每样本的近似时间(1000 万对端 reads):

步骤时间注意
质量控制10-30 分钟取决于宿主基因组大小
物种分类5-15 分钟使用 Kraken2 标准库
功能注释1-4 小时取决于数据库
多样性分析10-30 分钟每次计算
总计2-6 小时高度可并行化

提速技巧

  • 对临时文件使用 SSD
  • 增加 --threads 参数
  • 测试使用 MiniKraken

我需要多少测序深度?

研究类型最低推荐
试点/测试1M reads/样本2M reads/样本
一般分析5M reads/样本10M reads/样本
稀有物种检测20M reads/样本50M reads/样本
功能分析10M reads/样本30M reads/样本

我可以分析单端数据吗?

可以,MICOS-2024 支持双端和单端数据。但是:

  • 推荐双端:更好的物种分类分辨率
  • 单端足够:功能注释
  • 在配置中指定格式或让自动检测处理

结果问题

为什么大多数我的 reads 未分类?

可能的原因:

原因检查解决方案
数据库太小使用标准库而非 MiniKraken下载更大的数据库
置信度过高检查配置降低到 0.05-0.1
新生物文献检索构建自定义数据库
数据质量运行 FastQC改进 QC 参数
环境样本样本类型使用 PlusPF 数据库

我应该使用哪个多样性指标?

Alpha 多样性

  • Shannon:一般多样性(丰富度 + 均匀度)
  • Chao1:丰富度估计
  • Observed:简单物种计数

Beta 多样性

  • Bray-Curtis:丰度数据的标准
  • UniFrac:当系统发育重要时
  • Aitchison:含零的组成数据

如何解释统计结果?

检验p < 0.05 表示可视化
PERMANOVA组间显著差异PCoA 图
Kruskal-WallisAlpha 多样性不同箱线图
LEfSe特定分类群不同柱状图

更多问题?