常见问题 (FAQ)
MICOS-2024 常见问题的快速解答。
一般问题
MICOS-2024 是什么?
MICOS-2024(Metagenomic Intelligence and Comprehensive Omics Suite)是一个端到端宏基因组分析平台。它将质量控制、物种分类、功能注释和多样性分析整合到统一的工作流中。
谁应该使用 MICOS-2024?
- 生物学家:生物信息学经验最少
- 生物信息学家:需要标准化、可重现的工作流
- 临床研究人员:分析微生物组样本
- 生态学家:研究环境微生物组
MICOS-2024 与其他工具相比如何?
| 特性 | MICOS-2024 | Qiime2 | MG-RAST | mothur |
|---|---|---|---|---|
| 端到端工作流 | ✅ | 部分 | ✅ | 部分 |
| WDL 工作流 | ✅ | ❌ | ❌ | ❌ |
| Docker 支持 | ✅ | ✅ | ❌ | ❌ |
| CLI 界面 | ✅ | ✅ | Web | ✅ |
| 流程灵活性 | 高 | 中 | 低 | 中 |
安装问题
推荐的安装方法是什么?
Docker 适合:
- 最大可重现性
- 服务器轻松部署
- 生产环境
Conda 适合:
- 开发工作
- 自定义修改
- 无 Docker 的系统
我需要多少磁盘空间?
| 组件 | 最低 | 推荐 |
|---|---|---|
| 软件安装 | 5 GB | 10 GB |
| Kraken2 数据库 | 70 GB | 150 GB (PlusPF) |
| HUMAnN 数据库 | 30 GB | 50 GB |
| 分析输出 | 100 GB | 500 GB |
| 总计 | ~200 GB | ~700 GB |
我可以在没有管理员权限的情况下安装吗?
可以!两种安装方法都无需 sudo:
- Docker:需要将用户添加到
docker组 - Conda:完全安装在用户目录中
我需要 GPU 吗?
不需要。MICOS-2024 基于 CPU。目前不支持 GPU 加速。
分析问题
分析需要多长时间?
每样本的近似时间(1000 万对端 reads):
| 步骤 | 时间 | 注意 |
|---|---|---|
| 质量控制 | 10-30 分钟 | 取决于宿主基因组大小 |
| 物种分类 | 5-15 分钟 | 使用 Kraken2 标准库 |
| 功能注释 | 1-4 小时 | 取决于数据库 |
| 多样性分析 | 10-30 分钟 | 每次计算 |
| 总计 | 2-6 小时 | 高度可并行化 |
提速技巧:
- 对临时文件使用 SSD
- 增加
--threads参数 - 测试使用 MiniKraken
我需要多少测序深度?
| 研究类型 | 最低 | 推荐 |
|---|---|---|
| 试点/测试 | 1M reads/样本 | 2M reads/样本 |
| 一般分析 | 5M reads/样本 | 10M reads/样本 |
| 稀有物种检测 | 20M reads/样本 | 50M reads/样本 |
| 功能分析 | 10M reads/样本 | 30M reads/样本 |
我可以分析单端数据吗?
可以,MICOS-2024 支持双端和单端数据。但是:
- 推荐双端:更好的物种分类分辨率
- 单端足够:功能注释
- 在配置中指定格式或让自动检测处理
结果问题
为什么大多数我的 reads 未分类?
可能的原因:
| 原因 | 检查 | 解决方案 |
|---|---|---|
| 数据库太小 | 使用标准库而非 MiniKraken | 下载更大的数据库 |
| 置信度过高 | 检查配置 | 降低到 0.05-0.1 |
| 新生物 | 文献检索 | 构建自定义数据库 |
| 数据质量 | 运行 FastQC | 改进 QC 参数 |
| 环境样本 | 样本类型 | 使用 PlusPF 数据库 |
我应该使用哪个多样性指标?
Alpha 多样性:
- Shannon:一般多样性(丰富度 + 均匀度)
- Chao1:丰富度估计
- Observed:简单物种计数
Beta 多样性:
- Bray-Curtis:丰度数据的标准
- UniFrac:当系统发育重要时
- Aitchison:含零的组成数据
如何解释统计结果?
| 检验 | p < 0.05 表示 | 可视化 |
|---|---|---|
| PERMANOVA | 组间显著差异 | PCoA 图 |
| Kruskal-Wallis | Alpha 多样性不同 | 箱线图 |
| LEfSe | 特定分类群不同 | 柱状图 |