工程指南
这些页面聚焦工程决策:融合算子应放在模型的哪个边界、性能该如何正确测量、FP8 的收益和风险如何取舍。
集成 运行契约与模型边界 帮助你在函数式 API、模块封装与自定义适配器之间做选择。 性能 测量方法与调优路径 说明如何做正确基准测试、如何理解指标、如何调优自定义 kernel。 FP8 量化最佳实践 说明 FP8 适合的位置,以及数值敏感步骤应保留更高精度。
这些页面聚焦工程决策:融合算子应放在模型的哪个边界、性能该如何正确测量、FP8 的收益和风险如何取舍。