中文知识库

这里聚合了与当前仓库实现一致的技术内容:公开 API、运行约束、性能工具链,以及 Triton kernel 的内部设计说明。

推荐阅读路径

第一次阅读

先看 安装指南快速开始

准备接入项目

先看 核心算子集成指南

准备做性能工作

先看 基准测试自动调优性能优化

准备读源码

先看 架构设计算子设计

运行边界提醒

  • Triton kernel 的实际执行需要 CUDA。
  • CPU-only 环境仍适合导入检查、lint、类型检查、构建,以及 CPU-safe 测试。
  • 站点现在只保留技术知识页,不再把更新日志和仓库流程信息发布到 GitHub Pages。

Table of contents