Skip to the content.

TensorCraft-HPC

GitHub Pages CI License: MIT CUDA C++

TensorCraft-HPC 面向“理解并实践现代 AI 算子如何从可读实现演进到高性能版本”的学习与工程场景,覆盖 Elementwise、Normalization、GEMM、Attention、Conv2D、Sparse、Fusion 与 Quantization 等核心模块。

项目定位

这是一个把现代 C++/CUDA 编程、AI kernel 设计模式与工程化验证流程放在一起的学习型仓库。README 现在只保留仓库级入口,这个页面负责告诉你项目适合谁、从哪里开始,以及文档之间如何组织。

适合谁

从哪里开始

  1. 先看 README,完成最小构建、测试与 Python 安装。
  2. 再看 安装指南架构设计,建立环境与模块边界认知。
  3. 想深入实现细节时,继续阅读 优化指南API 参考Modern C++ in CUDA

推荐阅读路径

我只想先编译并跑测试

我想先理解架构与模块划分

我准备做优化或继续维护

核心文档

类别 页面 说明
概览 README 仓库定位、最小构建命令与文档链接
快速开始 安装指南 环境准备、平台差异与安装步骤
架构设计 架构设计 模块边界、目录结构与设计思路
使用指南 优化指南 GEMM / Attention / Kernel 优化路线
参考 API 参考 C++ / Python 接口说明
开发指南 CONTRIBUTING 贡献流程、测试要求与代码规范
归档 CHANGELOG / changelog/ 版本记录与 Pages / 工作流调整记录

相关入口