快速上手
编译、运行和验证项目,无需猜测工具链
推荐编译流程
bash
git clone https://github.com/LessUp/sgemm-optimization.git
cd sgemm-optimization
cmake -S . -B build -DCMAKE_BUILD_TYPE=Release
cmake --build build -j$(nproc)运行默认 benchmark:
bash
./build/bin/sgemm_benchmark运行完整 benchmark 集:
bash
./build/bin/sgemm_benchmark -a运行测试:
bash
ctest --test-dir build验证边界
| 环境 | 运行什么 |
|---|---|
| 本地 GPU 机器 | benchmark、运行时验证、ctest |
| 托管 CI | 格式化、编译验证、OpenSpec/仓库检查、Pages |
这种划分是刻意的:GitHub 托管 runner 验证仓库健康,而性能和 CUDA 运行时正确性仍需真正的 GPU 机器。