Skip to content
YOLO-Toys架构白皮书

把异构视觉模型统一到一个运行时里,并像系统论文一样把它讲清楚。

YOLO-Toys 把 YOLOv8、DETR、OWL-ViT、Grounding DINO 与 BLIP 统一到一条 FastAPI 与 WebSocket 服务边界中。这个站点把代码库当作技术工件来对待:架构图谱、设计推演、运行参考与研究背景——以系统白皮书的标准进行文档化。

运行时架构

YOLO-Toys 组织为规范化的服务运行时:传输层入口、中央控制平面、注册表支撑的分发调度,以及将异构执行逻辑局部化的模型家族适配层。

5 个模型家族REST + WebSocketHandler / Registry 模式LRU + TTL 缓存
<5ms热启动延迟YOLOv8n + GPU,缓存命中路径
5模型家族YOLO · DETR · OWL-ViT · G-DINO · BLIP
142请求/秒YOLOv8n 已缓存,20 并发用户
85%内存阈值GPU 安全驱逐的 LRU 触发线
6中间件层安全 → 指标 → 超时 → 限流 → 压缩 → CORS
1服务边界所有模型家族统一在单个 FastAPI 运行时后
架构蓝图
API 表面HTTP REST + WebSocket 入口——路由保持轻薄、传输专属、可替换传输层
中间件栈SecurityHeaders → Metrics → Timeout → RateLimit → GZip → CORS 按层序执行横切关注点
运行时核心ModelManager——缓存策略、并发护栏、生命周期所有权控制平面
Handler 注册表HandlerRegistry——类别推断、模型元数据、确定性分发分发层
执行适配器YOLO · DETR · OWL-ViT · Grounding DINO · BLIP handler——模型专属逻辑局部化执行层
结果规范化跨所有模型家族的稳定公开 schema——YOLO 与 DETR 使用相同 envelope契约层
Enter through architecture, operations, or research — each path is optimized for a different kind of expert reader.
The site is structured as a technical whitepaper with an academy and research wing. Every reading track is designed for advanced readers who want both the how and the why.

Released under the MIT License.