导读

导读章节用于把读者从“刚看到仓库”快速带到“已经理解这个系统为什么值得看”。如果你想先抓住项目边界、模型范围和阅读路径，从这里开始。

YOLO-Toys 本质上是什么

YOLO-Toys 是一个 多模型视觉推理服务运行时。它把多个视觉模型家族统一到一套 FastAPI 与 WebSocket 接口之下，既方便快速集成 demo / backend，也方便研究混合视觉工作负载的服务化架构。

家族	代表模型	主要职责
YOLOv8	`yolov8n.pt`、`yolov8n-seg.pt`、`yolov8n-pose.pt`	快速检测、分割、姿态
DETR	`facebook/detr-resnet-50`	Transformer 检测
OWL-ViT / Grounding DINO	`google/owlvit-base-patch32`	开放词汇检测
BLIP	`Salesforce/blip-image-captioning-base`	图像描述与 VQA