最新｜谷歌开源目标检测API物体识别系统！

文章来源：Google 编辑：lily

在谷歌，研究人员开发了先进的计算机视觉机器学习系统，不仅可以用于谷歌自身的产品和服务，还推广至整个研究社区。创造能够在同一张图片里定位和识别多种物体的机器学习模型一直是业内的核心挑战，谷歌宣称自己已投入大量时间进行训练和实验。

其中一个模型在示例图片中对象识别的效果

去年10月，谷歌内部的物体识别系统达到了业内最高水平，并在COCO识别挑战中荣获第一。此后，该系统为大量文献提供了结果，并被一些谷歌的产品所采用，如NestCam，同样的理念也被识别谷歌街景街道名称和门牌号的图像搜索采用。

今天，我们很高兴通过TensorFlow目标检测API把该系统开源给更大的研究者。代码库是一个建立在TensorFlow顶部的开源框架，方便其构建，训练和部署目标检测模型。目的是支持当前最佳的模型，同时允许快速探索和研究我们的第一个版本包含：

1）带有MobileNets的SSD（单拍Multibox Detector）

https://research.googleblog.com/2017/06/mobilenets-open-source-models-for.html

2）带有Inception V2的SSD

https://arxiv.org/abs/1512.00567

3）带有Resnet 101的R-FCN

https://arxiv.org/abs/1605.06409

4）带有Resnet 101的更快的RCNN

https://arxiv.org/abs/1506.01497

5）带有Inception Resnet v2的更快的RCNN

https://arxiv.org/abs/1506.01497

https://arxiv.org/abs/1602.07261

上述每一个模型的冻结权重（在COCO数据集上训练）可被用于开箱即用的推理。
http://mscoco.org/
Jupyter笔记可以通过我们的模型之一执行开箱即用的推理
https://github.com/tensorflow/models/blob/master/object_detection/object_detection_tutorial.ipynb
借助谷歌云实现便捷的本地训练脚本以及分布式训练和评估管道

SSD模型使用了轻量化的MobileNet，意味它们可以轻而易举地在移动设备中实时使用。在2016年COCO挑战中，谷歌使用了Fast RCNN模型，它需要更多的计算资源，结果更为准确。了解更多细节，请参阅CVPR 2017的论文：https：//arxiv.org/abs/1611.10012

本站仅提供存储服务，所有内容均由用户发布，如发现有害或侵权内容，请点击举报。