打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
最新|谷歌开源目标检测API物体识别系统!


文章来源:Google  编辑:lily


在谷歌,研究人员开发了先进的计算机视觉机器学习系统,不仅可以用于谷歌自身的产品和服务,还推广至整个研究社区。创造能够在同一张图片里定位和识别多种物体的机器学习模型一直是业内的核心挑战,谷歌宣称自己已投入大量时间进行训练和实验。

其中一个模型在示例图片中对象识别的效果

去年10月,谷歌内部的物体识别系统达到了业内最高水平,并在COCO识别挑战中荣获第一。此后,该系统为大量文献提供了结果,并被一些谷歌的产品所采用,如NestCam,同样的理念也被识别谷歌街景街道名称和门牌号的图像搜索采用。


今天,我们很高兴通过TensorFlow目标检测API把该系统开源给更大的研究者。代码库是一个建立在TensorFlow顶部的开源框架,方便其构建,训练和部署目标检测模型。目的是支持当前最佳的模型,同时允许快速探索和研究我们的第一个版本包含:


  • 一个可训练性检测模型的集合,包括:

1)带有MobileNets的SSD(单拍Multibox Detector)

https://research.googleblog.com/2017/06/mobilenets-open-source-models-for.html

2)带有Inception V2的SSD

https://arxiv.org/abs/1512.00567

3)带有Resnet 101的R-FCN

https://arxiv.org/abs/1605.06409

4)带有Resnet 101的更快的RCNN

https://arxiv.org/abs/1506.01497

5)带有Inception Resnet v2的更快的RCNN

https://arxiv.org/abs/1506.01497

https://arxiv.org/abs/1602.07261

  • 上述每一个模型的冻结权重(在COCO数据集上训练)可被用于开箱即用的推理。

    http://mscoco.org/

  • Jupyter笔记可以通过我们的模型之一执行开箱即用的推理

    https://github.com/tensorflow/models/blob/master/object_detection/object_detection_tutorial.ipynb

  • 借助谷歌云实现便捷的本地训练脚本以及分布式训练和评估管道


SSD模型使用了轻量化的MobileNet,意味它们可以轻而易举地在移动设备中实时使用。在2016年COCO挑战中,谷歌使用了Fast RCNN模型,它需要更多的计算资源,结果更为准确。了解更多细节,请参阅CVPR 2017的论文:https://arxiv.org/abs/1611.10012

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
OpenAI早就不卷大模型,开始卷AI Agents了?这是一篇来自OpenAI应用研究主管关于Agent的万字长文
CVPR 2021 论文大盘点-文本图像篇
8 篇论文深入学习深度估计:深度预测;自我运动学习;观看冰雪奇缘了解移动人物深度
自动驾驶在挑战中进化的感知能力
谷歌大脑2017总结(Jeff Dean执笔,干货满满,值得收藏)
不被大神Hinton认同,否定现有同行成果,谷歌这篇烧脑研究最终拿下
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服