贵妃网贵妃网

贵妃网 - 时尚原创门户网站
www.962068.com
文章89985浏览13436370本站已运行5725

计算机视觉八大任务全概述:PaddlePaddle工程师详解热门视觉模型 |人工智能

原标题:计算机视觉八大年夜义务全概述:PaddlePaddle工程师详解热点视觉模型

本文转载自 PaddlePaddle

编者按:

来自百度的深度进修工程师,环绕计算机视觉范畴的八大年夜义务,包含:图像分类、目标检测、图像语义瓜分、场景文字辨认、图像生成、人体关键点检测、视频分类、度量进修等,进行了较为具体的综述并形成此文。

计算机视觉(Computer Vision)是研究若何使机械“看”的科学,更进一步的说,是应用摄像机机和电脑代替身眼对目标进行辨认、跟踪和测量等的机械视觉,并经由过程电脑处理成为更合适人眼不雅察或传送给仪器检测的图像。

形象地说,就是给计算机安装上眼睛(摄像机)和大年夜脑(算法),让计算机像人一样去看、去感知情况。计算机视觉技巧作为人工智能的重要核心技巧之一,已广泛应用于安防、金融、硬件、营销、驾驶、医疗等范畴。本文上篇中,我们将介绍基于PaddlePaddle的四种计算机视觉技巧及其相干的深度进修模型。

一、图像分类

图像分类是根据图像的语义信息对不合类别图像进行区分,是计算机视觉中重要的基本问题,是物体检测、图像瓜分、物体跟踪、行动分析、人脸辨认等其他高层视觉义务的基本。

图像分类在很多范畴都有着广泛的应用。如:安防范畴的人脸辨认和智能视频分析等,交通范畴的交通场景辨认,互联网范畴基于内容的图像检索和相册主动归类,医学范畴的图像辨认等。

得益于深度进修的推动,图像分类的精确率大年夜幅度晋升。在经典的数据集ImageNet上,练习图像分类义务常用的模型,包含AlexNet、VGG、GoogLeNet、ResNet、Inception-v4、MobileNet、MobileNetV2、DPN(Dual Path Network)、SE-ResNeXt、ShuffleNet等。

AlexNet

这篇综述中,介绍了这些义务的根本情况,以及今朝的技巧进展、重要的模型和机能比较等。并且还一一附上了GitHub传送门,用于更进一步的进修与安装实践指南。个中不少教程照样用中文写成,异常友爱。

VGG

GoogLeNet

ResNet

一、图像生成

Inception-v4

MobileNet

SE-ResNeXt

ShuffleNet

模型的构造和复杂程度都不一样,最终获得的精确率也有所差别。下面这个表格中,列出了在ImageNet 2012数据集上,不合模型的top-1/top-5验证精确率。

图像分类系列模型评估成果

在我们的GitHub页面上,供给上述与练习模型的下载。以及具体介绍了若何应用PaddlePaddle Fluid进行图像分类义务。包含安装、数据预备、模型练习、评估等等全部过程。还有将Caffe模型转换为PaddlePaddle Fluid模型设备和参数文件的对象。

赞一下
贵妃网
上一篇: 高血压患者如何选择地平类药物降血压?来看看医生怎么说 |卡托普利
下一篇: 打败噪音!波士顿大学“超材料”透光通风却能隔声? |弗成理

相关推荐

隐藏边栏