计算机视觉(CV,Computer Vision)领域任务
目前计算机视觉(CV,computer vision)与自然语言处理(Natural Language Process, NLP)及语音识别(Speech Recognition)并列为人工智能(AI,artificial intelligence)的三大热点方向 。 图像分类、目标检测、分割是计算机视觉领域的三大任务。 如何从图像中解析出可供计算机理解的信息,是机器视觉(Machine Vision)的中心问题。 深度学习模型由于其强大的表示能力,加之数据量的积累和计算力的进步,成为机器视觉的热点研究方向。那么,如何理解一张图片呢?根据任务的需要,机器理解图像三个主要的层次: 一是分类(Classification),即是将图像结构化为某一类别的信息,用事先确定好的类别(category)或实例ID来描述图片。这一任务是最简单、最基础的图像理解任务,也是深度学习模型最先取得突破和实现大规模应用的任务。其中,ImageNet是最权威的评测集,每年的ILSVRC催生了大量的优秀深度网络结构,为其他任务提供了基础。在应用领域,人脸、场景的识别等都可以归为分类任务。 二是检测(Detection)。分类任务关心整体,给出的是整张...