Learning computer vision
本文介绍了有关计算机深度学习的有趣内容。
近年来,计算机视觉取得了很大的进展。
技术:
- 人脸检测(Face detection):Haar, HOG, MTCNN, Mobilenet
- 人脸识别(Face recognition):CNN, Facenet
- 目标识别(Object recognition):alexnet, inceptionnet, resnet
- 迁移学习(Transfer learning):在新的问题上用较少的资源训练较大的神经网络
- 图像分割(Image segmentation ):rcnn
- GAN
- 计算机视觉硬件:选择什么,GPU很重要
- 集成视觉的UI应用程序:ownphotos
应用:
- 个人相册
- 自动驾驶汽车
- 无人机
- 验证码识别/OCR
- 网站/应用程序的图片过滤
- 自动标记图片的应用
- 从视频(电视节目、电影)从提起信息
- 视觉问答
- 艺术
相关学者:
- 深度学习创始人: andrew ng, yann lecun, bengio yoshua, hinton joffrey
- adam geitgey,有许多关于视觉的有趣文章,比如 https://medium.com/@ageitgey/machine-learning-is-fun-part-4-modern-face-recognition-with-deep-learning-c3cffc121d78 具有全脸检测/对其/识别
课程:
- deep learning @ coursera
- machine learning @ coursera
相关领域:
- 深度强化学习,使用CNN作为输入层,查看ppo和dqn
- 与NLP的交互:lstm 2 cnn
人脸检测
人脸检测是检测人脸的任务,有几种算法可以实现。
face-detector-benchmark为这些方法的速度提供基准,易于重用实现。
Haar classifiers
他们是自2000年以来在opencv中出现的旧计算机视觉方法。此文介绍该算法,http://wearables.cc.gatech.edu/paper_of_week/viola01rapid.pdf
它是一种专门用于目标检测的机器学习模型,Haar分类器速度快但精度较低。更详细的解释和如何使用它的示例在https://docs.opencv.org/3.4.3/d7/d8b/tutorial_py_face_detection.html
HOG : Histogram of Oriented Gradients
HOG是一种新的生成目标特征检测方法:从2005年开始使用。他是基于图像像素上的计算梯度。然后将这些特征馈送到机器学习算法,例如SVM。精度比Haar分类器好。
其实现在dlib中,在face_recognition中。
MTCNN
一种使用CNN变化来检测图像的新方法。精度更高但速度稍慢。https://kpzhang93.github.io/MTCNN_face_detection_alignment/index.html
MobileNet
目前最好的、最快的人脸检测方法。基于通用的移动网络架构。见https://arxiv.org/abs/1704.04861
目标检测
可以使用与面部检测类似的方法来实现对象检测。
这里有2篇文章介绍了实现它的最新方法。这些方法有时甚至也提供了一类对象(实现对象识别):
- r-fcn:https://towardsdatascience.com/review-r-fcn-positive-sensitive-score-maps-object-detection-91cd2389345c
- r-cnn, fast r-cnn, faster r-cnn 和 yolo的比较:https://towardsdatascience.com/r-cnn-fast-r-cnn-faster-r-cnn-yolo-object-detection-algorithms-36d53571365e
卷积神经网络
最近在深度学习领域一些新的架构取得进展。