本文介绍了有关计算机深度学习的有趣内容。

用于自动驾驶的语义分割


近年来,计算机视觉取得了很大的进展。
技术:

  • 人脸检测(Face detection):Haar, HOG, MTCNN, Mobilenet
  • 人脸识别(Face recognition):CNN, Facenet
  • 目标识别(Object recognition):alexnet, inceptionnet, resnet
  • 迁移学习(Transfer learning):在新的问题上用较少的资源训练较大的神经网络
  • 图像分割(Image segmentation ):rcnn
  • GAN
  • 计算机视觉硬件:选择什么,GPU很重要
  • 集成视觉的UI应用程序:ownphotos

应用:

  • 个人相册
  • 自动驾驶汽车
  • 无人机
  • 验证码识别/OCR
  • 网站/应用程序的图片过滤
  • 自动标记图片的应用
  • 从视频(电视节目、电影)从提起信息
  • 视觉问答
  • 艺术

相关学者:

课程:

  • deep learning @ coursera
  • machine learning @ coursera

相关领域:

  • 深度强化学习,使用CNN作为输入层,查看ppo和dqn
  • 与NLP的交互:lstm 2 cnn

人脸检测

人脸检测是在面部放置检测框

人脸检测是检测人脸的任务,有几种算法可以实现。
face-detector-benchmark为这些方法的速度提供基准,易于重用实现。

Haar classifiers

他们是自2000年以来在opencv中出现的旧计算机视觉方法。此文介绍该算法,http://wearables.cc.gatech.edu/paper_of_week/viola01rapid.pdf
它是一种专门用于目标检测的机器学习模型,Haar分类器速度快但精度较低。更详细的解释和如何使用它的示例在https://docs.opencv.org/3.4.3/d7/d8b/tutorial_py_face_detection.html

HOG : Histogram of Oriented Gradients

HOG是一种新的生成目标特征检测方法:从2005年开始使用。他是基于图像像素上的计算梯度。然后将这些特征馈送到机器学习算法,例如SVM。精度比Haar分类器好。
其实现在dlib中,在face_recognition中。

MTCNN

一种使用CNN变化来检测图像的新方法。精度更高但速度稍慢。https://kpzhang93.github.io/MTCNN_face_detection_alignment/index.html

MobileNet

目前最好的、最快的人脸检测方法。基于通用的移动网络架构。见https://arxiv.org/abs/1704.04861

目标检测

多种目标的目标检测

可以使用与面部检测类似的方法来实现对象检测。
这里有2篇文章介绍了实现它的最新方法。这些方法有时甚至也提供了一类对象(实现对象识别):

卷积神经网络

最近在深度学习领域一些新的架构取得进展。