Posts /

Towards Autonomous Driving related Computer Vision - I

Twitter Facebook
26 Apr 2018

这是我继《本科深度学习及求职经验分享》后的第二个 Live,这次想聊点具体的技术问题,同时,我想把它作为我今年一个系列 Live 的开篇,关于计算机视觉和自动驾驶。一方面,为对这方面有兴趣的同学提供一个 smoothly 入门以及深入的 path,另一方面,也是我在这个领域不断学习和实践的总结,这样也可以让各位可以 keep tracking of state-of-the-art progress,当然,还有一方面是可以通过这一系列 Live 结交更多朋友。

这篇 blog 主要目的是帮我理清一下该系列第一个 Live 的思路,以及要讲那些东西。

首先,做一下 ”竞品分析“,目前,知乎上可获得的关于计算机视觉的 Live 有以下这些:

先看下人气最高的第一个,是什么内容:

我们有参加该 Live,从介绍来看,该 Live 讲的比较适合零基础入门的同学,不过也让我感觉过于基础,只是讲了些常见的东西,换句话说,Live 中的内容,我猜测,基本都是可以自己通过搜索引擎获取到的,比如公开课,参考书籍,开源软件等等,这些在我看来,都属于一个人会不会自学,会不会主动获取知识,会不会快速的探索一个新领域的范畴,并没有什么技术含量。我当然没有不尊重主讲人的意思,毕竟,这个 Live 肯定做到了 ”入门“ 这一步,正如标题所说,不过如何 “放肆”,我就不得而知了。

by the way,买手机先去看差评,选 Live 差评也比好评的参考价值大很多。

另外几个关于计算机视觉的 Live 我也大致看了下,通过参考已有的这些信息,我大致清楚了自己需要讲那些东西。

首先,我们需要一个假设,我希望对这系列 Live 感兴趣的你至少具备以下 ”前提“,才能将收货最大化:

  1. 你需要对编程有一定的了解,至少熟悉某一门编程语言,C++ 和 Python 最好,MATLAB 什么的也可以。
  2. 你需要具备一定的数学基础,基本大学学的这点数学就够了,因为我想从最基础的卷积操作讲起,从而让你对 CNN 有清晰地了解。
  3. 你需要对神经网络有一个初步的认识,如果你还不知道的话,推荐看一下多层感知机。

深度学习发展到现在,在 Vision 领域,有一些 “基础性” 的工作是基本避不开的,比如 Faster-RCNN,ResNet,我打算在过段时间的第一个 Live 中,详细的讲一下 Faster RCNN,尤其是其中的 RPN 和 ROI Pooling 是如何工作的。

这个系列的 Live 面向的是自动驾驶,因此,我准备在第一次的 Live 中加入对常见的数据集的介绍,比如 KITTI,Pascal 3D,以及对其中常见的 Metric 的介绍

让大家对自动驾驶中的常见任务有个整体的了解。

当然,还有一部分就是对目前自动驾驶(L1-L5)的现状进行介绍了,包括有哪些公司做得比较好,国内国外分别有哪些,有哪几种做自动驾驶的方式,以及目前的发展水平。

在本次 Live 之后,我目前的计划是分一个个的专题进行深入的讲解,时间不做限制,力求讲得清楚,如果必要的话会伴随一部分代码。

如果你对此感兴趣,或者有什么期望在该系列 Live 里涉及到的,欢迎私信或者评论,我会及时对内容进行调整,我们到时候见。


Twitter Facebook