PyTorch自动驾驶视觉感知算法实战

前言 PREFACE 2012年，多伦多大学Geoffrey Hinton教授指导的学生Alex Krizhevsky发表了AlexNet深度卷积神经网络模型，在ImageNet图像识别任务上大幅超越第二名，开启了深度学习的新纪元。同年，笔者于慕尼黑工业大学毕业，彼时，笔者选修了Daniel Cremers教授开设的多门课程，醉心于学习凸优化、微分几何等经典计算机视觉的理论知识，对卷积神经网络一无所知，丝毫感觉不到一个人工智能的伟大时代就此揭开帷幕。25年前，也是在慕尼黑工业大学计算机系，Jürgen Schmidhuber教授指导的学生Sepp Hochreiter发表了论文LSTM（Long Short-Term Memory），他们也决然无法预料，被SVM等机器学习方法打败的仿生人工智能，居然会在几十年后忽然起死回生，迎来爆发式发展。从2012年AlexNet的发表到今天，不过10年有余，卷积神经网络和相关硬件的发展可谓一日千里。笔者在自动驾驶视觉感知领域从业五年，深感这个领域教育资源的发展远远跟不上学术界和工业界的发展。该领域涉及的知识庞杂，既广又深：知识广度方面，从最优化理论，常用模型的特点，到使用C++编写高性能、高可靠性的程序和对各种神经网络加速芯片的了解，都属于自动驾驶感知算法工程师技术栈的覆盖范围；知识深度方面，工程师要对卷积神经网络的数学理论有足够深入的理解，而不应止步于调参的范围。也就是说，一个自动驾驶算法工程师，不但要有深厚的数学基础，掌握凸优化和统计学，还要熟悉高性能嵌入式软件的编写，这是一个横跨学术界和工业界的多面手职业。尤其是自动驾驶行业一日千里，很多工程师只能在工作中边干边学，一路走来可谓磕磕绊绊，如果能有一本书全面覆盖自动驾驶感知算法工程师的能力圈，那职业之路走起来就会顺畅很多。笔者就是出于这个目的，根据自己的职业经验和理论知识，编写…