Python计算机视觉编程

7.627 评价豆瓣读书
阅读
¥29.99¥23.99
图灵计算机科技8折大促丨10月特价 了解详情
  • 导言
  • 目录
  • 作品信息

《python计算机视觉编程》是计算机视觉编程的权威实践指南,依赖python语言讲解了基础理论与算法,并通过大量示例细致分析了对象识别、基于内容的图像搜索、光学字符识别、光流法、跟踪、三维重建、立体成像、增强现实、姿态估计、全景创建、图像分割、降噪、图像分组等技术。另外,书中附带的练习还能让读者巩固并学会应用编程知识。

《python计算机视觉编程》适合的读者是:有一定编程与数学基础,想要了解计算机视觉的基本理论与算法的学生,以及计算机科学、信号处理、物理学、应用数学和统计学、神经生理学、认知科学等领域的研究人员和从业者。

Jan Erik Solem

瑞典隆德大学副教授(数学成像小组),Polar Rose公司创始人兼CTO,计算机视觉研究者,Python爱好者,技术图书作家,经常出席各种计算机视觉、图像分析、机器智能等国际会议并发表演讲。他主要关注3D重建、变分问题与优化、图像分割与识别、形状分析,有多年Python计算机视觉教学、研究和行业应用经验,技术博客为http://www.janeriksolem.net。另著有Computing with Python: An Introduction to Python for Science and Engineering一书。

  1. Python计算机视觉编程
  2. O'Reilly Media, Inc. 介绍
  3. 业界评论
  4. 推荐序
  5. 前言
  6. 先决条件和概述
  7. 读者须知
  8. 本书内容
  9. 各章概览
  10. 计算机视觉简介
  11. Python和NumPy
  12. 排版约定
  13. 使用代码示例
  14. Safari® Books Online
  15. 联系我们
  16. 致谢
  17. 第 1 章 基本的图像操作和处理
  18. 1.1 PIL:Python图像处理类库
  19. 1.1.1 转换图像格式
  20. 1.1.2 创建缩略图
  21. 1.1.3 复制和粘贴图像区域
  22. 1.1.4 调整尺寸和旋转
  23. 1.2 Matplotlib
  24. 1.2.1 绘制图像、点和线
  25. 1.2.2 图像轮廓和直方图
  26. 1.2.3 交互式标注
  27. 1.3  NumPy
  28. 1.3.1 图像数组表示
  29. 1.3.2 灰度变换
  30. 1.3.3 图像缩放
  31. 1.3.4 直方图均衡化
  32. 1.3.5 图像平均
  33. 1.3.6 图像的主成分分析(PCA)
  34. 1.3.7 使用 pickle 模块
  35. 1.4 SciPy
  36. 1.4.1 图像模糊
  37. 1.4.2 图像导数
  38. 1.4.3 形态学:对象计数
  39. 1.4.4 一些有用的 SciPy 模块
  40. 1.5 高级示例:图像去噪
  41. 练习
  42. 代码示例约定
  43. 第 2 章 局部图像描述子
  44. 2.1 Harris角点检测器
  45. 在图像间寻找对应点
  46. 2.2 SIFT(尺度不变特征变换)
  47. 2.2.1 兴趣点
  48. 2.2.2 描述子
  49. 2.2.3 检测兴趣点
  50. 2.2.4 匹配描述子
  51. 2.3 匹配地理标记图像
  52. 2.3.1 从Panoramio下载地理标记图像
  53. 2.3.2 使用局部描述子匹配
  54. 2.3.3 可视化连接的图像
  55. 练习
  56. 第 3 章 图像到图像的映射
  57. 3.1 单应性变换
  58. 3.1.1 直接线性变换算法
  59. 3.1.2 仿射变换
  60. 3.2 图像扭曲
  61. 3.2.1 图像中的图像
  62. 3.2.2 分段仿射扭曲
  63. 3.2.3 图像配准
  64. 3.3 创建全景图
  65. 3.3.1 RANSAC
  66. 3.3.2 稳健的单应性矩阵估计
  67. 3.3.3 拼接图像
  68. 练习
  69. 第 4 章 照相机模型与增强现实
  70. 4.1 针孔照相机模型
  71. 4.1.1 照相机矩阵
  72. 4.1.2 三维点的投影
  73. 4.1.3 照相机矩阵的分解
  74. 4.1.4 计算照相机中心
  75. 4.2 照相机标定
  76. 4.2.1 一个简单的标定方法
  77. 4.3 以平面和标记物进行姿态估计
  78. 4.4 增强现实
  79. 4.4.1 PyGame和PyOpenGL
  80. 4.4.2 从照相机矩阵到OpenGL格式
  81. 4.4.3 在图像中放置虚拟物体
  82. 4.4.4 综合集成
  83. 4.4.5 载入模型
  84. 练习
  85. 第 5 章 多视图几何
  86. 5.1 外极几何
  87. 5.1.1 一个简单的数据集
  88. 5.1.2 用 Matplotlib 绘制三维数据
  89. 5.1.3 计算F:八点法
  90. 5.1.4 外极点和外极线
  91. 5.2 照相机和三维结构的计算
  92. 5.2.1 三角剖分
  93. 5.2.2 由三维点计算照相机矩阵
  94. 5.2.3 由基础矩阵计算照相机矩阵
  95. 5.3 多视图重建
  96. 5.3.1 稳健估计基础矩阵
  97. 5.3.2 三维重建示例
  98. 5.3.3 多视图的扩展示例
  99. 5.4 立体图像
  100. 计算视差图
  101. 练习
  102. 第 6 章 图像聚类
  103. 6.1 K-means聚类
  104. 6.1.1  SciPy 聚类包
  105. 6.1.2 图像聚类
  106. 6.1.3 在主成分上可视化图像
  107. 6.1.4 像素聚类
  108. 6.2 层次聚类
  109. 图像聚类
  110. 6.3 谱聚类
  111. 练习
  112. 第 7 章 图像搜索
  113. 7.1 基于内容的图像检索
  114. 从文本挖掘中获取灵感——矢量空间模型
  115. 7.2 视觉单词
  116. 创建词汇
  117. 7.3 图像索引
  118. 7.3.1 建立数据库
  119. 7.3.2 添加图像
  120. 7.4 在数据库中搜索图像
  121. 7.4.1 利用索引获取候选图像
  122. 7.4.2 用一幅图像进行查询
  123. 7.4.3 确定对比基准并绘制结果
  124. 7.5 使用几何特性对结果排序
  125. 7.6 建立演示程序及Web应用
  126. 7.6.1 用CherryPy创建Web应用
  127. 7.6.2 图像搜索演示程序
  128. 练习
  129. 第 8 章 图像内容分类
  130. 8.1 K邻近分类法(KNN)
  131. 8.1.1 一个简单的二维示例
  132. 8.1.2 用稠密SIFT作为图像特征
  133. 8.1.3 图像分类:手势识别
  134. 8.2 贝叶斯分类器
  135. 用PCA降维
  136. 8.3 支持向量机
  137. 8.3.1 使用LibSVM
  138. 8.3.2 再论手势识别
  139. 8.4 光学字符识别
  140. 8.4.1 训练分类器
  141. 8.4.2 选取特征
  142. 8.4.3 多类支持向量机
  143. 8.4.4 提取单元格并识别字符
  144. 8.4.5 图像校正
  145. 练习
  146. 第 9 章 图像分割
  147. 9.1 图割(Graph Cut)
  148. 9.1.1 从图像创建图
  149. 9.1.2 用户交互式分割
  150. 9.2 利用聚类进行分割
  151. 9.3 变分法
  152. 练习
  153. 第 10 章 OpenCV
  154. 10.1 OpenCV的Python接口
  155. 10.2 OpenCV基础知识
  156. 10.2.1 读取和写入图像
  157. 10.2.2 颜色空间
  158. 10.2.3 显示图像及结果
  159. 10.3 处理视频
  160. 10.3.1 视频输入
  161. 10.3.2 将视频读取到 NumPy 数组中
  162. 10.4 跟踪
  163. 10.4.1 光流
  164. 10.4.2 Lucas-Kanade算法
  165. 10.5 更多示例
  166. 10.5.1 图像修复
  167. 10.5.2 利用分水岭变换进行分割
  168. 10.5.3 利用霍夫变换检测直线
  169. 练习
  170. 附录 A 安装软件包
  171. A.1  NumPy 和 SciPy
  172. A.1.1 Windows
  173. A.1.2 Mac OS X
  174. A.1.3 Linux
  175. A.2  Matplotlib
  176. A.3 PIL
  177. A.4 LibSVM
  178. A.5 OpenCV
  179. A.5.1 Windows 和 Unix
  180. A.5.2 Mac OS X
  181. A.5.3 Linux
  182. A.6 VLFeat
  183. A.7 PyGame
  184. A.8 PyOpenGL
  185. A.9 Pydot
  186. A.10 Python-graph
  187. A.11 Simplejson
  188. A.12 PySQLite
  189. A.13 CherryPy
  190. 附录 B 图像集
  191. B.1 Flickr
  192. B.2 Panoramio
  193. B.3 牛津大学视觉几何组
  194. B.4 肯塔基大学识别基准图像
  195. B.5 其他
  196. B.5.1 Prague Texture Segmentation Datagenerator与基准
  197. B.5.2 微软剑桥研究院Grab Cut数据集
  198. B.5.3 Caltech 101
  199. B.5.4 静态手势数据库
  200. B.5.5 Middlebury Stereo数据集
  201. 附录 C 图片来源
  202. C.1 来自Flickr的图像
  203. C.2 其他图像
  204. C.3 插图
  205. 参考文献
  206. 看完了

作者〔瑞典〕Jan Erik Solem

译者朱文涛袁勇

类别 图书 / 非虚构

出版社人民邮电出版社

出版日期

ISBN9787115352323

提供方图灵社区

标签计算机(1543)编程(462)限时特价(19319)机器学习(20)Python(25)计算机视觉(2)数字图像处理(3)

喜欢这本书的人也喜欢

来自豆瓣读书的评论1