人人可懂的数据科学
- 用户画像:方法论与工程化解决方案本书从技术维度系统讲解了用户画像的方法论和一些常见的工程化解决方案。全书共分为9个章节。第一章 用户画像基础:讲述用户画像的一些基础概念、数据仓库架构、整个项目开发的流程、以及画像相关的表结构设计;第二章 数据指标体系:从用户属性、用户行为、用户消费、风险控制等四个维度详细罗列了常用到的用户标签,这些标签基本涵盖了大部分场景一半以上的标签需求。同时介绍了标签的规范化命名方式;第三章 标签数据存储:讲了为什么使用Hive、MySQL、hbase等数据库对标签数据进行存储,以及存储实现方式;第四章 标签数据开发:本章是全书的重点章节,讲述了统计类标签、规则类标签、挖掘类标签、流式计算类标签的开发。以及用户特征库、人群计算、标签权重计算、打通数据服务层等方面的开发。;第五章 开发性能调优:主要包括数据倾斜调优、开发中间表、读取小文件处理、redis缓存热数据等数据性能优化方面;第六章 作业流程调度:数据的ETL调度是数据开发中的重要内容,本章主要讲了如何使用当下热门的开源调度工具Airflow进行数据的调度及场景调度异常的排查工作;第七章 用户画像产品化:开发画像后的标签数据,如果只是“躺在”数据仓库中,并不能发挥更大的业务价值。只有将画像数据产品化后才能更方便业务方的使用。本章主要讲述了产品端的用户画像是什么样子?如何帮助业务人员进行分析,提供服务的;第八章 用户画像应用:用户画像的应用包括用户分析、商品分析、流量分析、push、短信、邮件等营销以及站内的个性化推荐等应用场景;第九章 实践案例详解:前面的八个章节主要从工程化开发的角度讲了如何从0到1搭建起用户画像系统及其应用场景,本章从完整的工业实践应用角度,通过两个实践案例帮助读者更好地理解画像系统是如何切入到应用场景中帮助提升工作效率、提高ROI的。 作者:赵宏田

- Python深度学习:基于PyTorch这是一本基于最新的Python和PyTorch版本的深度学习著作,旨在帮助读者低门槛进入深度学习领域,轻松速掌握深度学习的理论知识和实践方法,快速实现从入门到进阶的转变。 本书是多位人工智能技术专家和大数据技术专家多年工作经验的结晶,从工具使用、技术原理、算法设计、案例实现等多个维度对深度学习进行了系统的讲解。内容选择上,广泛涉猎、重点突出、注重实战;内容安排上,实例切入、由浅入深、循序渐进;表达形式上,深度抽象、化繁为简、用图说话。 本书共16章,分为三部分:第一部分(第1~4章)PyTorch基础,首先讲解了机器学习和数据科学中必然会用到的工具Numpy的使用,然后从多个角度讲解了Pytorch的必备基础知识,最后详细讲解了Pytorch的神经网络工具箱和数据处理工具箱。第二部分(第5~8章)深度学习基础,这部分从技术原理、算法设计、实践技巧等维度讲解了机器学习和深度学习的经典理理论、算法以及提升深度学习模型性能的多种技巧,涵盖视觉处理、NLP和生成式深度学习等主题。第三部分(第9~16章)深度学习实践,这部分从工程实践的角度讲解了深度学习的工程方法和在一些热门领域的实践方案,具体包括人脸识别、图像修复、图像增强、风格迁移、中英文互译、生成式对抗网络、对抗攻击、强化学习、深度强化学习等内容。 吴茂贵,资深大数据和人工智能技术专家,就职于中国外汇交易中心,在BI、数据挖掘与分析、数据仓库、机器学习等领域工作超过20年。在基于Spark、TensorFlow、PyTorch、Keras等的机器学习和深度学习方面有大量的工程实践实践。著有《Python深度学习:基于TensorFlow》《深度实践Spark机器学习》《自己动手做大数据系统》等著作。 郁明敏,资深商业分析师,从事互联网金融算法研究工作,专注于大数据、机器学习以及数据可视化的相关领域,擅长Python、Hadoop、Spark等技术,拥有丰富的实战经验。曾获“江苏省TI杯大学生电子竞技大赛”二等奖和“华为杯全国大学生数学建模大赛”二等奖。 杨本法,高级算法工程师,在流程优化、数据分析、数据挖掘等领域有10余年实战经验,熟悉Hadoop和Spark技术栈。有大量工程实践经验,做过的项目包括:推荐系统、销售预测系统、舆情监控系统、拣货系统、报表可视化、配送路线优化系统等。 李涛,资深AI技术工程师,对PyTorch、Caffe、TensorFlow等深度学习框架以及计算机视觉技术有深刻的理解和丰富的实践经验,曾经参与和主导过服务机器人、无人售后店、搜索排序等多个人工智能相关的项目。 张粤磊,资深大数据技术专家,飞谷云创始人,有10余年一线数据数据挖掘与分析实战经验。先后在咨询、金融、互联网行业担任大数据平台的技术负责人或架构师。

- 数据中台:让数据用起来这是一部系统讲解数据中台建设、管理与运营的著作,旨在帮助企业将数据转化为生产力,顺利实现数字化转型。本书由国内数据中台领域的领先企业数澜科技官方出品,几位联合创始人亲自执笔,7位作者都是资深的数据人,大部分作者来自原阿里巴巴数据中台团队。他们结合过去帮助百余家各行业头部企业建设数据中台的经验,系统总结了一套可落地的数据中台建设方法论。本书得到了包括阿里巴巴集团联合创始人在内的多位行业专家的高度评价和推荐。全书一共11章,从建设、管理、运营、安全等维度全方位地讲解了数据中台。 付登坡(花名:天湛),资深大数据专家,数澜科技联合创始人&地产事业部总经理。有10余年大数据领域从业经验,擅长数据建模、海量数据产品架构设计与实现。原阿里巴巴集团大数据专家,曾在阿里巴巴集团负责消费者数据标签体系、DMP平台等大数据项目设计与实施。2015年以创始人身份组建阿里巴巴集团“11维数据创新工作室”,探索数据创新与数据商业化。2016年6月离职,联合创办数澜科技,在数澜科技先后负责技术部、咨询服务部和地产事业部。 江敏(花名:江敏),资深大数据专家,数澜科技联合创始人&CTO。有10年大数据平台规划、数据安全交换使用、数据应用场景建设方面的实践经验。曾任职于阿里数据平台事业部、阿里云数据事业部,负责阿里数据能力及平台的行业客户赋能,并打造行业的数据共享交换,是ID-Mapping体系能力构建及服务化的核心参与者、数据交易模式的早期探索者。数澜科技联合创始人,负责管理公司产品技术团队,为客户输出构建和经营数据中台的能力。基于数据中台建设的实践经验,带领团队打造一站式数据应用基础设施数栖,并完成多家行业龙头客户基于数栖的数据中台建设。

- 阿里巴巴B2B电商算法实战本书是阿里巴巴CBU技术部(1688.com)深耕B2B电商15年的经验总结。阿里巴巴B2B在战略形态上经历了信息平台、交易平台和营销平台的升级迭代,本书聚焦营销平台商业形态背后的算法和技术能力,试图从技术和商业互为驱动的视角阐述技术如何赋能业务,并结合阿里巴巴集团在基础设域和算法创新上的沉淀,打造出智能B2B商业操作系统。具体内容方面,结合阿里巴巴B2B电商业务场景,深度解析算法对用户、商品、商家的精准刻画,围绕搜索、推荐、营销、直播、端智能等场景建模,还原商业视角的技术思考和落地方法。 阿里巴巴CBU技术部(1688.com),全球率先超过1亿用户的B类电商平台,自2003年诞生之初,就承载了“让天下没有难做的生意”的重要使命。在阿里巴巴“五新战略”下,作为阿里集团新制造和新零售的重要技术生力军,CBU技术团队15年来一直以技术之力赋能千万中小企业,沉淀了一系列极具B类特色的交易、支付、营销、采购、分销技术产品,促进B类全链路商业效率优化。在商业全球化的大形势下,CBU技术以大数据为原力、以算法为引擎,在企业采购与服务、企业分销通路建设、柔性供应链建设、数字营销、心智导购等领域不断进行横向联动、纵深探索,结合云计算、IOT智能技术、图形算法、深度网络、在线学习、运筹优化等尖端技术,助推中小企业向数字经济转型。

- 深度学习与图像识别:原理与实践本书是一本有关人工智能图像识别应用开发与实践指导类的教材,主要介绍图像处理应用项目开发的基本流程、图像识别处理应用项目关键技术。本书直击当今研究热点,选择有代表性的专题项目而且尽量避免复杂的数学推导,易于读者理解,专注于实战。详细介绍了numpy,knn,线性回归,逻辑回归,神经网络在图像识别上的应用,并为后一部分的深度学习做好铺垫。同时,针对每一个项目介绍项目的应用及意义,该项目的数据特征分析、识别系统设计、图像预处理技术、特征提取技术,以及识别方法等。书中实例程序的框架结构简单,代码简洁,读者可在数字图像处理技术的基础上进一步深化学习内容,提高实践应用能力和项目开发能力。 魏溪含,涂铭,张修鹏编著

- 小程序,巧运营小程序如今吸引了大量创业者和企业进入,如何玩转小程序、把握时代红利?本书给出了系统化的思维方式,全面介绍微信小程序运营方案和案例,包括3种行业运营方向、4种流量运营思路、5种平台化运营方案、6种微信生态联合运营优势,还有多达32招的各种攻略。是难得的一本以实战为中心、高效培训小程序运营者的作品,让懂小程序的人获得提升,让不懂小程序的人快速入门并实现弯道超车。 本书主要内容包括:第1章重点介绍微信小程序生态,其中包括小程序的发展现状与开发运营特点;第2章重点介绍小程序的能力与价值;第3章介绍行业运营方向,包括平台化、供应链、合作伙伴;第4章介绍流量运营思路,包括私域流量、活动、支付、朋友圈广告;第5章介绍商品运营推广,包括商品选择与露出、快捷上线-智能抓取、爆品、海报或桌面扫码等;第6章介绍平台化运营方案,包括会员、代销、分销、文化与资讯、实用工具;第7章介绍微信生态联合运营优势,包括公众号联动、群及KOL、朋友圈、好物圈、卡包、模板消息等。 熊普江,互联网技术精英俱乐部广州会长、云技术专家、资深架构师,首本小程序书籍《小程序,巧应用》作者。2012年-2018年任腾讯布道师、腾讯云高级总监,负责公司云技术、解决方案布道及技术架构评审等工作。曾任上市公司太平洋网络、视频公司PPTV高管。逾20年互联网从业背景,对大型网络架构规划与建设、海量用户平台规划与运营有丰富的经验。 于海军,智零网络创始人,中山大学工商管理硕士,国家认证电子商务设计师,原时尚电商平台梦芭莎首席技术官。拥有12年互联网技术和运营经验,新一代社交新零售倡导者,国内首批小程序探路者、微信小程序技术专家,成功策划和实施双汇、白沙溪、ABC、梦芭莎等新零售营销方案。

- 广告数据定量分析这是一部面向初级广告优化师、渠道运营人员的广告数据分析和效果优化的实战指南。数据分析功底的深浅,决定了广告优化师能力水平的高低。这本书一方面告诉读者成为一名厉害的广告优化师需要掌握的数据分析技能,以及如何快速掌握这些技能;一方面又为读者总结了SEM广告、信息流广告、应用商店广告数据的分析方法论和效果优化的方法,以及多广告推广渠道的统筹优化。书中提供大量真实数据案例,助你提升广告数据分析的理论深度和业务水平。 全书一共8章:第1—3章全面讲解了广告优化中的统计学,包括计学和广告数据定量分析的主要思想、统计学与广告优化的关系、广告数据分析中的统计学原理,以及如何用图表描述广告数据。第4—7章依次讲解了SEM广告的优化痛点以及相应的数据分析解决思路、信息流广告优化面临的难点以及针对性的数据分析方法论、应用商店如何做数据分析和效果优化、多广告推广渠道综合效果评估和统筹优化的问题。第8章对互联网广告这一商业生态进行梳理,为广告优化师的个人成长提供了有价值的参考建议。 齐云涧(Trunman Qi),资深广告优化师和数据分析专家,国内最早参与应用商店广告优化研究的专家之一,百度认证的资深营销顾问。曾任职于致维科技、量化派等细分行业知名企业,服务过百度、腾讯、阿里、字节跳动、美团、网易、携程、小米、领英、陌陌、58同城、启德教育等多家广告主,管理广告预算累计上亿元。参与翻译专业书籍《谷歌分析宝典》,撰写过多篇广告数据分析和效果优化的文章,在业内广泛传播。

- 数据化运营:系统方法与实践案例本书从方法、技术、业务、实践4个维度全面构建数据化运营的系统方法论,为数据化运营提供了接地气的、科学的指导。作者均在数据科学和数据化运营领域工作多年,本书从实践出发,以他们在实际工作中遇到的应用场景为切入点,通过“业务分析+代码实现”的方式接地气地讲解了如何才能做好数据化运营。其中,重点对搭建数据监控指标体系、数据分析、数据挖掘、ABtest、埋点策略、用户画像建模等常见数据运营方式做了详细的介绍。 作者:赵宏田、江丽萍、李宁

- 产品增长力:数据驱动的产品设计、运营和优化数据由来已久,有些行业很早以前就开始注重利用数据,而有些行业则起步较晚。不管怎样,数据正在展现出越来越强的力量,也越来越被人们所重视。因此,就算你不是互联网相关行业的从业者,数据也是你实现发展的有力工具之一。通过本书的介绍,你能更好地借助数据的力量,实现自身和组织的成功。 作者:李阳。

- 一本书读透Martech智慧营销这是一本从多维度讲解Martech以及如何借助Martech实现营销数字化转型的著作。 宏观层面,本书对Martech的行业现状、发展趋势、思想认知等做了前瞻性的分析;微观层面,对Martech的技术栈、核心产品、应用场景、实操方法等做了详尽的讲解。大多数知识点都围绕技术和业务双重维度展开,力求理论有深度、技术可落地、应用有实效。理论来自作者扎实的专业知识和多年的从业思考,实战经验则来自作者在广告、营销、产品、技术一线的深度耕耘。 吴俊 资深广告专家、数字营销专家和数字化转型顾问,有20余年相关行业的从业经验。在程序化广告领域有丰富的实战经验,曾负责推动并落实中国首个大型PDB广告投放项目,并荣获2014年中国国际广告节“长城奖”金奖。曾在深演智能为百胜中国、上海通用汽车、欧莱雅等近百家头部广告主服务,负责和推动了近千个程序化广告项目。Martech等数字化营销领域的实战派和布道者,在数字化转型领域也颇有建树,是深演智能、欢网科技、勾正数据、ADmobile、触脉咨询等多家企业的高级技术顾问。大型互联网系统架构师,中国人民大学新闻学院讲座嘉宾,虎啸数字商学院数字营销实战课程特聘专家讲师,“虎啸奖”评委会委员,著有畅销书《程序化广告实战》。 李焱 深演智能数据产品解决方案总监。20多年来,一直奋斗在与前沿技术密切相关的营销第一线,在数字化营销、智能化营销方面积累了丰富的实战经验。对运营商和互联网的大数据底层逻辑理解深刻,在金融、地产、快消品、零售等行业的客户业务方面拥有独到的洞察和理解。 党莎 阿里巴巴高级产品专家,在10余年的数据实践中,一直致力于“数据驱动企业运营、技术改变企业效率”的研究和实践,在客户运营平台、数字营销、经营分析、数据资产管理、PaaS产品、企业生产力管理云平台等方面拥有丰富的管理和实践经验。主导过电信、金融、快消品等行业的销售自动化、CRM、数字营销、社群营销、智能决策、运营管理、业务中台、数据中台的建设工作。

- 阿里云运维架构实践秘籍本书内容主要分为四大篇:云端基础篇、云端选项篇、云端安全篇、云端架构篇。总共十八个章节,所以我更喜欢把本书的内容称为云端实践秘籍:“降云十八掌”。本书内容主要为历时八年、累积云端五千余家一线互联网企业实践干货及经验,包含云端二十余款热门产品实践、五十余项常见开源热门技术实践,以及云端最热门技术:云端监控、云端DevOps/云端容器、云端智能运维等的最佳实践。内容风格上,以案例、场景、实践经验为主。杜绝一些无关痛痒的软件安装、参数配置等充篇幅的内容。减少理论,偏向干货。为您在风起“云”涌的时代,提供过关斩将的“尚方宝剑”。 乔锐杰,阿里云MVP,江湖人称“乔帮主”,阿里云资深架构师/技术专家。国内云端架构与运维实践开拓者,曾主导过电商、金融、政府、视频、游戏等领域千万级云端架构,在云端分布式集群架构、云端运维、云端安全等方面有着丰富的实战经验。和众多80后一样,从竞技类游戏“红警”、“星际争霸”开始接触互联网。2001年便参加“中美黑客大战”,从“盗号”、“网络攻击”进入计算机专业领域,以及后来开班授徒开始传授分享互联网安全攻防经验。曾担任黑客讲师/Java高级讲师/Python讲师/运维高级讲师/阿里云讲师,从事过安全、研发、高级运维、架构师等大半个互联网相关技术职位,现担任驻云科技运维总监兼阿里云架构师。
