反馈:化解不确定性的数字认知论
韩博
前言
反馈是什么
在2019年,曾经有朋友和我讨论,传统搜索引擎的地位会被采用相近模式的新竞争者取代吗?我告诉他,概率不大。互联网超级应用的核心优势在于海量的用户反馈数据。在搜索引擎里,有亿万用户正在通过搜索与内容产生互动,这些反馈数据和其他信号一起对内容质量和相关性进行排序。更重要的是,反馈数据的规模已经形成不断自我强化的正反馈效应,即用户搜索和点击越多,搜索引擎就越能准确地对内容进行排序,从而促使更多用户使用。如果不能用新一代的规则建立新的正反馈效应,产品很难在存量市场里实现“翻盘”,就像很多“搜索市场争夺战”在成熟的PC(个人计算机)搜索市场打响却并未改变竞争格局,而短视频、社交等其他赛道的应用产品内的搜索则很难使用户对其形成第一认知,并以此促进用户规模和反馈规模的正反馈循环。不仅搜索引擎如此,推荐引擎等互联网分发产品背后的运行逻辑也是如此,即大规模的用户在以海量、实时的浏览行为对内容、商品和服务的质量做出反馈。
互联网的变革,本质上是大规模用户行为的实时数字化反馈。普通数据价值有限,反馈数据才更有价值,用户的应用反馈是基于某种假设的反馈,其中包含需求的表达、质量的评估等关于世界如何运转的规律。但是,这需要算法的自学习能力、符合高价值数据分布和算法自学习机制的产品架构,才能充分释放海量反馈数据的潜在知识价值。
这一代AI技术也是基于反馈机制创新实现了突破。对于样本数据中隐藏的规律,算法会有一个初始预测假设。然后,复杂的高维计算会被简化为梯度反馈问题来优化求解。我们也可以简单理解为,预测值与真实值的偏差度量会被反馈给模型,进而向偏差最小的方向自动调整模型参数,并不断重复这个假设和反馈的循环以达到持续学习的效果。就像在练字的过程中,我们要从字帖与自己书写的字之间的偏差中找到改进方向。智能在并不追求细节完全精确的海量数据反馈下涌现,结合强大算力,神经网络计算模式在反馈机制…