上QQ阅读APP看书,第一时间看更新
1.2 问题与挑战
1.2.1 信息过载
19世纪之前信息资源相当匮乏,人们渴望能够快速地获得更多的信息,以便更好地做出决策。随着信息技术的兴起和发展,信息资源实现了高度共享,信息与知识的传播和获取变得极为高效,极大地方便了人们的工作和生活,但同时也带来了新的问题和挑战。网络用户规模的不断增长和网络应用数量的迅速增加,使得数据呈指数级增长。急剧增长的数据,远远超出了人们处理能力的范围,导致网络用户难以从海量的数据中找到真正对自己有用的信息。
解决信息过载问题的常用方法是使用搜索引擎和个性化推荐系统。搜索引擎在一定程度上缓解了信息过载,百度、谷歌等公司在商业上的成功也证明了这项技术的巨大价值,但它存在较大的局限性,如要求用户有明确的搜索需求,搜索结果缺乏个性化等。个性化推荐系统与搜索引擎不同,它不需要用户提供明确的检索信息,而是通过分析用户的行为,挖掘用户的潜在兴趣,预测用户可能感兴趣的信息,做到因人而异。尽管个性化推荐系统在个性化推荐方面取得了较大的成功,但在数据稀疏性(sparsity)、冷启动(cold start)、可扩展性(scalability)、隐私保护(privacy protect)等方面仍然存在问题,这些问题制约着推荐质量的进一步提升。
因此,为解决信息过载问题,本书探讨了基于机器学习(machine learning,ML)的个性化推荐方法,这对丰富个性化资源推荐、方法和手段具有一定现实意义。