前言
随着互联网技术的迅猛发展,数据的种类越来越多,体量越来越大,人们在海量的数据中找到自己真正需要的信息越发困难,导致信息过载和信息迷航问题的产生。解决信息过载和信息迷航问题,满足用户日益增长的个性化需求,非常有效的方案就是信息检索和信息过滤。个性化推荐作为一种重要的信息过滤技术,广泛应用于电子商务、社交服务、基于位置的服务等领域,成为当前解决上述问题的重要手段,能在提高互联网用户满意度和忠诚度的同时,极大提升产品的商业价值。
基于关联规则的推荐算法和协同过滤算法是个性化推荐中应用较为成功的两种技术,已经形成了完整的理论体系和成熟的应用框架。基于关联规则的推荐算法根据用户的历史记录,挖掘项目的相关性,来发现满足最小支持度和最小置信度的规则,完成对用户的个性化推荐。基于关联规则的推荐算法的优点是能发现更多的用户与项目关联关系和知识、可解释性强,但存在重复扫描数据集、时间效率低、规则难以提取、推荐质量难以保证的问题。协同过滤算法利用用户—项目评分矩阵,计算用户或项目的相似度,预测未知项目的评分,并将预测评分高的项目推荐给用户。协同过滤算法最大的优点是对推荐对象没有要求,该算法的应用领域广、干扰性小,数据越多,推荐准确度越高,但在数据稀疏性、冷启动等方面仍存在问题。
为了解决上述问题,本书对基于机器学习的个性化推荐算法及应用进行介绍,在梳理机器学习的相关理论以及个性化推荐算法的相关理论的基础上,提出如下 3种算法。
① 基于三维项集矩阵和向量的频繁项集挖掘算法。
② 融合惩罚因子和时间权重的协同过滤算法。
③ 基于用户属性和项目评分的协同过滤算法。
第7章介绍如何利用本书提出的相关理论和算法,设计并实现一个个性化图书推荐原型系统。
本书是作者多年研究与积累的成果,多个科研项目的支持使本书涉及的相关研究能够顺利开展,感谢国家自然科学基金项目(62202434)、河南省重点研发与推广专项(科技攻关)项目(232102210054、232102210033、222102210079)、河南省教育科学“十三五”规划项目(2020YB0149)、河南省高等学校重点科研项目(21A520047)、河南省杰出外籍科学家工作室项目(GZS2022011)、河南省高等教育教学改革研究与实践项目(2024SJGLX0149)、郑州市科技局创新团队项目(面向智能视频监控的云边端一体化装备研发与产业化)的大力支持。
本书介绍的相关成果受航空航天电子信息技术河南省协同创新中心资助。
在本书的写作过程中,郑州航空工业管理学院智能工程学院的孔先进、韩传福、周迅、李舶永等学生提供了大量的帮助,尤其是孔先进和韩传福,他们的研究为本书的完整性做出了贡献。此外还田阳、王一帆、刘永康、尚一卓等学生参与了本书的校正工作,在此一并表示感谢。
最后,在此致敬我的父亲,感谢他无私的爱,愿天堂没有病痛;感谢我的爱人,她非常善解人意,在我写作过程中一直陪伴我,照顾我;感谢我的女儿,她特别可爱,是我前进的动力。
虽然已经尽力做到字字斟酌、句句推敲,但由于本人水平有限,书中难免存在不妥之处,恳请广大读者批评指正。本书责任编辑的联系邮箱:maxueling@ptpress.com.cn。
刘超慧