当前位置: 首页 > MySQL数据库

如何用MySQL快速实现一个推荐算法

时间:2026-01-26 14:21:20

使用MySQL实现一个简单的推荐算法

推荐算法是会经常遇到的技术。主要解决的是问题是:如果你喜欢书 A,那么你可能会喜欢书 B。

本文我们使用 MySQL ,基于数据统计,拆解实现了一个简单的推荐算法。

首先,创建一个 用户喜欢的书数据表,所表示的是 user_id 喜欢 book_id。

CREATETABLEuser_likes(user_idINTNOTNULL,book_idVARCHAR(10)NOTNULL,PRIMARYKEY(user_id,book_id),UNIQUEKEYbook_id(book_id,user_id));CREATETABLEuser_likes_similar(user_idINTNOTNULL,liked_user_idINTNOTNULL,rankINTNOTNULL,KEYbook_id(user_id,liked_user_id));

插入 4 条测试数据

INSERTINTOuser_likesVALUES(1,'A'),(1,'B'),(1,'C');INSERTINTOuser_likesVALUES(2,'A'),(2,'B'),(2,'C'),(2,'D');INSERTINTOuser_likesVALUES(3,'X'),(3,'Y'),(3,'C'),(3,'Z');INSERTINTOuser_likesVALUES(4,'W'),(4,'Q'),(4,'C'),(4,'Z');

代表的含义为:用户 1 喜欢 A、B、C,用户 2 喜欢 A、B、C、D,用户 3 喜欢 X、Y、C、Z,用户 4 喜欢 W、Q、C、Z。

以为用户 1 计算推荐书籍为例,我们需要计算用户 1 和其他用户的相似度,然后根据相似度排序。

清空相似度数据表

DELETEFROMuser_likes_similarWHEREuser_id=1;

计算用户相似度数据表

INSERTINTOuser_likes_similarSELECT1ASuser_id,similar.user_idASliked_user_id,COUNT(*)ASrankFROMuser_likestargetJOINuser_likessimilarONtarget.book_id=similar.book_idANDtarget.user_id!=similar.user_idWHEREtarget.user_id=1GROUPBYsimilar.user_id;

可以看到查找到的相似度结果为

user_id,liked_user_id,rank1,2,21,3,11,4,1

然后根据相似度排序,取前 10 个,就是推荐的书籍了。

SELECTsimilar.book_id,SUM(user_likes_similar.rank)AStotal_rankFROMuser_likes_similarJOINuser_likessimilarONuser_likes_similar.liked_user_id=similar.user_idLEFTJOINuser_likestargetONtarget.user_id=1ANDtarget.book_id=similar.book_idWHEREuser_likes_similar.user_id=1ANDtarget.book_idISNULLGROUPBYsimilar.book_idORDERBYtotal_rankdescLIMIT10;


上一篇:如何下载安装MySQL
下一篇:MySQL客户端怎么连接服务器
mysql
  • 英特尔与 Vertiv 合作开发液冷 AI 处理器
  • 英特尔第五代 Xeon CPU 来了:详细信息和行业反应
  • 由于云计算放缓引发扩张担忧,甲骨文股价暴跌
  • Web开发状况报告详细介绍可组合架构的优点
  • 如何使用 PowerShell 的 Get-Date Cmdlet 创建时间戳
  • 美光在数据中心需求增长后给出了强有力的预测
  • 2027服务器市场价值将接近1960亿美元
  • 生成式人工智能的下一步是什么?
  • 分享在外部存储上安装Ubuntu的5种方法技巧
  • 全球数据中心发展的关键考虑因素
  • 英特尔与 Vertiv 合作开发液冷 AI 处理器

    英特尔第五代 Xeon CPU 来了:详细信息和行业反应

    由于云计算放缓引发扩张担忧,甲骨文股价暴跌

    Web开发状况报告详细介绍可组合架构的优点

    如何使用 PowerShell 的 Get-Date Cmdlet 创建时间戳

    美光在数据中心需求增长后给出了强有力的预测

    2027服务器市场价值将接近1960亿美元

    生成式人工智能的下一步是什么?

    分享在外部存储上安装Ubuntu的5种方法技巧

    全球数据中心发展的关键考虑因素