对于Slope One算法,不熟悉的可以参照我之前的文章:Slope one:简单高效的推荐算法,已经被很多人证明有很好的推荐效果。
Slope one算法中有一个很重要的步骤是获取用户的打分数据,这个对很多网站都很费劲,很多用户都会听歌,但大多懒得去给歌曲打分,另外用户打分的时候会比较困惑,该打多少分呢?喜欢这首歌,是打4分还是5分呢?费劲。
我这里给出的是另外一种方法,做法是分析用户的听歌记录,一般网站都会记录这样的记录,统计一段时间内用户的听歌记录,我们得到下面格式的数据:
用户ID 歌曲ID 听歌次数
比如某个片段:
3389 9527 23
3389 9528 56
3306 1211 78
3306 9527 45
表示用户3389听歌曲9527的次数是23,听9528的次数是56,诸如此类。这样的数据当然不能直接用来做Slope one,需要把数据格式化到某个区间。我们分析一下用户听歌的行为,一般来说最喜欢的歌曲听的最多,越喜欢的歌曲听的越多,听的少的歌曲自然不那么喜欢。所以我们可以简单的模拟用户对歌曲的打分:
用户对歌曲的打分 = 用户听此歌曲的次数 / 用户听单首歌曲的最大次数
这样就可以把打分数据规整到0~1之间,还是上面的数据:
3389 9527 23/56
3389 9528 56/56
3306 1211 78/78
3306 9527 45/78
用户听的最多的歌曲打分是1,其他歌曲的打分等于听歌次数除以最大次数,我们就获得了用户的打分数据了。剩下的工作就是按照标准的Slope One流程走了,程序代码可以参考:http://code.google.com/p/openslopeone/
贴出几个实例大家看看,第一次做的结果,再去做的话应该比这个要好一些:
歌曲 |
推荐歌曲 |
南无大悲观世音菩萨 刘小茜 |
梵音大悲咒 齐豫 大悲咒 齐豫 观世音菩萨发愿偈.大悲咒 齐豫 大悲咒 邝美云 般若波罗蜜多心经 齐豫 大悲咒 齐豫 清净法身佛 齐豫 阿弥陀佛在心间 小娟 吉祥如意 凤凰传奇 |
好一朵茉莉花 朱昌耀 |
理查德-克莱德曼《梦中的婚礼》 合辑(欧美) 茉莉花(汉族民歌) 雷佳 好一朵茉莉花-笛子 合辑(内地) 最浪漫的事 赵咏华 沧海一声笑 罗文 how can i keep from singing Enya 生死不离 成龙 羞答答的玫瑰静悄悄地开 孟庭苇 |
过三关 吴卓羲 |
别怪她 吴卓羲 生命有一种绝对 五月天 春日(电视剧’春日’主题曲) 吴卓羲 爱玛仕小姐 吴卓羲 别人问起 吴卓羲 别怪她(Dance Remix) 吴卓羲 别怪她 – 吴卓羲 合辑 米老鼠 五月天 One Last Dance Craig David 新不了情 薛凯琪 |
Tips:
做Slope one之前最好过滤掉那些超热门的歌曲,因为很多人都听过了,会让这些歌曲经常出现在推荐结果里面,我的感觉是过滤掉Top100就可以了。
转载:
http://www.fuchaoqun.com/2009/02/slope-one-for-music-recommender-system/
分享到:
相关推荐
人工智能-推荐系统-音乐推荐-基于用户得分前100歌曲构造推荐系统 基于用户得分前100歌曲构造推荐系统 1.获取音乐足够多的用户id(这里只爬取了10w用户id) 2.根据10w用户id,爬取他们对应的网易云音乐给他们打分的...
人工智能-推荐系统-音乐推荐-基于Surprise推荐系统库,采用KNNBaseLine实现基于用户 的协同过滤歌曲推荐 人工智能-推荐系统-音乐推荐-基于Surprise推荐系统库,采用KNNBaseLine实现基于用户 的协同过滤歌曲推荐
基于Hadoop的音乐歌曲推荐管理系统毕业答辩.ppt
这是一个基于hadoop平台的推荐系统,里面代码完整,能很好的帮助对推荐系统感兴趣的开发人员和学生,共同学习
基于语义信息和行为信息的歌曲推荐。包括歌曲信息爬取、数据处理、word2vec歌曲向量表示、数据存储、歌曲推荐、we
基于Django+python的歌曲推荐系统源码+项目部署说明.zip 1、该资源内项目代码都是经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、...
基于语言义信息和行为信息的歌曲推荐。包括歌曲信息提取、数据处理、word2vec歌曲向量表、数据存储、歌曲推荐、网页可上.zip
python基于深度学习的音乐推荐方法研究系统(django) 深度学习;音乐推荐;Python;KNNBaseline;python;django;mysql; 本次的研究是基于使用自动编码器,通过与卷积神经网络相结合,以挖掘音频、歌词本身的非...
电信设备-基于移动终端的歌曲推荐方法与装置.zip
基于语义信息和行为信息的歌曲推荐。包括歌曲信息爬取、数据处理、word2vec歌曲向量表示、数据存储、歌曲推荐、web可视化展示。(Python、Java).zip
本系统主要通过隐式地收集用户对歌曲的播放,下载以及收藏行为记录,进而使用基于最近邻用户的协同过滤推荐算法为当前激活用户推荐歌曲; 对于有歌词信息的歌曲(英文),通过基于异构文本网络的词嵌入来计算歌曲之间的...
基于常识计算技术的歌曲推荐软件原型,杜昌,,本文介绍了人工智能领域的常识计算技术和麻省理工学院的Open Mind Common Sense项目。基于常识计算工具ConceptNet,设计了歌曲推荐软件原型�
该压缩文件包括,从零开始搭建音乐推荐系统 模型构建与算法调参(建模...基于movielens数据集的推荐预测 基于网易云音乐数据的推荐预测 word2vec 和Song2vec实现 冷启动与用户兴趣预测问题 基于Spark推荐系统实现
python毕业设计--基于Django的歌曲推荐系统和论坛源码+文档说明.zip该项目是个人高分毕业设计项目源码,已获导师指导认可通过,都经过严格调试,确保可以运行!放心下载使用。各文件功能 media/ 静态文件存放处,...
主要是用于大家对于大数据的基本处理,适合大学生本科毕设的参考。
本系统利用大数据技术,合理的为用户做出推荐,推荐的结果可靠程度很高,这就是我的优势所在,因为它和一般的推荐系统的推荐算法不太一样,我的推荐算法是利用Hadoop技术写的,我们可以利用Hadoop集群的高吞吐量,一...
本系统是基于大数据的音乐推荐系统,SSM、HTML、CSS等技术实现了音乐播发及音乐推荐平台,此平台具有用户登录、歌曲搜索、用户喜欢歌曲推荐、热门歌曲推荐等主要功能。通过音乐推荐系统,系统会根据用户喜好推荐歌曲...
基于语义信息和行为信息的歌曲推荐。包括歌曲信息爬取、数据处理、word2vec歌曲向量表示、数据存储、歌曲推荐、web可视化展示。(Python、Java). 【项目资源】: 包含前端、后端、移动开发、操作系统、人工智能、...
基于python+Django深度学习的音乐推荐方法研究系统源码数据库.zip
人工智能-深度学习-tensorflow