新闻推荐系统中的推荐算法

如何有一个算法是从大数据的新闻列表中通过内容找到自己想要的新闻呢?
基于Hadoop的可以。求大神们给一些思路。
不要关系型数据库的。

google 协同过滤算法
google 新闻推荐

协同过滤算法http://www.cnblogs.com/zhangchaoyang/articles/2664366.html

一般做新闻推荐有三种推荐策略:第一是热门推荐,可以设置一个时间窗口,统计在过去一段时间所有新闻的点击量,把点击量最大的新闻推荐给用户;第二是基于内容的推荐,也可以叫做基于用户画像的推荐,意思就是根据用户的历史点击记录,总结出用户的喜好,也就是用户画像,计算每个新闻与用户画像的相似度,将相似度最高的新闻推荐给用户;第三就是协同过滤推荐,前面有同学已经回答了。一般公司的做法是融合这三种推荐策略进行推荐,大致过程是:首先是新闻召回,就是分别通过上述三中策略从海量新闻中召回用户最感兴趣的新闻,比如通过热门推荐选出100条,通过基于内容的推荐选出100条,通过协同顾虑选出100条,总共选出了300条被选新闻。然后是排序,可以用机器学习的方法,一般是用逻辑回归做点击率预估,将这300条新闻进行排序,按照排列顺序推荐给用户。