RE: 多谢楼上二位仁兄的捧场,继续ing。。
数据挖掘解决了什么问题? 一、直接问题 分类问题 根据事先定义好的类别,对数据进行分类。 例如:某银行根据用户信用记录,对信用卡、贷款等用户数据进行挖掘,区分 出信用风险分别为高、中、低的三类人群。 类似给你一个客户的相关信息,预测一下他未来一段时间是否会不再消费?信用度 是好/一般/差?是否会使用你的某个商品?将来会成为你的高/中/低价值的客户? 是否会响应你的某个促销活动?等等 估值问题 把分类的结果用连续数值的方式表示。 例如:某银行根据用户信用记录,对信用卡、贷款等用户数据进行挖掘,给每 个用户进行信用评分(0-1之间)。0.7以上的为高风险,0.3以下的为低风险。 预测问题 用分类或者估值的结果,估计将来会发生的情况。 例如:某银行根据用户信用卡消费记录,对用户信用卡消费记录进行挖掘,预 测用户下一年的信用卡消费估值,并提供更好的个性化服务 二、间接问题 关联问题 判断两件事情同时或者顺序发生的可能性。 例如:京东上,客户买完刻录光盘后,往往会购买光盘套。 中国鲜花网上,买鲜花的客户往往可能会买花瓶。 聚类问题 在没有预先定义类别的情况下,根据数据的自有特征进行分类。 例如:购买不同类别玩具的用户,聚类成为不同“亚文化商品”消费的人群 可视化和描述问题 对数据挖掘的结果描述。 例如:某B2C商城用户中,女性人群消费的增长趋势高于男性人群的增长趋势
小结:首先有正确的方法,其次才是正确的算法 数据挖掘往往是多种不同方法的算法在不同层次的组合 例:商城要针对老客户进行促销,首先要通过聚类区分客户群, 其次才是对应不同的客户群采取不同的预测促销策略。这就是 聚类和分类的综合应用。 该帖于 2010-4-26 9:06:00 被修改过 |