Calendar
Placard
Category
Latest Entries
Latest Comments
Last Messages
User Login
Links
Information
Search
Other


Analytical Customer Relationship Management
  HOUSE WARMING
 

英国人习惯迁新居后邀请一大帮朋友来家里开PARTY,称HOUSE WARMING,为房子“热身”。

没有香槟,也没有气球,苦瓜邀请大家到我的“新家”里踩一踩。里面将有苦瓜在英国工作和学习的经历,与大家分享。

地址是http://kugua.folo.cn

苦瓜要向曾经踩进这里的朋友致谢:点击是对博猪最大的恭维。
苦瓜要向曾经踩进这里的朋友致歉:本博更新太少,且很少回复留言。

苦瓜将首先对留言求助的朋友回EMAIL,我手上有资源的话苦瓜不会吝啬的。不过有涉及版权和机密的资料苦瓜只能说声对不起了。

搬新家后苦瓜将保持至少两周一次的更新率。
搬新家后苦瓜将保持至少两天一次的留言查看/回复率。

 

[ 阅读全文 | 回复 | 引用通告

  Post  by  最恨苦瓜 发表于 2007-3-10 21:11:00
  垃圾回复
 

某天苦瓜发现突然多了20多条留言和回复,心里窃喜:自己人气值是狂涨了么?

登陆后发现新的回复是清一色的“不错,呵呵”来自于同一个ID。

毫不犹豫,全选,删除。


……
[ 阅读全文 | 回复 | 引用通告

  Post  by  最恨苦瓜 发表于 2006-11-9 18:51:00
  Oversampling (过度取样) 
  回答一下Nirvana兄提的问题,原文地址(http://www.chinabi.net/blog/user1/105/archives/2006/928.html):

当数据集的目标变量值的分布不均匀的时候可以使用Oversampling帮助解决问题。

假设有20000条数据,客户流失率是1%,也就是200个流失客户。

[ 阅读全文 | 回复 | 引用通告

  Post  by  最恨苦瓜 发表于 2006-9-25 16:50:00
  关于数据挖掘的一些思考 
 

订阅了TTNN的新闻组N久,从中实在是学到很多东西。苦瓜也在上个月第一次参与到讨论中:

http://groups.google.com/group/ttnn/browse_frm/thread/4e0dabf04567062e/c0c3e57460b5e4a5#c0c3e57460b5e4a5

本来贴子是讨论工具的,到后来演变的方法论去了,思想的碰撞的确很有意思。。。


……
[ 阅读全文 | 回复 | 引用通告

  Post  by  最恨苦瓜 发表于 2006-9-12 22:48:21
  Academical Vs. Practical
 

刚刚结束第一年的评估,也算是顺利过关了。

 

昨天晚上参加一个Marketing Research 的 SEMINAR演讲一开始教授就提出一个问题:What are the major challenges for the marketing professionals? 对于这个问题答案有很多种,在座的Marketing专业的学生们答的大多是诸如creativityinformationbranding等等停留在教材里面的概念。

 

对此苦瓜非常激动,差点脱口而出:Low response rate and decreased customer loyalty! 这可是某人切身的经验啊!!!

 

不过苦瓜还是忍住了没喊,因为在这种学术型的演讲上可能并不合适。

 

最近苦瓜的思维已经开始由学院派转向实用派了:第一年的学术评估报告被导师批评就是因为报告里咨询者/商业化的味道太重。这不是个很好的兆头。

 

没办法,在公司,Manager们需要的只是一个能让人轻易理解并且依此作出判断的报告,他们并不在意分析是如何进行的。这就是决策者和决策支持者之间的区别,也是academicpractitioner之间的区别。

 

接下来来我要把两者平衡好。

[ 阅读全文 | 回复 | 引用通告

  Post  by  最恨苦瓜 发表于 2005-11-26 0:26:20
  Literature reviewing
  到导师们给我的Literature Reviewfeedback后的反省如下:

 

写作方面:


……
[ 阅读全文 | 回复 | 引用通告

  Post  by  最恨苦瓜 发表于 2005-5-19 6:12:09
  Accumulating thoughts
 

Regression vs. Decision Tree

Decision tree is easier to be understood and to be implemented. Whereas managers feel more comfortable with regression models as they can see the effect of the variables and the interactions between them. I feel the same way.


……
[ 阅读全文 | 回复 | 引用通告

  Post  by  最恨苦瓜 发表于 2005-5-13 5:33:45
  数据,数据,和数据 
 

周五交完一个长达30页的项目报告,长长地舒了一口气。

从项目开始到现在刚好五个星期,比起去年夏天做的第一个项目短了七个星期,不能不说是有很大的进步,经验就是这么积累下来的。

下星期开始马不停蹄又要开始重建去年那项目的模型,主要原因是上次说的MOSAIC码MISMATCH的问题。牵一发而动全身,之前的所有与此相关的分析都要推倒重来,数据质量问题的严重性由此可见一斑。

我不是做数据仓库的,所以这种问题我没时间精力更没能力去管。我所能做的,就是发现问题后报告。

问题是这样的方法会对自己很不利,我不想浪费时间在无谓的的分析上然后又推倒重来。


……
[ 阅读全文 | 回复 | 引用通告

  Post  by  最恨苦瓜 发表于 2005-4-24 18:36:53
  问题挖掘结果一:数据格式的一致性 
 

上周二开始从DATA WAREHOUSE里面提取数据,经过几次反复,本周一终于把想要的东西拿出来了,开始清理、整合和转换。然后昨天开始做初步数据分析,竟然发现数据集里面MOSAIC码与邮政编码的不完全对应,MATCH RATE只有40%不到。和主管一起研究了半饷,终于发现是MOSAIC MATCH TABLE里面的邮政编码格式与DATA WAREHOUSE MASTER TABLE里面的邮政编码不对应,只能重新再编译再MATCH过。


……
[ 阅读全文 | 回复 | 引用通告

  Post  by  最恨苦瓜 发表于 2005-3-25 7:51:43
  Experian与MOSAIC 
  先看两则关于Experian(益百利)进军国内的新闻:
http://news.sina.com.cn/o/2004-12-15/11364530371s.shtml
http://www.eobserver.com.cn/ReadNews.asp?NewsID=11938
两则新闻都提到了MOSAIC码,但是都没有说MOSAIC是什么东西,连其官方中文网页也没有,苦瓜只找到了一页含糊的英文介绍

既然如此,那么我就在WEBBER的产品(MOSAIC CN)推广会之前先谈谈英国的MOSAIC码吧。

要解释MOSAIC UK要先介绍UK的邮政编码。UK的邮政编码分为两部分,比如说M28 1LR。第一部分是城市区域信息,例子中M代表Manchester。第二部分是具体的街道信息。UK的POSTCODE分得很细,一般地说每个POSTCODE里面只有15户人家/单位,所以有了POSTCODE就能基本确定客户所处的区域。


……
[ 阅读全文 | 回复 | 引用通告

  Post  by  最恨苦瓜 发表于 2005-3-15 7:58:13
首页 上一页 下一页 尾页 页次:1/2页  10篇日志/页 转到:
Powered by Oblog.
友情连接: 净水器 爱之康 广告网 冲锋衣