|
| |
数据挖掘入门必读 [Nirvana2000 发表于 2007-10-19 16:10:00] | |
| 《数据挖掘概念与技术》

有人会以为现在才开始读这本书是有点晚了,这是因为现在书籍的出版速度太快了,五年前的书都成了古董了。也正是因为现在书籍出版速度过快,才使得经典的书籍所占的比例越来越小了。 首先,我的建议是,如果你不能十分确定有一本更好的书,使用这本书作为数据挖掘的入门书籍依然是一个不错的选择。优点是很多人都总结过的:结构清楚、内容丰富。缺点也十分明显,内容丰富确不详细,造成的结果就是知道了很多数据挖掘的知识,却没有几乎没有掌握一项应用的技术。所以说,这本书更加适合于初学者,或者对于有一定基础的人唤回记忆也有好处。 从写作风格来看,作者走的计算机学科的思维路线,对各项技术的描述都明显带有伪代码的风格,规范化却不够通俗。书中涉及的数学内容,如统计学或者概率等也都是直接给出了公式,没有更多的讲解。有人在评价《数据挖掘原理》(Principles of Data Mining,David Hand,Heikki Mannila,Padhraic Smyth) 这本书时对这种写作风格并不欣赏,而十分推荐从统计学等角度的写作方式。的确,以计算机科学的风格来描述数据挖掘这一交叉学科,少了很多的灵活性,显得有些死板;不过,毕竟数据挖掘最终还是要依赖于计算机才能实现,从这一角度进行论述对于初学者更加容易接受,缺少了的灵活性可以由其它书籍来弥补。 这本书的翻译个人感觉一般,建议看英文版,做到了翻译准确,没做到翻译优雅,在有的地方行文不是中国人的习惯。
《数据挖掘原理》

如果有人告诉你读一本书就会成为数据挖掘领域的大师,你一定不要相信,自古以来速成秘笈只会在小说里出现。如果有人向你推荐走进数据挖掘殿堂的必读作品,你就问他,“是不是《Principles of Data Mining》”,答案100%是肯定的,因为这本书是数据挖掘领域最负盛名的作品,早在本书刚诞生的时候,已经有读者形容它为“如果你读过本书并接受了它的思想,你将成为数据挖掘的专家”。 本书的中文版由机械工业出版社华章公司于4月份推出,由张银奎先生翻译,和其他翻译图书不一样的是,该书英文版的作者亲自为中文版撰写了绪言,高度赞赏了译者的科学态度的严谨。认为译者很好的理解了原书要表达的内容,领会了写作目标。并希望读者能在读书的过程中得到乐趣。 这不是一本入门书籍,并不是所有的读者都可以从本书中学到他所需要的知识,从内容难度上来讲,本书更适合有一定基础的人来读,特别是希望学习数据挖掘原理的大学高年级学生和低年级研究生。对于数据挖掘的研究者和实践者,本书也是不可多得的参考。在前言中,作者开篇明义,介绍了数据挖掘的定义:“从庞大的数据集或数据库中提炼有用信息的科学”。然后在正文中,以几乎完美的组织结构,介绍了数据挖掘的基础知识(第1~4章),数据挖掘的组件(第5~8章)和数据挖掘的算法(第9~14章)。 最具特色的是,本书是从统计学角度来介绍数据挖掘的专著。对于仅具有很少统计学知识,甚至连概率论和期望这样的基本概念都不太熟悉的读者,作者建议他先复习一下有关统计学的内容。对于熟悉统计学的读者,可能在书中发现很多似曾相识的内容。但和统计学不同,本书不但从数据挖掘的角度展示了很多传统统计学方面的内容,还包含许多统计学教材中不曾包含的有关算法和计算复杂度的内容。 本书讨论了用于数据挖掘的各种工具。不仅给出了如何设计这些工具的内幕,而且力图使读者在面临特定问题时,能够独立设计出合适的数据挖掘工具。非常体贴读者的是,在每章的最后,作者都对本章的内容做了很好的归纳,并给读者建议了很多参考读物。让读者更好的理解数据挖掘的思想,而不是单单理解书中的文字与实例。 作者认为,数据挖掘是一门令人兴奋的科学,虽然很多努力是没有回报的,但是一旦有一个令人兴奋的发现,所有的努力,将得到成倍的补偿。希望所有读到本书的人,都能得到有所得到,收获自己得努力补偿。 | |
|
|
|
| |
Re:数据挖掘入门必读 [jvan1983发表评论于2007-11-5 7:55:24] | |
本书很好 | |
|
|

<TTNN杂志列表> <Blog文章导航> <BI资源列表> |