商业智能领域 --知识、技术、平台、发展、业界...  
  博客登陆
         欢迎加入
           BI Club-1 QQ群:2635140已满
           BI Club-2 QQ群:42350958
         -->ttnn BI View Entrance
 
                       一点声明
     鉴于这段时间有朋友投诉本blog上文章引用问题。现特此声明有部分文章为转帖,可能有原创和转帖漏掉备注的情况。这里若有您的原创文章并且是在未经您同意就引用并且您介意的情况,我在此表达诚挚歉意,请及时与我联系进行调整!
  我的分类(专题)
  最新日志
  最新评论
  留  言  板
  友情链接



  日志信息

文本挖掘简述  [Nirvana 发表于 2006-6-7 20:17:43]

 文本挖掘(Text Mining)是一个从非结构化文本信息中获取用户感兴趣或者有用的模式的过程,文本挖掘涵盖多种技术,包括信息抽取,信息检索,自然语言处理和数据挖掘技术。 它的主要用途是从原本未经使用的文本中提取出未知的知识,但是文本挖掘也是一项非常困难的工作,因为它必须处理那些本来就模糊而且非结构化的文本数据,所以它是一个多学科混杂的领域,涵盖了信息技术、文本分析、模式识别、统计学、数据可视化、数据库技术、机器学习以及数据挖掘等技术

文本挖掘是应用驱动的。它在商业智能、信息检索、生物信息处理等方面都有广泛的应用;例如,客户关系管理,自动邮件回复,垃圾邮件过滤,自动简历评审,搜索引擎等等。

文本挖掘可以通过下图有个大致理解。它由三部分组成:底层是文本挖掘的基础领域,包括机器学习、数理统计、自然语言处理;在此基础上是文本挖掘的基本技术,有五大类,包括文本信息抽取、文本分类、文本聚类、文本数据压缩、文本数据处理;在基本技术之上是两个主要应用领域,包括信息访问和知识发现,信息访问包括信息检索、信息浏览、信息过滤、信息报告,知识发现包括数据分析、数据预测。

  


阅读全文 | 回复(0) | 引用通告 | 编辑 

发表评论:

    大名:
    密码:
    主页:
    标题:

-->tnnBI杂志 

Powered by Oblog.