热线电话15002155699
15901972296
15800902757
图文传真021-66773338
电子邮箱sale@cnspump.com

数据挖掘技术的定义

栏目:行业动态 · 发布日期:2019年12月17日 · 作者:中成泵业

信息和数据的交互是信息时代的特征和产物,随着电子商务的兴起与发展,人们已经认识到信息和数据的重要性,它既是全程工作运转的记录累积,也是驱动商业行为的动力之源。正如阿里巴巴、京东等公司的掌门人所夸耀的,目前他们的交易平台可以在用户模糊输入产品信息进行产品搜索时,自动匹配出买家和卖家的精准内容,从而使用户在数董庞大的产品中找到自己最想要的或相关度最高的产品。这种互联网技术的应用,正是基于数据挖掘 (Data Mining)技术而实现的。管道泵

1数据挖掘的定义

数据挖掘是指从大量的、不完全的、有噪声的、随机的、模糊的数据中提取隐含在其中的、人们事先不知道的但又具有潜在有用信息和知识的过程。随着信息技术的高速发展,人们积累的数据量急剧增长,动辄以TB(太字节,1TB=1024GB)计。从海量数据中提取有用的知识成为当务之急,数据挖掘就是为顺应这种需要应运而生并发展起来的数据处理技术,是数据库知识发现(Knowledge Discovery in Database)的关键步骤。磁力泵

数据挖掘功能一般可以分为两类:预测和描述。描述性挖掘功能用来描述数据库中数据的一般特性,而预测性挖掘功能是在现有数据上进行推断,以进行预测。数据挖掘是从大量数据中抽取知识的过程,鉴于数据本身的性质,那些符合推理和信息论、统计原理、遗传算法和神经网络的知识被首先运用到知识发现的算法设计中。化工泵

数据挖掘与传统意义上的统计学不同。统计学推断是由假设驱动的,即形成假设并在数据基础上进行验证;数据挖掘是由数据驱动的,即自动地从数据中提取模式和假设。数据挖掘的目标是提取可以容易转换成逻辑规则或可视化表示的定性模型,与传统的统计学相比,更加以人为本。自吸泵


上一资质:
下一资质: