这是一个关于数据挖掘技术与应用PPT的幻灯片,PPT内容完整共77页,文件大小为10MB,下载后可自行编辑修改,当前优惠价为28元,其他数据挖掘PPT可以在牛图文直接搜索下载。
数据获取技术飞速发展,数据库应用规模不断扩大,人们积累的数据越来越多。激增的数据背后隐藏着许多重要的信息,简单的查询、统计和报表已经无法对数据所包含的内在信息进行提取,满足不了人们的需求。
在透彻阐述事物变化机理基础上的建模,模型描述因变量与自变量间相互作用机理与变化规律(如万有引力定律,质量守恒定律等)。
从积累的数据中抽出规律性。基于分布的建模为统计学建模;基于自然数据为数据挖掘。把研究对象作为黑箱,仅研究输入-输出关系(反映系统论的观点)。
OLAP,一般会分析收入低的人往往会缴费不及时。通过分析,发现不及时缴钱的穷人占71%。
数据挖掘则不同,它自己去分析原因。原因可能是,家住在五环以外的人,不及时缴钱。这些结论对推进工作有很深的价值,比如在五环外作市场调研,发现需要建立更多的合作渠道以方便缴费。这是数据挖掘的价值。
现实世界的数据一般是脏的、不完整的和不一致的。数据预处理技术可以改进数据的质量,从而有助于提高其后的挖掘过程的精度和性能。由于高质量的决策必然依赖于高质量的数据,因此数据预处理是知识发现过程的重要步骤。
数据获取技术飞速发展,数据库应用规模不断扩大,人们积累的数据越来越多。激增的数据背后隐藏着许多重要的信息,简单的查询、统计和报表已经无法对数据所包含的内在信息进行提取,满足不了人们的需求。
在透彻阐述事物变化机理基础上的建模,模型描述因变量与自变量间相互作用机理与变化规律(如万有引力定律,质量守恒定律等)。
从积累的数据中抽出规律性。基于分布的建模为统计学建模;基于自然数据为数据挖掘。把研究对象作为黑箱,仅研究输入-输出关系(反映系统论的观点)。
OLAP,一般会分析收入低的人往往会缴费不及时。通过分析,发现不及时缴钱的穷人占71%。
数据挖掘则不同,它自己去分析原因。原因可能是,家住在五环以外的人,不及时缴钱。这些结论对推进工作有很深的价值,比如在五环外作市场调研,发现需要建立更多的合作渠道以方便缴费。这是数据挖掘的价值。
现实世界的数据一般是脏的、不完整的和不一致的。数据预处理技术可以改进数据的质量,从而有助于提高其后的挖掘过程的精度和性能。由于高质量的决策必然依赖于高质量的数据,因此数据预处理是知识发现过程的重要步骤。
提示:预览文档经过压缩,下载后原文档超清晰!有任何问题联系客服QQ:43570874 微信:niutuwen 备注:牛图文