1.一种数据挖掘课程教学实践系统,其特征在于,包括:由下至上依次连接的挖掘业务与数据层、理论方法层、应用与可视化层,其中,挖掘业务与数据层具有数据准备模块,用于根据课程教学内容设置相应的数据挖掘业务和获取所需数据;
理论方法层为各种挖掘流程框架、算法原理、使用范式和开发实现方法;
应用与可视化层通过人机界面连接理论方法层和挖掘业务与数据层,应用与可视化层具有核心功能开发模块,用于系统菜单设置、参数配置可视化、输入输出操作、调用理论方法层的存储内容对数据进行处理、数据挖掘业务的开发过程和结果可视化。
2.根据权利要求1所述的数据挖掘课程教学实践系统,其特征在于,挖掘业务与数据层获取的数据包括仿真数据、观测数据、实验设计所得数据,数据通过收集和从数据仓库、数据集市、数据库和数据文件这些数据源选取或者融合得到。
3.根据权利要求1所述的数据挖掘课程教学实践系统,其特征在于,核心功能开发模块包括依次连接的数据基本统计模块、数据预处理模块、挖掘分析模块、评价和解释模块以及开发实现模块,数据基本统计模块和数据预处理模块均连接数据准备模块,其中,数据基本统计模块用于对数据进行数量统计、计算最大值、最小值、中位数、均值和方差;
数据预处理模块用于对准备的数据进行数据清洗、转换、消减和离散的预处理;
挖掘分析模块用于对经过预处理的数据进行描述型挖掘或者预测型挖掘,描述型挖掘包括对数据的概述、聚类分析、关联分析和序列模式挖掘;预测型挖掘包括对数据的分类、预测、时间序列分析和异常检测;
评价和解释模块用于将开发过程和结果按照不同挖掘业务的相应指标进行评价说明和以图表的可视化形式进行解释;
开发实现模块用于供学生利用各种开发语言和平台、软件、算法专用包和自行开发程序包编译开发数据挖掘的相关功能。
4.根据权利要求3所述的数据挖掘课程教学实践系统,其特征在于,数据清洗包括冗余数据检测和删除、异常数据处理、噪声消除、缺失值处理、离群值筛选;
数据转换是指数据形式的变换处理,包括数据归一化;
数据消减包括参数降维、数据约简和压缩,数据约简包括数据抽样,数据压缩包括主成分分析;
数据离散是指数据的离散化处理。
5.根据权利要求3所述的数据挖掘课程教学实践系统,其特征在于,描述型挖掘所用到的模型为聚类模型,包括K-means模型、Agglomerative模型、DBSCAN模型、FCM模型、自组织映射神经网络、快速搜索密度峰值聚类模型;
预测型挖掘所用到的模型为分类模型或者预测模型,其中,分类模型包括逻辑回归模型、C4.5决策树、CART决策树、随机森林、贝叶斯网络、支持向量机、人工神经网络、深度置信网络;预测模型包括线性回归模型、随机森林、支持向量机、人工神经网络、深度置信网络。
6.根据权利要求3所述的数据挖掘课程教学实践系统,其特征在于,开发语言包括C语言、C++、Python;
平台包括Tensorflow、Pandas Caffe、Torch、Spark、MapReduce;
软件包括Orange、R software、Weka、KNIME、Rapidminer或者其他免费软件,以及Sisense、Oracledata mining、IBM Intelligent Miner、SAP Business Objects、SAS、SPSS modeler、Matlab或者其他商业软件。
7.根据权利要求3所述的数据挖掘课程教学实践系统,其特征在于,系统采用Matlab和Python联合开发,其中,系统的三层框架、应用与可视化层的核心功能和可视化采用Matlab实现。
8.一种基于权利要求1至权利要求7中任一项所述的数据挖掘课程教学实践系统的教学实践方法,其特征在于,步骤如下:S1、教师通过数据挖掘课程教学实践系统对课程教学内容进行示范性讲授,并针对不同专业和课程要求的学生布置相应的课程任务;
S2、基于数据挖掘课程教学实践系统和待完成的课程任务,学生通过人机界面设置数据准备模块的数据挖掘业务和获取所需数据,在核心功能开发模块上调用理论方法层的存储内容和配置参数来进行编译开发,得到可视化的开发过程和结果;
S3、教师根据系统上可视化的开发过程和结果对学生的实操进行指导分析。
9.根据权利要求8所述的教学实践方法,其特征在于,步骤S1中讲授的内容包括:介绍产品全生命周期的挖掘业务和数据;梳理挖掘的流程;梳理各个算法的关键原理和重要参数;在核心功能开发模块上进行开发编译的案例演示;
编译开发的过程包括在系统的开发实现模块上编写和修改代码、参数配置和调优、算法选择、调试以及封装,在评价和解释模块上查看可视化图表和数据指标解释。
10.根据权利要求9所述的教学实践方法,其特征在于,产品全生命周期数据类型包括:工程数据、企业资源环境数据、生产计划数据、制造结果数据等、交易和交互数据;产品全生命周期的挖掘业务包括:质量改进、生产管理、过程控制、客户管理、供应链优化;
对于机械设计或者制造工程专业的学生,数据准备模块上设置的数据挖掘业务和选取的数据偏向于质量改进、生产管理业务;
对于自动化、电子工程、机电专业的学生,数据准备模块上设置的数据挖掘业务和选取的数据偏向于数据驱动的过程控制、故障诊断与预测业务。