《数据挖掘导论实验》课程教学大纲
一、课程基本信息
1. 课程编码:U12P51015
2. 课程名称(中/英文):数据挖掘导论实验/ Experiments for Introduction to Data Mining
3. 学时/学分:16学时/1学分
4. 实验项目数:4项
5. 先修课程:数据挖掘导论(U12M11104)
6. 开课单位:管理学院
7. 开课学期:春/秋
8. 课程类别:实践实训课程
9. 课程简介(中/英文):本课程是《数据挖掘导论》(U12M11104)的配套实验课。教学目的是使学生熟悉数据挖掘软件的基本操作,能够正确应用软件进行频繁模式挖掘、分类和聚类分析,从大量数据中获取有价值的信息, 提升数据分析与挖掘的实践能力。/This is the supporting experimental course for Introduction to Data Mining (U12M11104). This course aims to make students familiar with the fundamental operations of data mining software, correctly use the software for mining frequent patters, classify and cluster analysis from the massive data, and improve the practical ability of data analysis and mining.
二、教学目标
通过现有教学案例集的教学与数据挖掘实践,使学生正确理解数据挖掘知识和工具的适用条件,增强学生理论知识与现实问题的对应关系,加深对基础理论和方法的理解。通过自选课题的实践,使学生掌握从选题、数据收集、数据预处理、数据分析与挖掘到实践报告撰写等各个实践环节的要点,提升学生的自主创新能力和解决实际问题能力。
三、教学内容及教学要求
本课程包含实验教学16学时,分模仿学习和自选课题实践二个阶段进行。
1. 模仿学习(8学时)
以4-5名学生为一个团队,在现有数据挖掘教学实践案例集中选择案例进行数据挖掘和方案讨论,并提交电子版实践报告。具体教学内容和要求如下:
(1)模式识别 (2学时)
教学内容和要求:熟悉数据挖掘软件的基本操作,利用软件提供的算法对超市购物篮数据集进行模式挖掘和关联规则挖掘,1)分析商品之间的潜在联系;2)根据已经选购商品的情况,预测顾客还可能选购的商品; 3)基于上述分析,为超市在优化商品布局、设计捆绑销售方案提出建议意见。
(2)分类分析(2学时)
教学内容和要求:使用商业银行客户小额贷款记录作为数据集,1)建立模型进行信用度分类;2)利用分类模型评估客户信用;3)基于上述分析,为银行审批是否发放小额贷款提出建议。
(3)聚类分析(2学时)
教学内容和要求:保险机构面临欺诈风险,使用某医保机构索赔者的数据集,1)分析欺诈行为模式并得出疑似欺诈名单;2)建立欺诈行为的预测模型;3)基于上述分析,为保险机构审批医保报销费用提出建议。
(4)电子商务中的数据挖掘(2学时)
教学内容和要求:使用某淘宝护肤品及彩妆类卖家搜集的客户数据集,挖掘数据并回答以下问题:1)如果下次再做会员促销,究竟哪些是最有可能对促销信息作出反馈的会员?2)和在本店铺无重购行为的买家相比,在本店铺有重购行为的买家具有怎样的特征?
2. 自选课题(8学时)
各实践小组须完成自主选题、数据收集、数据分析与挖掘,并提交电子版实践报告。
四、 思政育人
1.目标:弘扬社会主义核心价值观,培养学生的爱国情怀、创新思维和解决实际问题的能力,将价值塑造、能力培养和知识传授有机融合,贯穿于实验教学的各个环节;
2.教学内容:实践选题聚焦于国家战略和社会需求问题,挖掘和提炼实验教学过程中所蕴含的思想政治教育元素,包括爱国情怀、创新意识、科学素养等,强化学生政治方向和思想引领;
3.教学方法:从教材、教师、教学、实验等入手,优化传统教学方法,将思政元素更好与专业知识相结合。
五、实验项目内容及学时分配
序号 |
项目名称 |
学时 |
实验类型 |
实验要求 |
1 |
模式识别 |
2 |
综合 |
必修 |
2 |
分类分析 |
2 |
综合 |
必修 |
3 |
聚类分析 |
2 |
综合 |
必修 |
4 |
电子商务中的数据挖掘 |
2 |
综合 |
必修 |
5 |
自选课题 |
8 |
创新 |
必修 |
注:实验类型分为验证、综合、设计、创新。实验要求分为必修、选修。
六、实验安全事项
本课程实验通过上机操作完成,实验安全级别高。学生应遵守计算机实验室安全操作规程,注意防火用电安全。
七、主要教材及教学参考书(包括实验指导书)
序号 |
名称 |
作者 |
译者 |
出版社 |
出版时间 |
1 |
大数据挖掘:系统方法与实例分析 |
周英、卓金武、卞月青 |
|
机械工业出版社 |
2016年 |
学术文献列表: |
无 |
八、实验报告要求
实验报告要求及格式说明:
1.报告题目
2.小组成员(姓名,学号,班级,专业,分工说明)
3.摘要
4.报告主体
1) 引言
2) 说明选题的背景、意义,描述所要研究分析的问题、要达到的目标,和研究的思路及内容,概括介绍数据收集、处理和挖掘的方法,以及调研实践的大体情况等。
3) 报告主体内容
a.根据内容适当划分章节(每章、每节要有小标题)。
b.数据来源要详实(标注数据来源)。
c.重点突出。主体报告主要是利用经过预处理的数据,结合实际情况进行分析研究,从不同的侧面、不同的层次描述清楚有关调查研究对象或问题的特征。然后运用恰当的数据挖掘技术,得出分析结果,对于所得结果的可靠性、正确性要从实际的角度和数据挖掘技术的角度两方面进行论证说明。最后提出对策或建议。
d.条理清晰、图文并茂、精炼易读。主报告的字数限制在4000-8000字。
4)结语(归纳总结所得到的主要结论以及有待于要进一步研究的问题等)
5.数据挖掘分析技术报告(附录)
1)原始数据:说明数据来源、指标的含义,提交数据的电子文档,和数据说明的电子文档(WORD文件);
2)数据挖掘:说明所采用的数据挖掘技术及其理由(妥当性),报告数据挖掘的详细结果和对结果的分析解释等。
6.参考文献:在正文中要对参考文献进行引用标注。
7.对本课程的意见或建议(附录)
8. 报告用纸:A4
9.提交日期及内容:在截止日期之前,每组提交书面实践报告1份,提交电子文档有:数据文档、数据说明文档、实践报告文档、数据挖掘技术报告、PPT发表文档。由各班负责人统一收交。
九、使用的主要仪器设备说明
序号 |
仪器设备名称 |
用途 |
1 |
计算设备 |
数据处理与数据挖掘 |
十、主要消耗材料
无。
十一、考核方式及成绩评定
成绩组成 |
考核/评价环节 |
分值(或百分比) |
考核/评价细则 |
教学目标 |
|
平时成绩 |
20% |
遵守实验纪律,按时出勤。 |
培养学生的纪律意识 |
模仿学习 |
40% |
每份实验报告10%,共4份 |
增强理论知识与现实问题的对应关系,加深对基础理论和方法的理解。 |
自主选题 |
40% |
一份实验报告 |
提升学生的自主创新能力和解决实际问题能力 |
十二、其他说明和注意事项
1.教学方法:上机操作和课堂讨论;
2.教学质量分析和改进:通过电子邮件和课程教学网络平台等,创建教学互动的课程网络平台,针对课程讲授中存在的问题与不足,不断修改与完善,确保课程质量标准的持续改进;
3.课程教学网站、教学参考网站:
https://learn.nwpu.edu.cn/app/coursehome.jsp?key=1wr4u07hhx2601k10gm1559034815784
4.基于学业规范的要求(道德行为规范、作业规范、实践规范等);学生应遵守西北工业大学道德行为规范、作业和实践规范。
课程负责人签名:钱艳俊
专家组评审意见:
专家组组长签名:
审核日期:
开课单位教学委员会审核意见:
教学委员会负责人签名:
审核日期: