借鉴新加坡科技设计大学,探索课程间融合 ——以大数据专业《概率论与数理统计》课程为例
新工科背景下的应用型本科院校《概率论与数理统计》课程改革研究与实践

新工科背景下的应用型本科院校《概率论与数理统计》课程改革研究与实践一、新工科背景下的教育理念新工科教育理念强调跨学科的融合与整合,注重培养学生的创新精神和实践能力。
在教育理念上,应用型本科院校注重培养学生的工程实践能力和创新创业能力,注重学科之间的融合和交叉,着力培养学生的动手能力和解决实际问题的能力。
在这一教育理念指导下,课程设置和教学内容的设计都应该紧密结合工程实践和应用场景,更加注重学生的实际动手能力和问题解决能力的培养。
二、《概率论与数理统计》课程在应用型本科院校中的地位和作用《概率论与数理统计》是一门理工类专业必修的数学课程,它是一门介于理论和实践之间的课程。
在应用型本科院校中,学生大多来自不同的专业背景,对数学理论知识的接受和应用能力有所不同,因此《概率论与数理统计》课程在应用型本科院校中具有以下几个重要的作用和地位:2.培养学生的分析和思考能力《概率论与数理统计》课程要求学生具有较强的分析和思考能力。
在学习过程中,学生需要通过数学方法解决实际问题,需要进行推理和推断,培养了学生的逻辑分析和思考能力。
三、《概率论与数理统计》课程改革的必要性在新工科背景下的应用型本科院校中,《概率论与数理统计》课程改革显得尤为重要。
1.课程内容需要更贴合工程实践传统的《概率论与数理统计》课程内容大多偏重于理论和公式的推导,很难让学生将所学知识与工程实际结合起来。
在新工科背景下,应用型本科院校的学生更需要掌握具体的数学方法和技能,以解决实际工程中的问题。
2.课程模式需要更符合学生的学习需求传统的课堂教学模式往往比较死板,缺乏对学生实际需求的关注,学生的学习积极性和主动性不高。
在新工科背景下,需要通过改革的课程模式,培养学生的实际动手能力和解决问题的能力,激发学生的学习兴趣。
3.教学方法需要更贴近学生的实际需求传统的教学方法对学生的理论功利性教育,缺乏对学生实际需求的关注。
在新工科背景下,应用型本科院校的学生更需要掌握实际工程中所需要的数学知识和方法,因此需要改革教学方法,使之更贴近学生的实际需求。
新加坡科技设计大学工程教育改革的成功经验及其启示

第38卷 第4期高教研究与实践Research and Practice on Higher Education Vol.38 No.4 Dec.20192019年12月□大学改革新加坡科技设计大学工程教育改革的成功经验及其启示康雪丽[摘 要]世界范围内新一轮的科技革命和产业变革以及席卷全球的新经济的蓬勃发展对工程教育的改革和发展提出了新的挑战,因此推进工程教育改革,全面提升工程人才培养质量,成为世界各国亟待解决的问题。
新加坡科技设计大学其以设计为中心、平等合作、体验式教学以及跨学科教育等独特教育理念以及完善的工程教育体系,使其成立不久就受到高度评价,部分专业已在国际排名中崭露头角。
基于对新加坡科技设计大学工程教育改革的详细分析可以总结其成功经验:面向未来制定培养目标,跨学科的课程设置,灵活多样的教学模式以及教师队伍的国际化培养。
探索新加坡科技设计大学工程教育改革的成功经验,并结合我国国情和工程教育发展现状,可以为我国高等工程教育改革和发展提供借鉴。
[关键词]新加坡科技设计大学;高等教育;工程教育;跨学科课程[中图分类号]G649.1 [文章编号]JN00-65(2019)04-19-26[收稿日期] 2019-12-05[作者简介]康雪丽,首都师范大学教师教育学院学科教学思政2019级研究生一、新加坡科技设计大学的创立及教育(一)创建背景及历程新加坡科技设计大学(Singapore University of Technology and Design,简称SUTD)的成立受到经济发展的需要、政府的支持以及其他高校的响应三个因素的影响[1]。
第一,经济发展的需要。
随着全球经济一体化的深入发展,大力发展经济提高综合国力成为各国占据全球制高点的重要途径,同时新经济的发展对人才培养提出了新要求,因此对于因资源有限而主要通过大力发展教育来推动经济增长的新加坡来说,需要建立一所新型大学,制定新的人才培养目标和培养方案以提高高等教育的参与率和多样性,提高学生对未来经济发展的适应性,以及满足推动全国经济发展的需要。
新加坡国立大学统计学授课型研究生申请要求

新加坡国立大学统计学授课型研究生申请要求新加坡国立大学简介学校名称新加坡国立大学学校英文名称National University of Singapore学校位置新加坡2020 QS 世界排名11新加坡国立大学概述新加坡国立大学(National University ofSingapore),简称国大(NUS),是新加坡首屈一指的世界级顶尖大学。
该校是环太平洋大学联盟、亚洲大学联盟、亚太国际教育协会、国际研究型大学联盟、Universitas21等著名高校联盟的成员,也通过AACSB和EQUIS认证。
其在工程、生命科学及生物医学、社会科学及自然科学等领域的研究享有世界盛名。
新加坡国立大学前身为1905年成立的海峡殖民地与马来亚联邦政府医学院。
1912年,该校改名为爱德华七世医科学校。
1928年,莱佛士学院成立。
1949年,爱德华七世医学院与莱佛士学院合并为马来亚大学。
1955年,新加坡华人社团组织创立了南洋大学。
1962年,马来亚大学位于新加坡的校区独立为新加坡大学。
1980年,新加坡大学和南洋大学合并,校名定为新加坡国立大学。
统计学专业简介这个系提供统计学学士学位课程。
优等学生可以选择通过数据挖掘和多元统计分析模块专攻数据科学,或者通过精算统计和金融统计方法模块专攻金融和商业统计。
在这个项目中,学生将学习数据的收集、分析和可视化,如商业、交通、公共政策、医学和医疗。
统计学专业相关信息专业名称统计学专业英文名称Master of Science (Statistics)隶属学院理学院学制1年或2年语言要求托福85(写作22)雅思6GMAT/GRE 要求强烈建议GRE,无GRE会delay申请2019 Fall 申请时间12月1日-3月15日2020 Fall 申请时间12月1日-3月15日学费(当地货币)36550(20100)统计学课程内容序号课程中文名称课程英文名称1数据科学的统计基础Statistical Foundations of Data Science 2应用回归分析Applied Regression Analysis3产品设计和过程改进的实验设计Design of Experiments for Product Design and Process Improvements4实验设计2Experimental Design 25概率论II Probability Theory II6广义线性模型Generalized Linear Models 7非参数回归Nonparametric Regression 8时间序列数据分析Analysis of Time Series Data9用于质量控制和生产率改进的分析Analytics for Quality Control and Productivity Improvements10多元数据分析Multivariate Data Analysis11有限人口抽样Sampling From Finite Populations 12生存分析Survival Analysis13分类数据分析II Categorical Data Analysis II14高级概率论Advanced Probability Theory15遗传分析的统计方法Statistical Methods for Genetic Analysis16高级统计理论Advanced Statistical Theory17金融高级统计方法Advanced Statistical Methods in Finance序号课程中文名称课程英文名称18统计咨询Statistical Consulting19贝叶斯层次建模Bayesian Hierarchical Modelling 20网络统计分析Statistical Analysis of Networks 21空间统计Spatial Statistics* 新加坡国立大学统计学研究生申请要求由 Mastermate 收集并整理,如果发现疏漏,请以学校官网为准。
上海与新加坡中学概率统计教材的比较研究

( 该式为教材上写法) 事件和、积 互斥事件和的概率 新加坡教材多了“ 不互
互相 独 立 事件 积 的概 斥事 件和 的 概率’ ‘ ,‘ 、 条 蜜 件概 率” . 随机 变 量 的 态分 布 正 新加 坡 教材 多 了“ 二项 分布 分布” 泊松分布” 、“ . 概率 应 用 大量 实 际 应用 的概 率
率( 的估计值) 来应用, 频率也叫做经验概率” 然 ,
后在例题 中就将‘ 率” ‘ 率” 濒 和慨 混着使用了. 其 中的‘ 率” 常数” 概率” 概率估计值” 频 、“ 、“ 、“ 之
2相关系数与 回归方程系数的关系. ) 他们的 教材处理和我们一样, 也是越过了回归方程系数 的推导过程, 而直接给出系数的计算公式. 但是
间的关系, 虽然都有交待, 但交待的并不是很明 确( 有些重要概念和关 系仅在括号中出现)使很 ,
多 学 生 体 会 不 到 教 材 所 隐 含 的意 义 , 不 清 概 分 率 和频 率 之 间 的关 系, 不 清楚 “ 硬 币正 面朝 搞 抛
上” 的概率为 0 是精确值还是近似值. . 5 在新加坡教材的 H 教材中, 2 在用古典概率 解决了一个关于转 圆盘 的公平游戏后提出, 如果 圆盘不是公平的, 怎样确定相关概率?于是提出 做 10 0 次重 复试验, 统计 了事件 A出现了 2 次, 6
所不 同, 其中O水平系列课程的理论要求相对较 高, T 水平系列课程 比较偏向于应用. N( ) 学生可 以在课程进行过程中, 根据 自己的需要和能力在
各 系 列之 间转 移 .在 初 级 学 院 和 高 级 中 学 阶段 ,
大学 预备课程教育中心提供的、将于 2 1 年开 00
始实施的数学教学大纲 把数学分为 H1 、H2 、 H 三个 系列. 3 这些课程 内容是与大学科 目密切
融合思政教育与人工智能背景的概率论与数理统计课程设计

融合思政教育与人工智能背景的概率论与数理统计课程设计题目:融合思政教育与人工智能背景的概率论与数理统计课程设计一、课程背景介绍:随着人工智能的发展,它已经成为推动社会进步和经济发展的重要力量。
人工智能技术的应用已经渗透到各个领域,包括医疗、金融、交通、教育等。
然而,随着人工智能的广泛应用,我们也面临着一系列与人工智能相关的伦理、道德和社会问题。
因此,在人工智能领域,思政教育具有重要的作用。
概率论与数理统计是人工智能领域中重要的数学基础,它们对于人工智能算法的设计和分析具有重要意义。
二、课程目标:本课程旨在将思政教育与概率论和数理统计相结合,培养学生对于人工智能技术的正确理解和判断力,提高学生的道德、伦理意识和社会责任感。
同时,通过学习概率论与数理统计,使学生能够掌握使用数学方法进行数据分析和模型建立的基本能力。
三、课程内容和教学方法:1. 概率论基础- 概率的基本概念和性质- 随机变量和概率分布- 多维随机变量和联合概率分布2. 数理统计基础- 抽样与抽样分布- 参数估计与假设检验- 方差分析与回归分析3. 人工智能与思政教育- 人工智能的基本原理和应用领域- 人工智能的伦理、道德和社会问题- 人工智能的发展趋势和未来挑战4. 案例分析与讨论- 使用概率论和数理统计方法分析人工智能相关问题- 探讨人工智能的伦理、道德和社会影响教学方法采用理论讲授、案例分析、小组讨论等形式,注重理论与实践的结合。
通过引导学生分析和讨论真实的案例,培养学生的分析思维和解决问题的能力,同时深化学生对于人工智能与思政教育的理解。
四、教学评估:课程综合评估旨在考察学生对于概率论与数理统计知识的理解和掌握程度,以及对于人工智能与思政教育的理解和分析能力。
评估方式主要包括平时作业、小组讨论报告和期末考试。
平时作业用于考察学生对于概率论与数理统计知识的掌握和运用能力,小组讨论报告用于考察学生对于人工智能与思政教育的分析能力和团队合作能力,期末考试用于综合考察学生对整个课程的综合理解程度。
概率论与数理统计在大数据分析中的应用3篇

概率论与数理统计在大数据分析中的应用3篇概率论与数理统计在大数据分析中的应用1概率论与数理统计知识是数学知识体系中的重要分支,对日常生活有着广泛的理论指导。
基于此,首先介绍了概率论与数理统计的主要学科知识,其次对于概率论与数理统计知识在日常生活中的应用,从等概率问题、序列概率问题、几何概率模型问题、统计模型、常识性统计几个方面,进行具体的研究与分析,最后对概率与数理统计的应用做出展望。
概率论和数理统计是高等数学中的重要组成部分。
在自然界和人们的日常生活中,随机现象与随机事件非常普遍,概率论和数理统计是对某一事件可能结果的客观分析和理性判断。
只要我们细心研究就会发现,概率论和数理统计在日常生活中有着多方面的应用。
一、概率论与数理统计知识概率论(Probability Theory)是研究随机现象数量规律的数学分支,数理统计(Mathematics Statistics)是以概率论为基础,研究人类社会和自然界中的随机现象变化规律的一种数学模型[1]。
概率论与数理统计知识主要包含事件间关系的确定、概率的计算、概率计算模型、概率计算公式、相关性分析、参数估计、假设检验与回归分析、随机变量知识、中心极限定理等等[2]。
概率论与数理统计来源与生活,是对生活中的多种随机现象的逻辑分析与抽象总结。
在日常生活中,也能找到多种应用概率论与数理统计知识的具体体现。
二、概率论与数理统计在日常生活中的具体应用体现(一)概率论与数理统计在等概率事件中的应用等概率事件是指每一个随机事件发生的概率都是相同的,等概率问题是生活中常见的问题,小到我们玩狼人杀时的身份抽取、值日生分组中的抓阄分组,大到工厂的货物质检、食品安全部门的卫生抽检,都能应用到概率论与数理统计的相关知识。
例1:一个罐头生产厂将密封不严、颜色不达标、微生物超標的罐头列为次品。
该工厂每月生产十五批货。
一批货的次品率是1/20,数量很大,有几万个,现在随机取9个。
问9个里面次品数量大于2个(包括2个)的概率有多少?解:P(B1)代表9个产品中次品数量大于2的概率P(B2)代表9个里面次品数量小于1个(包括1个)的概率,也相当于只有一个次品的概率+没有次品的概率P(B2)=9_(1/20)_(19/20)8 +(19/20)9=10_(19/20)9=0.9288P(B1)=1-P(B2)=1-0.9288=0.0712在这次检验中,每个罐头是次品的概率都是相同的,我们从相识生活的经验可知,整批次上万个罐头逐一检验确定产品的次品率,在时间上、成本上都是不现实的。
新工科背景下的应用型本科院校《概率论与数理统计》课程改革研究与实践

新工科背景下的应用型本科院校《概率论与数理统计》课程改革研究与实践随着我国经济的快速发展和技术的飞速进步,对高素质应用型人才的需求日益增长。
而应用型本科院校作为培养应用型人才的重要阵地,日益受到社会的关注和重视。
在这一背景下,如何更好地推进《概率论与数理统计》课程的改革与实践,培养更适应社会需求的应用型人才,成为了摆在我们面前的一项重要课题。
本文将结合新工科背景,探讨《概率论与数理统计》课程改革的研究与实践。
新工科背景下,应用型本科院校的《概率论与数理统计》课程改革具有迫切的现实意义。
传统的《概率论与数理统计》课程往往以理论推导和数学证明为主,缺乏对实际问题的应用训练,学生在学完该课程后往往会出现“知其然而不知其所以然”的现象。
而新工科要求学生具备“工程实践能力、创新能力和团队协作能力”,这就要求我们在教学中更加突出对理论与实践的结合,培养学生解决实际问题的能力。
在新工科背景下,《概率论与数理统计》课程改革具有非常必要的现实意义。
二、《概率论与数理统计》课程改革的理念与目标在新工科背景下,《概率论与数理统计》课程改革应当以培养学生的应用能力为核心,以实际问题为导向,注重对学生综合素质的培养。
具体包括以下几个方面的目标:1. 强化实践应用:将《概率论与数理统计》课程与实际工程问题相结合,引导学生通过实际案例来理解概率论与数理统计的原理和方法,培养学生运用数理统计方法解决实际问题的能力。
2. 培养团队合作能力:注重培养学生的团队协作能力,通过小组合作、课程设计等方式锻炼学生的团队合作能力,使其在解决复杂问题时能够与他人合作、协调资源。
3. 提高创新能力:通过课程的改革与实践,激发学生的创新思维,培养他们在问题解决中的创新意识和创新能力。
4. 塑造工程人才形象:通过课程的改革,加强对学生工程伦理、工程逻辑思维等方面的培养,使学生具备工程实践能力和工程职业素养。
在新工科背景下,《概率论与数理统计》课程改革的实施策略是关键。
新工科背景下“概率论与数理统计”课程教改研究

随着社会的快速发展,以及大数据时代对数据分析等应用领域的需求不断增长,人们对高校培养新时代的科技人才提出了更多要求。
工科类高等院校在培养工程应用型人才的基础上,培养学生对于应用问题背后所蕴含的大量数据的分析能力也是一个亟待发展的方向。
“概率论与数理统计”(以下简称“概率统计”)是一门实用性极强的数学课程,在学习的每一个环节都需要紧扣其实际应用背景,这样才能更好地实现该课程的应用价值[1]。
在这样的背景下,本文分析“概率统计”课程教学改革的特点及现状,并结合笔者多年的教学经验对这些问题进行探讨。
一、工程教育背景下“概率统计”课程的重要性当前,国家正在实施“一带一路”“中国制造2025”、创新驱动发展、“互联网+”“网络强国”等建设,迫切需要培养大批新兴工程科技人才,我国的高等工程教育迎来历史性的发展机遇。
2020年底,教育部举行教育2020“收官”系列新闻发布会,在情况通报中,教育部高等教育司吴岩司长总结了“十三五”期间高等教育人才培养体系全面创新,如组织模式创新带动工程教育全方位深层次变革,课程建设水平全面提升。
一流课程“双万计划”遴选国家级一流本科课程5118门,涵盖了线上、线下、线上线下混合、虚拟仿真和社会实践五类“金课”,全面示范带动高校本科课程建设。
2020年7月19日,李克强总理考察国家自然科学基金委员会并主持召开座谈会。
总理在会上说,要提高学校数理化生等基础学科教育水平,培养更多基础研究人才,多渠道引进优秀人才,促进基础研究水平提高。
“概率统计”课程是工科类大学生必修的一门重要基础课程,具有极强的实际应用价值,在国家和行业的长远规划、重大项目研究和投融资等方面有非常广阔的应用空间。
通过强化“概率统计”等基础课程的教育水平,可以为国家和社会输送更多科学基础厚、工程能力强、综合素质高的优秀人才,推动国家和社会创新发展[2],因此,此基础课程的重要性是显而易见的。
二、工程教育背景下“概率统计”课程的主要特点及教学现状数学类公共基础课是大学教育中非常重要的一类基础课程体系,特别是在工科类高等院校中,“概率统计”课程是一门重要课程,且与很多后续的专业课程都有着紧密的联系。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
借鉴新加坡科技设计大学,探索课程间融合——以大数据专业《概率论与数理统计》课程为例
摘要:当下,传统课程教学设计思路很难适应当前应用型人才的培养的需要,
尤其是计算机类、大数据类[1]等实践性很强的专业,部分通识类课程在教学设计
中依旧采用传统的方法和思路,其内容很难和后续专业课程相衔接和融合,导致
课程知识的实际应用不足。
另外,我国高等教育教学设计方面,远落后于欧美大学,因此,以安徽信息工程学院为例,围绕大数据专业的人才培养需要,借鉴其
成功经验,探索基于多学科融合的课程教学改革,探索课程的主题知识树及课程
间的关联性。
关键词:概率论与数理统计,大数据,课程融合
一、面临的问题
(一)课程教学呈现孤岛,课程间衔接性不强。
对于本文所所涉及的概率论
与数理统计(以下简称“概率统计”)课程,为全校各专业都开设的一门通识课,
不仅涉及的面广,而且是许多专业后续课程的基础,是数学基础课程中应用性较
强的课程。
但是传统课程教学多注重知识讲授和理解,课程考核多以知识点掌握
为主,学生对其在后续专业学习中的作用不明确,课程结束后,课程也逐渐被遗忘。
(二)传统课程教学多以知识传授为主,学生对其和后续课程关联的认识不足。
从概率统计课程本身来说,它是一门研究随机现象的科学,它的思想方法与
学生以前接触过的任何一门学科均不相同,学生在学习过程中需要改变以往数学
课的思考方式,因此概率统计一直是学生认为比较困难的课程。
对于大数据专业
的学生来说,该门课程中很多知识点在数据分析和处理中得到非常大的应用,而
传统课程教学中却没有体现,导致学生在学习时获得感不强,认为课程学习对后
续专业学习没有作用。
(三)传统知识点较多,重点应用型较强的知识点不清晰。
由于传统的数学
教育属于知识传授型,比较注重课程各自的系统性、独立性和方法的应用,人为
地割裂了数学理论和数学方法与现实世界的联系,使得学生在学完该课后只知道
几个抽象分布,甚至最简单的数据处理方法都不会应用[2]。
二、国内外借鉴
我国十八届五中全会“十三五”规划提出,“实施国家大数据战略,推进数据资
源开放共享”,“运用大数据技术,提高经济运行信息及时性和准确性”,各个行业主管部门都出台了相关的大数据政策,如何利用大数据更好地为生产、生活服务,已经成为各个行业亟待解决的问题。
当前大数据应用型人才的培养尚处于初级阶
段[2],课程体系不成熟,人才培养过程存在一定阻力,目前很多高校开展人才培
养的探索,不管从课程设置上,还是从课程教学上,逐步培养学生的“大数据思维”,培养学生利用大数据思维[1]解决工程问题的能力,从而让学生适应当前大
数据的快速发展。
对于多学科课程间的渗透和融合,国外的很多高校也进行了实践,新加坡科技设计大学打破了“传统学科专业的壁垒”,构建了多学科的交叉复
合人才培养方案;英国伦敦大学学院将多数或所有工科学生聚在一起的多学科体验,让学生参与一系列多学科交叉符合的项目和模块课程。
三、《概率论与数理统计》课程教学设计
(一)重构传统教学内容设计
(1)大数据专业人才培养目标
以安徽信息工程学院数据科学与大数据技术专业为例,本专业致力于培养符
合国家战略及安徽省大数据产业发展需求,具备一定的数理基础及扎实的编程基础,以及大数据基础知识与技能,熟练掌握大数据采集、预处理、存储、处理、
分析、应用技术,能够运用大数据思维、模型和工具解决实际问题的高素质应用
型人才。
本专业学生毕业后可从事大数据挖掘、数据分析、研发、测试、运维和管理
等工作。
本专业的培养目标可以划分为以下4个子目标:
目标1:适应新经济发展需要,爱国进取,全面发展与健康个性和谐统一,
具有职业道德和社会责任感。
目标2:具备较好的数理基础,熟练掌握数据挖掘、分析、建模等原理及工
具使用,进而能对多种数据源进行数据挖掘、深度分析、数据建模及有效评估,
并能向行业提供有效的分析报告,为行业运营决策提供数据支持。
目标3:具有较强的数据思维、AI思维以及基本工程素养,具有智能软件开
发实践能力和技术创新能力,能够独立地完成大数据分析系统的开发与设计,能
够在设计、生产中担任组织管理角色。
目标4:具有团队精神、组织沟通能力和国际视野,能够继续学习,终身学
习的能力。
围绕着本专业人才培养的需要,本门课程教学以培养学生的大数据素养,让
学生懂得大数据的基本理念和基本处理方法。
(2)课程内容梳理,重构课程教学设计
从概率统计课程来说,主要内容为概率统计的基本概念、随机变量及其概率
分布、数字特征、大数定律与中心极限定理、统计量及其概率分布、参数估计和
假设检验、回归分析、方差分析、马尔科夫链等。
在课程的教学改革中,结合数
据科学与大数据技术专业的培养目标,围绕数据分析能力要求,结合课程知识点
在数据分析中的关联性,梳理课程知识内容及重难点,重构课程教学设计。
(二)融合大数据分析知识点,构建符合大数据专业的课程知识树
1、梳理课程知识点,构建课程知识树
2、概率论与数理统计知识的应用——以贝叶斯方法为例[3]
(1)贝叶斯定理知识介绍
在概率统计课程当中,贝叶斯定理是第一章中条件概率的相关知识,具体为:关于随机事件A和B的条件概率(或边缘概率)的定理。
其中P(A|B)是在B发生
的情况下A发生的可能性。
(2)贝叶斯方法的常见应用场景
实际数据分析与处理过程中,贝叶斯理论应用比较广泛,如:文本分类、垃
圾文本过滤、情感判别、多分类实时预测等,另外,在推荐系统中,朴素贝叶斯
和协同过滤(Collaborative Filtering)是比较好的使用形式,协同过滤是强相关性,
但是泛化能力略弱,朴素贝叶斯和协同过滤搭配,能增强推荐的覆盖度和效果。
(3)贝叶斯方法应用案例——检测SNS社区中不真实账号(分类)
下面围绕使用朴素贝叶斯分类解决实际问题的例子进行说明,如何通过课程
教学中使用贝叶斯理论完成数据分类。
问题描述:对于SNS社区来说,不真实账号(使用虚假身份或用户的小号)
是一个普遍存在的问题,作为SNS社区的运营商,希望可以检测出这些不真实账号,从而在一些运营分析报告中避免这些账号的干扰,亦可加强对SNS社区的了解与监管。
如果通过纯人工检测,需要耗费大量的人力,效率也十分低下,如能引入自动检测机制,必将大大提升工作效率。
简而言之,该类问题为将社区中所有账号在真实账号和不真实账号两个类别上进行分类,接下来将通过具体的案例分析流程,让学生熟悉贝叶斯方法在实际应用场景中的应用。
假设:C=0表示真实账号,C=1表示不真实账号。
1)确定特征属性及划分
区分真实账号与不真实账号的特征属性,在实际应用中,特征属性的数量是很多的,本案例选择三个特征属性:a1:日志数量/注册天数,a2:好友数量/注册天数,a3:是否使用真实头像。
在SNS社区中这三项都是可以直接从SNS系统数据库里得到或计算出来的。
下面给出划分:a1:{a<=0.05, 0.05<a<0.2, a>=0.2},a2:{a<=0.1, 0.1<a<0.8, a>=0.8},a3:{a=0(不是),a=1(是)}。
2)获取训练样本
通过运维人员曾经人工检测过的1万个账号作为训练样本(确保数据的可靠性)。
3)计算训练样本中每个类别的频率
用训练样本中真实账号和不真实账号数量分别除以一万,得到:
5)使用分类器进行鉴别
使用上面训练得到的分类器鉴别一个账号,这个账号使用非真实头像,日志数量与注册天数的比率为0.1,好友数与注册天数的比率为0.2。
通过计算,认定为真实头像的概率为0.00198,没有使用真实头像的概率为0.063,可以看到,虽然这个用户没有使用真实头像,但是通过分类器的鉴别,更倾向于将此账号归为真实账号。
这个例子也展示了如果特征属性充分多时,朴素贝叶斯分类对个别属性的抗干扰性较强。
(4)后续课程改革思路
以上通过数据分类案例,讲解贝叶斯理论在数据分类中的应用,因此后续课程改革中将梳理出课程的主要知识点构建主题知识树并设计相应的教学案例,主要围绕如下两点开展课程教学改革:
1)课程拟采用该模式进行教学实施,但是对数据分析的技术体系的认识依旧不足,后续将和专业课老师建立联系,逐步完善和优化课程教学内容设计;
2)目前虽然设计应用场景案例用于教学,但是在软件的使用上未对学生进行要求,对于分析结果的解释性,学生学习起来依旧存在困难,后续将围绕相关软件或工具,配合课程教学实施。
四、小结
在当前数据大爆炸的时代,大数据已经上升为国家战略,要求每个大学生都要领会一定的数据分析理念,懂得一定的数据分析技术,“概率论与数理统计”作为一门在大学中广泛开设且主要研究数据分析技术的课程,我们需要在其强化数据分析技术的讲解,强调“用”的培养,需要进一步探索如何开展课程间融合,结合专业课逐步完善课程教学设计。
参考文献
[1]赖巧玲,李梅,任丽洁.大数据背景下数理统计课程的教学改革与实践[J].科教文汇(中旬刊),2019,(01):66-68.
[2]李晓莎,武洪萍.基于大数据背景下应用技术型高校概率论与数理统计教学改革的研究与实践[J].中国石油大学胜利学院学报,2019,33(02):65-67.
[3]刘娟,胡桂武.人工智能思维利器——贝叶斯公式的教学探究[J].教育教学论
坛,2019,(38):141-143.。