Clementine关联分析曹慧荣20110426

合集下载

抗精神病药物个体差异的全基因组关联分析研究进展

抗精神病药物个体差异的全基因组关联分析研究进展

抗精神病药物个体差异的全基因组关联分析研究进展宋炜宸;禹顺英【期刊名称】《中国神经精神疾病杂志》【年(卷),期】2018(044)011【总页数】5页(P697-701)【关键词】精神分裂症;抗精神病药物;全基因组关联研究;遗传位点;副作用【作者】宋炜宸;禹顺英【作者单位】上海交通大学医学院附属精神卫生中心遗传研究室上海200030;上海交通大学医学院附属精神卫生中心遗传研究室上海200030【正文语种】中文【中图分类】R748.3抗精神病药物(antipsychosis,AP)治疗是目前精神分裂症(schizophrenia,SCZ)最主要的有效治疗方法,然而,SCZ患者对AP的反应有极大个体差异[1]。

越来越多证据表明,AP个体反应差异有着复杂的遗传背景,了解这些遗传背景可以帮助临床医生更好地给予患者个体化用药[2]。

全基因组关联研究(genome-wide association study,GWAS)是在全基因组水平上对大量单核苷酸多态性(single neucleotide polymorphism,SNP)和拷贝数变异(copy numbervariation,CNV)进行分型,进而分析这些遗传标记与某一表型关联的研究。

不同于候选基因研究(candidate gene study),GWAS不预设假设,因而可以发现许多新的、与表现型无已知生物学关联的易感位点,这使GWAS近年来在复杂疾病和复杂性状的遗传学基础研究中占有越来越重要地位。

AP疗效和不良反应的研究也采用了这一方法,并取得一些突破性结果,本文将对这一领域的研究进展进行综述。

1 GWAS与抗精神病药物疗效相关位点的研究针对抗精神病药物疗效相关位点的GWAS较为丰富,其中多中心项目往往同时研究多种药物,单中心研究则聚焦于单个药物。

研究结果在多巴胺通路相关基因上有较多重合,在各个药物特异性作用位点上也有显著结果,在其它基因上的结果则较为分散。

猥迭宫绦虫的线粒体coxl序列测定及种系发育关系分析

猥迭宫绦虫的线粒体coxl序列测定及种系发育关系分析

虫 可 通 过 伤 口 感 染 人 .人 食 入 未 煮 熟 的 蛇 或 青 蛙 肉 也 能 感 染 .引 起 裂 头 蚴 病 ,可 导 致 失 明 、肢 体 麻 痹 、甚 至 死 亡 圆 。 由 于 广 东 饮 食 文 化 中 较 为 普 遍 的 食 用 蛇 、 蛙 、 犬 、 猫 等 动 物 ,是 我 国 发 生 裂 头 蚴 病 高 频 地 区 。早 期 快 速 正确 鉴 定 欧 猬 迭 宫绦 虫 ,对 该 病 的 预 防 和控 制 具 有 重 要 意 义 。 传 统 的 寄生 虫种 类 鉴 定 以 形 态 学 特 征 为 主 要 依 据 ,有 很 大 的 局 限性 .对 虫 卵 或 幼 虫 就 无 法 用 形 态 学 鉴 定 进 行 有 效 的
猥 迭宫绦 虫的线粒体 c x o 1序列测 定 及种 系发育关系分析
李伟平 崔健 扬 ( 东省 东莞 市动物卫 生监督 所 长安 分所 5 3 4 ) 广 2 8 5
摘 要 :本 研 究应 用聚 合 酶 链 反 应 ( C . 方 法 扩 增 出分 离 自 P R) 广 州 的 猬 迭 宫 绦 虫 的 线 粒 体 细 胞 色 素 C氧 化 酶 第 1亚 基 ( o 1 基 因 部 分 序 列 (cx ) 并 进 行 序 列 分 析 。 应 用 cx ) po 1 , C US A 2 软 件 进 行 多 重 比 对 分 析 序 列 差 异 . 应 用 L T LW ME A 4 G . 件 构 建 种 系发 育 树 ,并 与 G n a k中 收 录 的 猬 0软 eBn
别 适 合 作 为 遗 传 学 研 究 的标 记 ,其 中细 胞 色 素 C氧 化 酶 第 1
亚 基 (o1 cx )基 因 已 被 广 泛 应 用 于研 究 猬 迭 宫 绦 虫 遗 传 变 异 的标 记 。本 研 究 应 用 P R方 法 扩 增 出采 自广 州 的猬 迭 宫 绦 虫 C 的 线 粒 体 细 胞 色 素 C氧 化 酶 第 1亚 基 (O 1 CX )基 因 部 分 序 列 (cx ) po 1 ,分 析 其 变 异 情 况 ,为 随后 猬 迭 宫 绦 虫 的分 类 、鉴 别 诊 断 及 裂 头蚴 病 的 防治 等 更 深入 的研 究 奠 定 基 础 。

实验二 Clementine12购物篮分析(关联规则)

实验二  Clementine12购物篮分析(关联规则)

实验二Clementine12购物篮分析(关联规则)一、[实验目的]设计关联规则分析模型,通过模型演示如何对购物篮分析,并根据细分结果对采取不同的营销策略。

体验以数据驱动的模型计算给科学决策带来的先进性。

二、[知识要点]1、购物蓝分析概念;2、管来呢规则算法原理;3、购物蓝分析工具;4、Clementine12.0关联规则分析流程。

三、[实验要求和内容]1、初步了解使用工作流的方式构建分析模型;2、理解智能数据分析流程,主要是CRISP-DM工业标准流程;3、理解关联规则模型原理;4、设计关联规则分流;5、运行该流,并将结果可视化展示;6、得出模型分析结论7、运行结果进行相关营销策略设计。

四、[实验条件]Clementine12.0挖掘软件。

五、[实验步骤]1、启动Clementine12.0软件;2、在工作区设计管来呢规则挖掘流;3、执行模型,分析计算结果;4、撰写实验报告。

六、[思考与练习]1、为什么要进行关联规则分析?它是如何支持客户营销的?实验内容与步骤一、前言“啤酒与尿布”的故事是营销届的神话,“啤酒”和“尿布”两个看上去没有关系的商品摆放在一起进行销售、并获得了很好的销售收益,这种现象就是卖场中商品之间的关联性,研究“啤酒与尿布”关联的方法就是购物篮分析,购物篮分析曾经是沃尔玛秘而不宣的独门武器,购物篮分析可以帮助我们在门店的销售过程中找到具有关联关系的商品,并以此获得销售收益的增长!“啤酒与尿布”的故事产生于20世纪90年代的美国沃尔玛超市中,沃尔玛的超市管理人员分析销售数据时发现了一个令人难于理解的现象:在某些特定的情况下,“啤酒”与“尿布”两件看上去毫无关系的商品会经常出现在同一个购物篮中,这种独特的销售现象引起了管理人员的注意,经过后续调查发现,这种现象出现在年轻的父亲身上。

在美国有婴儿的家庭中,一般是母亲在家中照看婴儿,年轻的父亲前去超市购买尿布。

父亲在购买尿布的同时,往往会顺便为自己购买啤酒,这样就会出现啤酒与尿布这两件看上去不相干的商品经常会出现在同一个购物篮的现象。

基于SPSS Clementine的关联规则分析在中医药数据挖掘中的应用优势和局限

基于SPSS Clementine的关联规则分析在中医药数据挖掘中的应用优势和局限

中医学 是 一 门对 临 床经 验 有较 高 要求 的学 科 ,


它包 含 了决 策 树 、 支 持 向量 机 、 贝 叶斯 网络 等分
其本身具有整体性 、 系统性 、 复杂性等特点。 名老中
医作 为 中医药 学 术 的带 头 人 , 其学 术 思 想 和临 证 经 验 是 中 医学 的重 要 组成 部 分 , 也 是不 可 多得 的宝 贵
Vo l _39 No .6 1 2 .2 01 6
基于 S P S S C l e me n t i n e的关联规则分析在 中医药数 据挖掘 中的 应 用 优 势 和 局 限
王玲 玲 ,付 桃 芳 ,杜 俊 英 , 梁 宜 1 , 2 A ,方剑 乔
( 1 .浙江 中医药大学第三临床医学院 ,浙江 杭州 3 1 0 0 5 3 ;2 .浙江 中医药大学附属第三 医院,浙江 杭州 3 1 0 0 0 5 )
基金项 目:全国名老中医药专 家传承工作室建设项 目( 国中医药人教发【 2 0 1 3 】 4 7号 ) ; 浙江省名老中医专 家传承工作室 建设项 目( GZ S 2 0 1 2 0 1 4) ; 浙江省 中医药科技计 划项 目( 2 0 1 4 Z A0 5 9 )
收 稿 日期 :2 0 1 6 — 0 9 — 2 5
摘要 :C l e m e n t i n e 是数据挖掘 的常用工具之一 , 在如今 中医学领 域数据挖掘方 面也 运用相 当广泛 , 其 中它 的关 联规则分析也是应用最多的挖掘方法之一 。 本文综述了 目前 S P S S C l e m e n t i n e 关联规则分析方法在 中医药研究 中运
用的概况 , 主要是对名老 中医经验传承 、 中医病机 、 症 状与 中药 、 医案研究 和针 灸处 方研究等方 面的关联规 律挖掘 ,

巧用Clementine简化数据处理

巧用Clementine简化数据处理

巧用Clementine简化数据处理
郑慧霞
【期刊名称】《中华医学图书情报杂志》
【年(卷),期】2011(20)4
【摘要】用著名的数据挖掘工具Clementine处理数据有些大材小用,但它的确比Excel更易用、更高效,处理数据时不需要翻看复杂的编程手册、在Excel表中拉滚动条、选择各种函数等.以国家科技文献中心(NSTL)签到数据上传处理为研究实例,涉及数据查重、规范、筛选、映射、比对、频次统计等各种常见任务,介绍了如何根据不同处理需求定制相应Clementine数据流和Clementine工具在海量数据处理中的优势.
【总页数】4页(P59-62)
【作者】郑慧霞
【作者单位】中国协和医科大学图书馆网络技术服务部,北京,100005
【正文语种】中文
【中图分类】G254.362
【相关文献】
1.回弹法检测混凝土强度的数据处理流程简化分析 [J], 许周;张驰
2.逆向工程数据处理的简化方法 [J], 幸鑫
3.利用Origin8.5软件简化磁滞回线数据处理 [J], 李育洁;何伟岩
4.巧用Excel简化大学物理实验中的数据处理 [J], 董泽民
5.巧用“补数”简化珠心算加减法——对简化智障学生珠心算学习方法的一点思考[J], 展敏敏
因版权原因,仅展示原文概要,查看原文内容请购买。

三峡库区青蒿花蕾青蒿素含量的灰色关联分析

三峡库区青蒿花蕾青蒿素含量的灰色关联分析

三 峡库 区青 蒿 花 蕾 青 蒿素 含 量 的灰 色关联 分 析
陈俊 意 , 朱照静 , 杨 治 国, 黄 晓丽 , 曾祥 琼 , 黄先元 , 彭 坤 , 谭 丽, 张如超 , 黄 晓可
( 重庆市医药 高等专科学校 , 重庆 4 0 0 0 3 0 )

要: 在 自然生长条件 下, 选取 三峡库 区3 6个 不同来源地的野生青 蒿作为研究对象, 对影响青 蒿花蕾青蒿素含量 相关 因素进 行
灰色关联分析。结果表明, 土壤碱解 N和 P含 量是 影响三峡库 区野生青蒿 的青蒿 素含 量的最主要最 明显 的因素。三峡库 区野生 膏蒿花蕾青蒿素含 量主要受土壤 营养状况影响。 关键 词 : 青蒿 ; 灰色关联分析; 青蒿素含量 ; 三峡库 区 中图分类号 : ¥ 5 6 7 ; Q 5 0 3 文献标识码 : A
寻 找 高青 蒿素 含量 的青 蒿 野生 材 料 , 经 过 不 断 的摸
索完善 , 有 了一定成果 . 随着研究的深入 , 三峡库区 野 生 青蒿 中青 蒿素 含 量 参 差 不齐 , 许 多野 生 青蒿 的
从野 生青 蒿 中提取 活性 成分青 蒿素 的研究 用 于
抗疟 , 已经 取得 辉煌 进展 .挖 掘 三峡 库 区野 生青 蒿 ,
的各个 因素 之间都 存 在 着一 定 的相 关关 系 , 因 而较 难 对三 峡库 区野生 青蒿青 蒿素 含量 的影 响 因素 做 出 简 单 明确 的概 括 , 本 调查利 用灰 色关 联分 析方 法 , 将
Gr e y Re l a t i o n Ana l y s i s o f Ar t e mi s i n i n e Co n t e n t o f Ar t e mi s i a e a n ni e Va r i e t i e s i n Th r e e Go r g e s Re s e r v o i r Ar e a

蒺藜苜蓿耐酸铝性状的全基因组关联分析

蒺藜苜蓿耐酸铝性状的全基因组关联分析
( 黑 龙 江省 分 子细 胞 遗 传 与遗传 育种 重 点 实 验 室 哈 尔 滨 师 范 大学 生 命 科 学 与 技 术 学 院 , 黑龙江 哈尔滨 1 5 0 0 2 5 )
摘要 : 铝 毒 害 是 酸 性 土 壤 耕 种 的 主 要 限 制 因素 , 每 年造 成 大 量作 物 减 产 。蒺 藜 苜 蓿 是 紫 花 苜 蓿 的 一 年 生 近 缘 种 , 广
胁迫 的 耐性 。那么 , 如何 发掘 苜蓿 中耐酸 铝 的基 因资源成 为 当前 面临 的亟需 解决 问题 。
随 着新一 代测 序技 术 的发 展 , 测 序 的成本 迅速 降低 , 而效 率 快速 提 升 , 研 究 人 员启 动 了各 种 生 物 的重 测 序 工 作 和单倍 型 计 划 , 如 人 类 、 水稻 ( O r y z a s a t i v a) ] 、 玉米 ( Z e a ma y s ) _ l ] 、 拟 南芥 ( Ar a b i d o p s i s t k a l i 一
授粉 、 易 于操 作 等优点 , 成 为豆科 , 特别 是研 究苜 蓿属 植物 的模 式植 物 。蒺藜 苜 蓿在 长期 的 自然选 择 过程 中 , 适应 了多样 化 的生态 环境 , 形成 多样化 的 表型 , 如 对 酸铝胁 迫 的耐性 呈现 出多 样化 。S l e d g e等 通过对 蒺藜 苜蓿
的耐 酸铝性 状 鉴定 , 筛 选 出一些 耐酸铝 胁 迫 的蒺 藜苜 蓿种 质资 源 。近年来 的分 子遗 传学 研究 表 明 , 蒺藜 苜 蓿和 紫 花苜 蓿 的基 因组高度 相似 , 蒺藜 苜蓿 中的基 因资源 可 以直 接应 用到 紫花 苜蓿 的遗 传改 良工作 。因此 , 耐 酸铝蒺 藜苜 蓿 中优异 基 因资源 可 以直接 通 过遗传 或 者基 因工程 的方 法 导 入到 紫 花苜 蓿 中 , 改 良栽培 的紫 花苜 蓿 对 酸铝

麦克利兰的需求理论

麦克利兰的需求理论

麦克利兰的需求理论麦克利兰的需求理论(McClelland’s Need Theory)是一种人格心理学理论,它认为,个体的行为受到其认为有必要的3种需要的驱动:成功/安全需要(Need for Achievement ,N-Ach),亲属/联系需要(Need for Affiliation ,N-Aff)和权力/影响力需要(Need for Power ,N-Pow)。

这3种需要的有强有弱,麦克利兰认为,每个人在这3个需要中都占有不同的比重。

麦克利兰的需求理论是重要的心理学理论,它受到了无数专业人士和大众的热捧。

基于这一理论,研究批判家不仅仅关注于一个人如何成长和发展,还关注于一个人在不同情境中,其核心需求如何被激发满足。

麦克利兰的需求理论告诉我们,成功/安全性需求(N-Ach)是一个人最显著的需求,它可以激发一个人拥有极大的积极动机,去创造职业和个人的成就,以满足其需要。

此外,它也激发人们朝自己设定的期望学习新技能。

然而,当挑战过大,一个人的能力完全无法满足其要求,就会导致挫折感和失去自信。

亲属/联系需要(N-Aff)是其次,它激发一个人去追求情感支持和朋友关系,追求被社会承认和交流的机会。

如果一个人的这种需求未被满足,也将产生挫折和焦虑感。

最后,权力/影响力需要(N-Pow)驱使一个人去塑造一个有影响力的个性,去获得权利和学习支配物和人的能力。

一个人如果失去了支配话语权和权力感,他也会发生挫折感和焦虑。

因此,麦克利兰的需求理论告诉我们,每个人有着不同强度的3个核心需求。

正确理解和满足个体的这3个需求,有助于他们安心地拥有积极的成长和发展,而未能满足这3个需求,则很可能导致挫折和焦虑感。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

P( A B) confidence A B) P( B | A) ( P( A)
由于在实际应用中,概率P一般是无法事先给出的,所以常以频率代替。
占购买A的客户人数的百分比称为规则的置信度。
二、寻找强关联规则
例题2:计算下面规则的支持度与置信度。
(1){面包} {牛奶}
(2){牛奶} {面包}
第二步:构造关联规则。
四、 Apriori算法的典型应用
潜在强关联规 则
{a} {c} {c} {a} {b} {c}
置信度
是否为强关联 规则
Yes No No
1 0.67 0.67
给该超市的建议: 请将商品b和e的捆绑销售或就近 安排货架!
{c} {b}
{b} {e} {e} {b}
{a,b} {a,c} {a,e} {b,c} {b,e}
{c,e}
0.5
交易号
商品
1
a,c,d
b,c,e a,b,c,e b,e
step3: 在频繁L2基础上 求L3
L2 {a,c} {b,c} {b,e} {c,e} 支持度 0.5 0.5 0.75 0.5
2 3 4
连接L2* L2得到 {a,b,c},{a,c,e},{b,c,e} 剪枝,从而得到潜在的C3 {b,c,e}
0.6
0.4 0.8 0.2 0.6 0.4 0.2
3 4 5
1 0 0
1 1 0
1 1 0
2:寻找频繁(强)关联规则——高频的购物模式 如买牛奶的必然买面包。
9.1 Apriori算法
例:某超市销售数据
当数据量大时,必须引入有效算法
Apriori算法完成: 1. 寻找频繁项集; 受欢迎的商品。
ID 1 2 3 4 5
(3){鸡蛋} {奶酪}
ID 1 2 3 4 5
牛奶 奶酪 鸡蛋 面包 1 0 0 1 1 1 0 0 1 1 0 1 0 1 0 0 1 1 1 0
二、寻找强关联规则
ID 1 2 3
4
牛奶 1 1 1
0
奶酪 0 1 1
0
鸡蛋 0 0 1
0
面包 1 1 1
1
{面包} {牛奶} (60%, 75%) {牛奶} {面包} (60%, 100%)
0.67
1 1
No
Yes Yes
成功案例:神奇的购物篮分析
《啤酒与尿布:神奇的购物篮分析》的故事 是营销届的神话,“啤酒”和“尿布”两个 看上去没有关系的商品摆放在一起进行销售、 并获得了很好的销售收益,这种现象就是卖 场中商品之间的关联性,研究“啤酒与尿布” 关联的方法就是购物篮分析,购物篮分析是 沃尔玛秘而不宣的独门武器,购物篮分析可 以帮助我们在门店的销售过程中找到具有关 联关系的商品,并以此获得销售收益的增长!
因此所有的频繁项集为: {a},{b},{c},{e},{a,c},{b,c},{b,e},{c,e},{b,c,e }
Apriori算法寻找频繁项集的步骤——受欢迎的商品或商品组合。
潜在1-项集C1 频繁1-项集L1 连接 潜在2-项集C1 频繁2-项集L2
连接
剪枝
潜在3-项集C3
频繁3-项集L3
商品
二、寻找强关联规则
例题3:同例题1的数据。
解:
step1.所有的频繁项集为:
{a},{b},{c},{e},{a,c}, {b,c},{b,e},{c,e},{b,c,e}
2 3 4
设minS=50%,minC=80%,利用Apriori算法求所有的强关联规则。
潜在强关联规则 {a} {c} {c} {a} {b} {c}
置信度 1 0.67 0.67 0.67 1 1
是否为强关联规 则 Yes No No No Yes Yes
step2. 由频繁项集产生 关联规则如表:
{c} {b} {b} {e} {e} {b}
三、 Apriori算法的步骤
Apriori算法是一种寻找强关联规则的算法 Apriori算法具体步骤: 第一步:产生频繁项集
9.1 Apriori算法
如前所述,m种商品的非空项集有2m-1个, 计算量爆炸性增长。 频繁项集的性质:
性质1:频繁项集的子集必为频繁项集; 性质2:非频繁项集的超集必为非频繁项集。
先找频繁项集;然后再找频繁规则
9.1 Apriori算法
一、寻找频繁项集
例题1:设有项集T={a,b,c,d,e}所示的简单交易数 据库,设minS=50%,求所有的频繁项集。 商品 交 解: 易 step1:潜在的频繁1-项集C1为 号 {a},{b},{c},{d},{e} 1 a,c,d 由最小支持度可以得到频繁1-项集L1 2 b,c,e {a},{b},{c}, {e}
.。。。
二、寻找强关联规则
关联规则:形式上为
前项 后项
A B (规则支持度,规则置信度)
支持度(Support):同时购买A和B的客户人数占总
客户数的百分比称为规则的支持度。
support ( A 和B的客户人数
P( B)
L: <1,负相关 =1,A和B是独立的 >1,正相关,每一个出现蕴涵另一个出现
p({游戏})=0.6 ,p({影碟机})=0.75,p({游戏,影碟机})=0.4
L=0.4/0.6*0.75=0.89<1 负相关,规则无意义!
小结:
基本概念:频繁项集、关联规则、支持度、置信度
Apriori算法:(1) 寻找频繁项集; (2) 构造关联规则 (通过支持度、置信度、提升度得到有实用性的强 关联规则)。

Apriori算法是一种寻找强关联规则的算法 Apriori算法具体步骤: 第一步:产生频繁项集
第二步:构造关联规则。
附:关联规则的相关分析
强关联规则不一定有正确的指导意义! 例:在10000个交易中,6000个顾客交易包含计 算机游戏,7500个顾客交易包含影碟机,4000个 交易包含计算机游戏和影碟机。
第9章 探索内部结构:Clementine的关联分析
信息与计算科学专业2010本科
曹慧荣
第9章 探索内部结构:Clementine的关联分析
主要方法有:
Apriori算法 GRI算法 序列关联算法
9.1 Apriori算法 内容安排:
引例 Apriori算法
Step2:给出强关联规则。
牛奶 鸡蛋 面包 1 1 1 0 0 0 0 1 1 0 1 1 1 1 0
2.寻找频繁(强)的关联规则。 高频的购物模式。
9.1 Apriori算法
一、寻找频繁项集
K-项集:包含K个项的集合。
频繁项集:所有支持度大于等于最小支持 度的项集。 频繁项集的寻找: 如果有m种商品,则只要计算所有非空 项集的支持度,大于等于最小支持度的即 为频繁项集。
3
4
a,b,c,e
b,e
交易 号 1 a,c,d b,c,e
商品
step2: 在频繁L1基础上 求L2
L1 {a} {b} {c} {e} 支持度 0.5 0.75 0.75 0.75 C2
2 3 4
支持度 0.25 0. 5 0.25 0.5 0.75
a,b,c,e b,e
连接L1* L1 得到潜在C2
Step1:寻找频繁项集;
Apriori算法的典型应用
9.1 Apriori算法
引例:某超市销售数据
1:寻找频繁项集——受欢迎的商品或商品组合。 项:商品;项集:商品的集合。
项集 支持度
ID
1 2
牛奶 鸡蛋 面包
1 1 0 0 1 1
{牛奶}
{鸡蛋} {面包} {牛奶,鸡蛋} {牛奶,面包} {鸡蛋,面包} {牛奶,鸡蛋,面包}
本算法可以做课程论文的相关题目:
1、关联规则中基本概念的意义 (1)支持度 (2)置信度 (3)提升度 2、基于***数据的关联规则分析
收集数据,寻找强关联规则 3、序列关联规则
二、寻找强关联规则
A B (规则支持度,规则置信度)
一个好的规则应该有比较高的支持度和置信 度. 如果满足最小支持度阈值和最小置信度阈值, 则称这个规则为强规则。 我们的目的就是找出强关联规则。 由频繁项集可以产生潜在的强关联规则
交易号 1 a,c,d b,c,e a,b,c,e b,e
buys( x, "计算机游戏 ) buys( x, "影碟机" )[支持度 40%, 置信度 66%] "
规则其实是误导,因为购买影碟机的可能性是75%, 比66%还大。事实是:计算机游戏和影碟机是负相 关的。
附:关联规则的相关分析
关联规则实用性的测度指标 P ( B | A) 规则 A B 提升度L=
{鸡蛋} {奶酪} (20%, 100%)
5
0
1
0
0
A B (规则支持度,规则置信度)
思考:(1)规则支持度小,规则置信度大,说明什么现象? 如1000个人中只有一个人购买了烤炉,又购买了碳,所以 {烤炉} {碳} (0.1%, 100%) (应用机会少) (2)规则支持度大,规则置信度小,说明什么现象?
相关文档
最新文档