集对分析在职业卫生管理状况聚类分析中的应用

合集下载

聚类分析在医学中的应用

聚类分析在医学中的应用

聚类分析在医学中的应用近年来,聚类分析在医学领域中的应用越来越广泛,成为了一种重要的技术手段。

聚类分析是一种无监督学习方法,主要用于分析数据的相似性和差异性,将数据分成多个组,每个组内的数据相似度较高,组间的差异则较大。

下面将详细介绍聚类分析在医学中的应用。

1. 生物信息学生物信息学是一门较新的交叉学科,主要研究生物信息的获取、存储、处理和分析等问题。

聚类分析在生物信息学领域中有着广泛的应用,主要用于分析生物大数据,如基因、蛋白质、代谢产物等。

通过聚类分析,可以将相似的基因或蛋白质分在一组内,从而识别基因或蛋白质表达的模式与功能。

同时,在代谢组学领域中,聚类分析也被广泛应用于代谢物表达谱和代谢产物组之间的关系分析,有助于快速发现新的诊断和治疗方法。

2. 疾病分类在医疗实践中,疾病分类是非常重要的一部分。

传统的疾病分类方法主要基于病因、临床表现和预后等方面的特性,但这些方法往往存在主观性和不稳定性。

聚类分析则可以通过对患者的生理指标、症状表现和治疗反应等多个方面的数据进行分析,确定患者的疾病类型。

例如,在癌症的研究中,聚类分析可以用于分析肿瘤组织中的基因表达谱,从而确定肿瘤的类型和预后等重要信息。

3. 药效评价药物的疗效评价是药物研发过程中的一个重要环节。

聚类分析可以应用于药效评价中,通过对受试者的生理指标、药物代谢等多个方面的数据进行聚类分析,确定药物疗效和药物反应的不同模式,从而能够更加准确地评价药物的效果和安全性。

4. 图像分析医学图像分析一直是医学领域中的重要问题。

随着医疗技术的不断进步,现代医学图像面临着越来越多的数据量和复杂性。

因此,图像聚类分析成为一种重要的图像分析方法,可以自动地将大量医学图像分成不同的类别。

例如,在医学影像领域中,聚类分析可以对肺部 CT 影像进行分析,并将疾病分成不同的类型,如肺癌、肺结核等,从而为医生提供更加准确的诊断和治疗方案。

总结随着医学技术的不断发展,聚类分析在医学领域的应用将越来越广泛。

集对分析在职业卫生监督质量综合评价中的应用价值

集对分析在职业卫生监督质量综合评价中的应用价值

集对分析在职业卫生监督质量综合评价中的应用价值目的探讨集对分析在职业卫生监督质量综合评价中的应用及其价值。

方法应用集对分析综合评价2005—2012年某地评价职业卫生监督质量资料。

结果反映2005—2012年职业卫生监督质量的联系数分别为0+0.1145i+0.7784j、0+0i+0.8756j、0+0.6271i+0.2840j、0+0.6373i+0.2871j、0.5669+0.2094i+0.1780j、0.5780+0.2107i+0.1780j、0.7845+0.1890i+0j和0.9966+0i+0j,另j=-1,i分别按中间值和比例取值计算有效值的排序结果均为2012年>2011年>2010年>2009年>2007年>2008年>2005年>2006年,与功效系数法、秩和比法和灰关联分析法的排序基本一致。

结论集对分析与功效系数法、秩和比法和灰关联分析法用于职业卫生监督质量综合评价各有优缺点,前者可利用三元联系数进行不确定度分析,后三者可进行统计推断,均有推广应用的价值。

实际应用时,应根据研究目的和资料的不同,选用合适的统计方法进行分析。

标签:集对分析;职业卫生;卫生监督;综合评价;应用价值职业卫生监督是保障劳动者身心健康的重要措施,也是防治职业病的重要途径。

所以,卫生监督员必须重视提高职业卫生监督质量。

为此,该研究应用集对分析对某地2005—2012年职业卫生监督工作质量资料进行综合排序和不确定性分析,达到提高职业卫生监督质量的目的。

现将结果报道如下。

1资料与方法1.1一般资料2005—2012年某地评价职业卫生监督质量,评价指标包括粉尘监测合格率(%,X1)、化学因素监测合格率(%,X2)、物理因素监测合格率(%,X3)、监督率(% ,X4)和体检率(%,X5),各指标的归一化权重(W)及其所得各年度各指标的观测值见表1[1]。

数据来自文献,真实可靠。

《医学统计课件:聚类分析的应用》

《医学统计课件:聚类分析的应用》

聚类分析在医学研究中的进一步发展和 应用前景
随着医学数据的不断增长和技术的发展,聚类分析在医学研究中的应用将变得更加广泛和深入。例如, 结合机器学习和深度学习的方法,可以进一步提高聚类分析的精度和效果。同时,聚类分析也可以与其 他数据挖掘技术和可视化方法相结合,为医学研究提供更全面的视角和洞察。
基于样本之间的密度来进行聚类,常用的方法包括DBSCAN和OPTICS。
3
层次聚类分析
通过不断合并或分割聚类来构建一个层次结构,可以得到不同层次的聚类结果。
聚类分析的步骤和流程

1 数据准备和清洗
收集和整理数据,并进 行数据清洗,去除噪声 和异常值。
2 特征选取和重要性
分析
选择合适的特征,并评 估它们对聚类结果的重 要性。
3 数据预处理和规范

对数据进行预处理和规 范化,例如标准化或归 一化。
4 聚类模型的构建
5 模型评估和结果解释
选择合适的聚类算法,构建聚类模型并进 行训练。
评估聚类模型的性能,并解释聚类结果。
医学领域中聚类分析的应用
医学影像聚类分析
通过对医学影像数据进行聚类,可以帮助发 现疾病特征和诊断模式。
基于生命体征数据的聚类分析
通过分析生命体征数据的聚类,可以识别不 同健康状态下的特征和变化。
基于遗传数据的聚类分析
利用个体的遗传数据进行聚类分析,可以揭 示遗传变异的模式和相关性。
基于病历数据的聚类分析
对病历数据进行聚类,可以发现疾病的亚型 和不同治疗策略的潜在效果。
聚类分析的优缺点及注意事项
优点
• 无监督学习方法,不 需要事先标记的训练
《医学统计课件:聚类分 析的应用》
在这个课件中,我们将探索聚类分析在医学研究中的应用。了解聚类分析的 定义、方法和步骤,并探讨在医学领域中的具体应用案例。

聚类分析的应用案例

聚类分析的应用案例

聚类分析的应用案例聚类分析是一种常用的数据分析方法,它可以将数据集中的对象分成不同的类别或簇,使得同一类内的对象相似度较高,而不同类别之间的对象相似度较低。

聚类分析广泛应用于市场分析、社交网络分析、生物信息学、医学诊断等领域。

本文将介绍几个聚类分析的应用案例,以便更好地理解聚类分析在实际问题中的应用。

首先,聚类分析在市场分析中的应用。

在市场营销中,企业需要了解消费者的偏好和行为,以便更好地制定营销策略。

通过对消费者数据进行聚类分析,可以将消费者分成不同的群体,从而更好地理解他们的需求和行为模式。

例如,一家零售商可以通过聚类分析将消费者分成价格敏感型、品牌忠诚型、功能导向型等不同的群体,从而有针对性地进行促销活动和产品定位。

其次,聚类分析在社交网络分析中的应用。

随着社交网络的兴起,人们在社交网络上的行为数据变得越来越丰富。

通过对社交网络数据进行聚类分析,可以发现不同的社交群体和用户行为模式。

例如,一家社交网络平台可以通过聚类分析将用户分成信息分享型、社交互动型、内容创作型等不同的群体,从而更好地满足用户需求,提高用户留存和活跃度。

再次,聚类分析在生物信息学中的应用。

生物信息学是研究生物学数据的计算机科学领域,其中大量的生物数据需要进行分析和挖掘。

通过对生物数据进行聚类分析,可以发现不同的基因型、蛋白质结构等生物特征。

例如,通过对癌症患者的基因数据进行聚类分析,可以发现不同的癌症亚型和治疗方案,为临床诊断和治疗提供重要参考。

最后,聚类分析在医学诊断中的应用。

在医学诊断中,医生需要根据患者的症状和检查数据进行疾病诊断。

通过对患者数据进行聚类分析,可以发现不同的疾病类型和临床表现。

例如,通过对心脏病患者的临床数据进行聚类分析,可以发现不同的心脏病亚型和治疗方案,为临床诊断和治疗提供重要参考。

综上所述,聚类分析在市场分析、社交网络分析、生物信息学、医学诊断等领域都有重要的应用价值。

通过对不同领域的应用案例进行分析,可以更好地理解聚类分析的原理和方法,为实际问题的解决提供重要参考。

聚类分析法在医学上的应用研究

聚类分析法在医学上的应用研究

聚 类 分 析 , 它 是 直 接 比 较 各 事 物 之 间 的 性 质 , 将 性 质 相 近 的 归 为 一 类 , 性 质 差 别 较 大 的 归入 不 同类 的 一种 多 元统 计 分析 方 法 。 现 代 化 数 字 医 疗 的 严 峻 形 势 对 医 务 人 员 的 要 求 越 来越 高 。 聚类 分析 技 术在 发 达 国家 的应 用 已经很 广泛 ,在 我 国医 学领 域 应用 的 较晚 但 前景广 阔。 常 用 的 统 计 聚 类 分 析 方 法 包 括 谱 系 聚 类 ( h i e r a r c hi c a 1 c 1 u s t e r i n g ) 、 快 速 聚类 ( K — m e a n s )、两阶段聚类 ( T w o — S t e p )、 动 态 聚类 、 最 优 分 割 和 模 糊 聚 类 等 。采 用 k ~ 均 值、 k 一 中 心 点 等 算 法 的 聚 类 分 析 工 具 已被 加 入 到 许 多 著 名 的 统 计 分 析 软 件 包 中 ,如 S P S S 、S A S 、 M A T L A B 等 。 国 外 比 较 有 名 的 数 据 挖 掘 系 统 有 S A S 公 司的 E n t e r p ri 8 e i i 1 1 e r 、I B M 公 司 的 I n t e l l i g e n t M i n e r .S G I 公司 的 M i n e r S e t 、 S P S S 公司 的C l e m e n t i n e 、加拿 大S i m o n F r a s e r 大 学开发 的D B M i n e t 等。 通 过 查 阅 万 方 、 维 普 、 知 网 等 各 种 数 据 库 的相 关 文 献 ,借助 文 献计 量 学及 S P S S , M A T L A B 等 软 件 分 析 ,发 现 聚 类 分 析 在 医 学 领 域 的应用 主要有 以下几个方 面 。 聚 类 分 析 在 医 学影 像 上 的应 用 医 学 图 像 数 据 挖 掘 技 术 聚 类 分 析 是 有 效 解 决医 学 图像 处理 与 分 析 的重 要手 段之 ~ , 它 可 以 揭 示 正 常 人 体 各 组 织 器 官 影 像 特 征 数 据 的 分 布 规 则 和 关 系 , 为 人 体 组 织 器 官 图 像 的 自动 分 类 和 病 变 组 织 图 像 自 动 识 别 开 辟 新 的途经 [ 。 目前 的 典 型 研 究 有 : 1 . 在 医学 图像 灰 度 密度 研 究 的基础 上 , 提 出 基 于 医 学 图 像 带 修 正 系 数 的 密 度 构 造 聚 类 算法 。对现 有 图像 数 据挖 掘 算法 加 以比较 筛 选 和 改 进 , 深 入 研 究 了 医 学 图 像 数 据 的 核 密 度 函 数 、 数 据 分 箱 和 基 于 数 据 分 箱 策 略 的 密 度 构 方 法 ,使 图 像 更 精 确 。 2 . 用M a t l a b 语 言优 化K 一 均 值 聚类算 法程 序 ,提 高 了 K 一 均 值聚类算法 在医学C T 图 像 分 割 上 的 应 用 效 果 、 稳 定 性 和 质 量 , 减 少 了 程 序 的 运 行 时 间 , 为 图像 的识 别 处 理 奠 定 了基 础 。 3 . 将 遗 传 算 法 与 聚 类 分 析 两 种 工 具 相 结 合, 应 用到 医学 c T 图 像 分 割 中 。 利 用 遗 传 算 法搜 索 的 随机 性和 并 行性 , 克 服 了K 均 值 聚 类 的 局部 性 和对 初 始 聚类 中 心的 敏感 性 。 并且 可 以根据 分割 的要求 , 合 理地 调整 聚类时 的特 征 向量 和 权 重 。 4 . 将 模 糊 聚类 分 析 方法 引 入 到医 学 图像 处 理 领 域 , 在 不 断 的 改 进 和 其 他 方 法 的 伴 随 下 ,改善算法 的速度和 处理效果 。 5 . 采 用 无 监 督 的 聚 类 分 析 的 计 算 机 系 统 提高 对病灶 的M R I x 光 检 查 的 诊 断 准 确 性 ,作 为 计 算机 辅 助 诊 断 病 灶 x 光检查 。 二 、 聚 类 分 析 在 疾 病 的 诊 断 和 分 型 上 的 应 用 在 医 学 中 , 值 得 注 意 的 是 , 某 些 临 床 实 体 可 以 有 种 种 原 因 , 如 由非 常 不 同 的 细 菌 造 成 的脑 膜 炎在 临床 上 可 能无 可 区别 ;反之 , 种 病 因 可 以产 生种 种 体征 ,症状 和 病 理现 象 , 例 如 , 梅 毒 。 在 当 前 的 数 字 化 医 疗 时 代 , 医 学 聚 类 分 析 在 疾 病 的 计 算 机 诊 断 上 大 放 异 彩 , 解 决 了很 多 关 于 疾 病 实 体 和 综 合 征 的 诊 断 和 分 型 的棘 手 问题 2 j 。 较 早 的应 用 有 : M a n n i n g  ̄1 W s t s o n( 1 9 6 6 )

集对分析在职业卫生管理状况聚类分析中的应用

集对分析在职业卫生管理状况聚类分析中的应用

中国卫生产业职业卫生管理是维护劳动者身体健康,预防和控制职业因素危害的重要措施。

在职业卫生管理中,一般采用多指标体系描述并评价其职业卫生状况,但由于不同评价指标观测值的参差不齐,这需要运用相应的统计方法进行综合评价。

为此,该研究者应用集对分析对2003年我国10个调查省市职业卫生管理状况进行聚类分析,更好地指导职业卫生管理工作,发挥职业卫生监督的作用。

现报道如下。

1资料与方法1.1资料来源原卫生部于2003年按不同地区经济发展水平,分层选取10个省、直辖市(北京、广东、福建、广西、山东、安徽、河南、四川、吉林、湖南)20家8种类型用人单位20家,由省级卫生行政部门组织职业病防治机构的专业技术人员现场调查用人单位的职业卫生状况。

从26项基础指标中筛选出X 1-职业病防治计划和实施方案及安全率(%)、X 2-职工健康监护档案建档率(%)、X 3-职业病危害事故应急救援预案及安全率(%)、X 4-职业病危害项目申报率(%)、X 5-职业病危害劳动合同告知率(%)、X 6-工作场所职业病危害因素检测率(%)、X 7-上岗前职业健康体检受检率(%)、X 8-在岗期间职业健康体[基金项目]吉林省卫生厅科研课题(立项编号2012R023,吉卫指标函[2012]37号)。

[作者简介]孙爱峰(1968-),男,山东招远人,本科,高级讲师,主要从事预防医学实践及其教学工作。

[通讯作者]孙齐蕊(1993-),女,吉林白城人,吉林大学公共卫生学院2012级预防医学(医事法学)专业在读学生。

集对分析在职业卫生管理状况聚类分析中的应用孙爱峰1,孙齐蕊21.白城市卫生急救中心,吉林白城137000;2.吉林大学公共卫生学院,吉林长春130021[摘要]目的探讨集对分析在职业卫生管理状况聚类分析中的应用价值。

方法应用集对分析理论聚类分析我国2003年10个调查省市职业卫生管理状况。

结果Ⅰ类职业卫生管理状况包括地区1、2、3、5、9和10,Ⅱ类包括地区4、6和8,地区7属于Ⅲ类。

聚类分析在医院管理中的应用

聚类分析在医院管理中的应用
表 1 2 0 年 各 项 业 务 指 标 完 成 情 况 05
二 类 。 科 、 肠 科 完 成 指 标和 上 一 类 距 离 较 远 , 标 完 成 很 一 伤 肛 指
数 据 处 理
般 , 据 聚 类 规 则 分 为 三 类 。 科 离 前 几 类 距 离 很 远 , 表 1可 根 儿 从 见 他 的 每 项 指 标 完成 都 是 最 高 的 , 据 聚 类 规 则 分 为 四 室分 为 四大 类 似 乎 比较 合 理 , 一 类 第 为 完成 指 标 较好 的 科 室 , 二 类 为 指 标 完 成 比 较 接 近 的 科 室 , 第 第 三类 为 指 标 完 成 较 差 的科 室 , 四 类 为 指 标 完 成 非 常 好 的 科 第 室 。 而 得 出表 3的 数 值 。 从
维普资讯

92 ・
中 国 卫 生统 计 20 0 7年 2月第 2 4卷 第 1 期
聚 类分析 在 医院管理 中的应 用
黄石中医院(300 胡春娥 450)
聚类 分 析 又 称 集 群 分 析 , 是 研 究 “ 以 类 聚 ” 一 种 多 它 物 的
病较多, 这些科室发挥专病特点, 提高 中医中药治疗有 效率, 扩
大 了 我 院 收 治病 人 的 广 度 , 决 了我 市 一 些 性 病 和 疑 难 病 症 用 解 西 医 治疗 效 果 不 佳 的局 面 。 所 以这 些 科 室 床 位 使 用 率 比较 高 , 病 床 工 作 日长 , 为我 院 完 成 各 项 硬 性 指 标 出 了 力 , 得 了 比较 取
要 多 , 而 收 治 病 人 数 在 全 院 占 主 导 地 位 , 致 病 床 使 用 率 因 导
9 . %。 床周转次数 1 .。中药使 用率 6 . %, 出了中医 93 病 30 78 突

报告中运用聚类与分类分析进行结果解读

报告中运用聚类与分类分析进行结果解读

报告中运用聚类与分类分析进行结果解读引言:近年来,数据的快速增长和复杂性催生了聚类与分类分析的广泛应用。

无论是在商业领域还是科学研究中,聚类与分类分析都扮演着重要的角色。

本文将以报告中的运用为切入点,详细论述聚类与分类分析在结果解读中的应用。

一、聚类分析的理论基础1.1 聚类分析的定义与分类聚类分析是一种无监督学习的方法,主要用于将数据按照其相似性进行分组。

在聚类分析中,我们需要选择合适的聚类方法和距离度量方式来刻画数据之间的相似度。

1.2 聚类算法的主要应用领域聚类算法在许多领域都有应用,包括市场细分、社交网络分析、基因表达数据分析等。

不同的聚类算法适用于不同的数据类型和领域。

二、分类分析的理论基础2.1 分类分析的定义与分类分类分析是一种监督学习的方法,通过构建分类模型将数据划分到预定义的类别中去。

在分类分析中,我们需要选择合适的分类算法和特征选择方法来提高分类的准确性。

2.2 分类算法的主要应用领域分类算法在许多领域都有应用,比如垃圾邮件识别、疾病预测、情感分析等。

不同的分类算法适用于不同的问题和数据类型。

三、聚类与分类分析在报告中的应用3.1 数据预处理与特征提取在进行聚类与分类分析之前,我们需要对原始数据进行预处理和特征提取。

数据预处理包括数据清洗、缺失值处理等,而特征提取则是从原始数据中提取有意义的特征。

3.2 聚类分析结果的解读在聚类分析中,我们可以通过统计指标和可视化工具来解读聚类结果。

常用的统计指标包括轮廓系数、间隔、紧密度等,而可视化工具则可以帮助我们更直观地理解不同类别的分布情况。

3.3 分类分析结果的解读在分类分析中,我们可以通过混淆矩阵、准确率、召回率等指标来解读分类结果。

此外,我们还可以对分类模型进行评估和优化,以提高分类的准确性和稳定性。

四、实例分析:聚类与分类分析在市场细分中的应用4.1 市场细分的重要性与挑战市场细分是一种将消费者划分为不同群体的方法,有助于企业更精确地定位目标市场。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

集对分析在职业卫生管理状况聚类分析中的应用目的探讨集对分析在职业卫生管理状况聚类分析中的应用价值。

方法应用集对分析理论聚类分析我国2003年10个调查省市职业卫生管理状况。

结果Ⅰ类职业卫生管理状况包括地区1、2、3、5、9和10,Ⅱ类包括地区4、6和8,地区7属于Ⅲ类。

结论应用集对分析理论进行聚类分析具有一定的应用价值,其关键在于等级数目的确定和各等级定量观测值范围的合理划分以及联系数有效值的计算和不确定度分析,以合理划分并观察其类别的动态变化。

标签:联系数;集对分析;职业卫生管理;聚类分析[Abstract] Objective To investigate the value on set pair analysis (SPA)for Cluster Analysis in occupational health management status. Methods Application of set pair analysis theory for cluster analysis of occupational health management status of 10 survey provinces and cities in 2003. Results Class Ⅰoccupational health management status,including regional 1,2,3,5,9 and 10,Ⅱclass includes areas 4,6 and 8,the area belongs to Ⅲclass 7. Conclusion Application of set pair analysis theory cluster analysis has some value,the key is reasonable in a hierarchy to determine the number and range of levels of quantitative observations and contact number of valid values and uncertainty analysis,and a reasonable division observe the dynamic changes in their category.[Key words] Correlate;Set pair analysis;Occupational health management;Cluster analysis职业卫生管理是维护劳动者身体健康,预防和控制职业因素危害的重要措施。

在职业卫生管理中,一般采用多指标体系描述并评价其职业卫生状况,但由于不同评价指标观测值的参差不齐,这需要运用相应的统计方法进行综合评价。

为此,该研究者应用集对分析对2003年我国10个调查省市职业卫生管理状况进行聚类分析,更好地指导职业卫生管理工作,发挥职业卫生监督的作用。

现报道如下。

1资料与方法1.1资料来源原卫生部于2003年按不同地区经济发展水平,分层选取10个省、直辖市(北京、广东、福建、广西、山东、安徽、河南、四川、吉林、湖南)20家8种类型用人单位20家,由省级卫生行政部门组织职业病防治机构的专业技术人员现场调查用人单位的职业卫生状况。

从26项基础指标中筛选出X1-职业病防治计划和实施方案及安全率(%)、X2-职工健康监护档案建档率(%)、X3-职业病危害事故应急救援预案及安全率(%)、X4-职业病危害项目申报率(%)、X5-职业病危害劳动合同告知率(%)、X6-工作场所职业病危害因素检测率(%)、X7-上岗前职业健康体检受检率(%)、X8-在岗期间职业健康体检受检率(%)、X9-用人单位负责人职业卫生培训率(%)、X10-劳动者上岗前职业卫生培训率(%)、X11-健康监护费用在生产成本中列支率(%)、X12-疑似职业病病人及时安排诊断率(%)和X13-现有职业病人享受国家规定的职业病待遇率(%)13项指标作为评价职业卫生管理状况的指标[1],各指标的检测值见表1。

数据来自文献,真实可靠[2]。

1.2统计方法应用基于三元联系数的集对分析基本原理[3]对2003年我国10个不同经济发展水平省市职业卫生管理状况进行聚类分析。

2结果2.1各评价指标等级范围的划定和标记由于该资料所选用评价指标均为高优,且有的指标观测值不呈正态分布,因此按照统计学要求以均匀划分法在划定各指标各等级的观测值范围。

该组研究对象为10各省市,以划分为三个等级为宜。

计算同一指标观测最大值(Xmax)与最小值(Xmin)的差值R,则等级由低到高的区间值范围分别为[Xmin,Xmin+R/3)、[Xmin+R/3,Xmin+2R/3)和[Xmin+2R/3,Xmax]。

如对于职业病防治计划和实施方案及安全率(X1)来说,等级Ⅲ的观测值范围为45.46~59.64,等级Ⅱ为59.64~73.82,等级Ⅰ为73.82~88.00,其余评价指标类推(见表1最后3行)对照各指标的观测值和各等级观测值的范围,观测值在相应区间范围者标记为相应等级(见表1观测值后的罗马数字)。

2.2构建三元联系数分别计算同一调查省市各评价指标对应的等级序数与三个等级序数之差值的绝对值,数值为0、1和2者分别对应同一等级(m)三元联系数的同部A、异部B和反部C,得到同一省市不同等级对应的联系数Um=Am+Bmi+Cmj,见表2。

2.3联系数有效值的计算和等级的判定给予该研究者既往研究及其分析,该文选用较为稳妥的中间(平均)有效联系值来判定每个省市职业卫生管理状况的等级:即根据集对分析之理论,令i=0,j=-1计算各联系数的有效联系值;对于同一地区,以数值较大者作为该地区在既定给出判定准则下的对应等级,如地区1的Ⅰ类、Ⅱ类和Ⅲ类有效联系值分别为10、3和-10,由于Ⅰ类有效值最大,故判定该地区职业卫生管理状况为Ⅰ类,其余地区类推,见表2。

3讨论集对分析是赵克勤先生提出的解决确定-不确定问题的一种新的统计方法,其中介媒体为联系数,在预防医学领域的不同地区、不同时间卫生监督质量的排序、聚类分析和发展趋势分析中得到一定应用[3,5-9],以其他方法相比,结论均可接受,由于统计方法的数学原理不同,亦有不同甚或截然相反之结论出现,是值得探讨的一个问题。

因此,该文选择基于联系数的集对分析对我国10个不同经济发展水平省市的职业卫生管理状况进行聚类分析。

统计学中对事物进行“分类”的方法有两种,其中判别分析是根据已知其类别的样品,总结出类别的判定法则,用以判断未知类别的新样品的归类;聚类分析是在事物分类面貌尚不清楚,甚至连总共分几类也不清楚确定的情况下,讨论事物的分类问题[10]。

由该文给出的基于联系数的聚类分析基本原理和步骤可知,兼有统计学的判别分析和聚类分析的特性,但其原理又不相同。

该文研究中,根据地区数量和数值情况,将不同评价指标的观测值分为3个等级,亦可灵活分为其他数量的等级,以合理对研究对象进行分类。

在确定各等级范围时,要根据各指标观测值统计分布类型的不同,选用不同的方法确定各等级的范围,一般对正态分布资料采用均数标准差法或均值离差法,偏态分布采用均匀划分法[11];但对于正态分布资料来说,三种方法划定的范围差别不大,考虑到各指标的统计分布不都为正态分布,因此,该研究者采用更为简单的均匀划分法。

在确定评价地区类别时,不确定性在于有效值的计算。

根据集对分析的原理,对于该文选用的三元联系数Um=Am+Bmi+ Cmj来说,异部系数j=-1是确定的,异部系数i∈[-1,1],这使类别判定出现了不确定性,会出现莫衷一是的尴尬局面。

尽管该研究者的既往研究对异部系数采用中间取值法较为稳妥,如该文Ⅰ类职业卫生管理状况包括地区1、2、3、5、9和10,Ⅱ类包括地区4、6和8,地区7属于Ⅲ类;但当异部系数取其他数值时,会出现不同的结论。

如对于地区5,当异部系数为7/9时,难以判定其职业卫生管理状况属于Ⅰ类还是Ⅱ类;异部系数为-1/9时,难以判定该地区属于Ⅱ类还是Ⅲ类。

这既是该文所述方法的缺点,也是其优点,因为这可以动态判定不同地区职业卫生管理状况的类别,可以看出当异部系数变化时类别的动态变化,为职业卫生监督管理提供一定的参考依据,以便采取得力的措施避免各地区职业卫生管理水平恶化,并逐步提高监督管理水平,为避免职业病和职业多发病的发生,维护劳动者健康,提高生产力水平奠定坚实的基础。

还应注意的是,应用该方法进行聚类分析时,应根据比较组数和观测值特点合理确定等级数目,一般以5个等级为限;采用不同的方法划分相同数目等级的不同指标取值范围,所得三元联系数和判定的等级类别不尽相同;当为4或5个等级时,不确定度系数宜采用中间取值法计算四元或五元联系数的有效值以合理判定所属类别,出现不同类别有效值相同情况,应根据原始数据合理判定类别,也应如该文一样,合理分析当不确定度系数取不同数值时类别的变化情况。

同时,根据同类别有效值的大小,可对同类别地区职业卫生管理状况进行排序;且规定高类别在前。

据此判定当不确定系数取零时10个不同省市职业卫生管理状况排序为地区1>地区3=地区5>地区9>地区2>地区10>地区8>地区4=地区6>地区7(见表2最后一列),与TOPSIS法所得结论差异较大,原因可能与该方法计算所得联系数较没有充分利用原始数据提供的信息,可见排序结论较为粗糙。

如应用联系数进行排序,可应用文献[7]的原理进行分析。

该研究与TOPSIS法[1]的综合评价是不同的两个方面,TOPSIS法的着重点是排序(也可根据计算得到的C值,应用基于秩和比的可信区间法或分档法[12]进行综合评价),该文着重点在于根据既定的等级数目和等级范围来判定类别并进行粗糙排序,两者的结论可以互补。

实际工作中,应根据比较目的和资料的特点,合理选择统计方法进行综合评价,以指导具体的工作实践。

综上所述,应用集对分析理论进行聚类分析的关键在于等级数目的确定和各等级定量观测值范围的合理划分以及联系数有效值的计算和不确定度分析,只有这样才能合理为各比较组划分类别,并根据不确定度系数取值的不同动态观察同一比较组的类别变化情况,合理运用基于联系数的聚类分析。

[参考文献][1] 汤海滢,康晓平,康辉,等.职业卫生管理综合评价指标的筛选[J].中国公共卫生,2005,21(2):96-98.[2] 汤海滢,胡永华,康辉,等.加权TOPSIS方法综合评价职业卫生管理状况的探讨[J].中国工业医学杂志,2007,20(1):20-22.[3] 谷玉祥,孙齐蕊,孙爱峰.基于联系数的车站环境和站卖食品卫生情况聚类分析[J].中国卫生产业,2015,12(1):14-15.[4] 邱昭君,孙爱峰.联系数在不同地区卫生监督质量聚类分析中的应用[J].中国医药指南,2011,9(36):490-492.[5] 夏淼,孙爱峰.集对分析在职业卫生监督质量综合评价中的应用价值[J].中国卫生产业,2015,12(3):10-11.[6] 汪丽伟,孙齐蕊,孙爱峰.联系数在公共场所卫生监督质量综合评价中的应用[J].中国卫生产业,2014,11(21):62-63.[7] 吴莹,孙爱峰,孙齐蕊.集对分析在食品卫生监督工作质量分类和排序中的应用[J].中国卫生产业,2014,11(21):61,63.[8] 王丽静,孙齐蕊,孙爱峰.集对分析在不同年度环境空气质量综合评价中的应用[J].科技创新导报,2014,11(8):100.[9] 金丕焕,陈峰.医用统计方法[M].3版.上海:复旦大学出版社,2009.[10] 王文圣,李跃清,金菊良,等.水文水资源集对分析[M].北京:科学出版社,2010.[11] 孙爱峰.秩和比法在不同地区人体蛔虫感染现状调查结果综合评价中的应用[J].中国医药指南,2011,9(31):226-227.(收稿日期:2015-03-24)。

相关文档
最新文档