医学统计学(点睛之笔很经典)
医学统计学

医学统计学一、介绍医学统计学是医学领域中一门重要的学科,它通过收集、整理和分析医学数据,为医学研究和临床决策提供科学依据。
医学统计学的主要任务是使用统计方法分析各种医学数据,从中提取有意义的信息,并对结果的可靠性和有效性进行评估。
在医学研究中,医学统计学起着至关重要的作用,帮助研究人员通过数据分析对疾病的发病机制、病理生理过程和治疗效果等进行评估。
二、常见统计方法1. 描述统计学描述统计学是医学统计学的基础,它主要用于对医学数据的数量特征进行描述和总结。
常见的描述统计学方法包括:•平均值:用于描述数据的中心趋势。
•标准差:用于描述数据的离散程度。
•百分位数:用于描述数据的分布情况。
2. 推断统计学推断统计学是医学统计学的核心,它基于样本数据对总体进行推断。
常见的推断统计学方法包括:•假设检验:用于检验研究假设的真实性。
•置信区间:用于估计总体参数的范围。
•方差分析:用于比较多个样本的均值差异。
3. 生存分析生存分析是医学统计学中的一项重要内容,它主要用于研究患者的生存时间和相关因素。
常见的生存分析方法包括:•生存曲线:用于描述患者生存时间的分布情况。
•生存率:用于描述患者在某一时间点存活的概率。
•Cox比例风险模型:用于研究生存时间和危险因素的关系。
三、应用领域医学统计学广泛应用于医学研究和临床实践中,对于评估疾病的风险因素、制定预防策略、确定诊断标准和评估治疗效果等方面都起着至关重要的作用。
以下是医学统计学在不同领域的应用示例:1. 流行病学研究医学统计学在流行病学研究中发挥着重要作用。
通过收集大量的样本数据,并运用相关的统计方法,可以研究疾病的发病规律、危险因素和暴露因素等,为疾病的预防和控制提供科学依据。
2. 临床试验医学统计学在临床试验中的应用也非常重要。
通过对试验组和对照组的数据进行比较分析,可以评估新药物或治疗方法的疗效和安全性,为临床决策提供可靠依据。
3. 医疗质量评估医学统计学可以用于医疗质量评估,通过对不同医疗机构之间的数据进行比较分析,评估医疗服务的质量,为改善医疗质量提供参考。
医学统计学重点归纳

医学统计学重点归纳
嘿,大家好呀!今天咱来聊聊医学统计学的重点归纳哈。
首先呢,咱得知道啥是医学统计学呀,简单说就是用些数字方法来研究医学那点事儿。
就好比医生看病,光凭感觉可不行,得有数据支持才行嘞。
样本和总体可别搞混咯,总体就是一大群,样本就是从里面挑出来的一小部分。
咱得从这小部分里看出点门道来,推断总体的情况。
还有那个均值、中位数和众数,可别小瞧它们。
均值就是平均数啦,大家都懂;中位数就是中间那个数;众数呢就是出现最多的那个数。
就像一群人里找个代表一样。
再说说概率吧,这东西可神奇了。
有时候生病的概率就像抽奖,不知道啥时候就轮到你啦。
相关和回归也很重要呀,就像两个人的关系,能看出它们之间有没有关联。
要是能找到规律,那可就厉害咯。
方差和标准差呢,就是看数据波动大不大。
波动大就像小孩调皮,不太稳定;波动小就像乖宝宝,比较靠谱。
哎呀呀,医学统计学虽然听着有点复杂,但其实就像生活中的小智慧一样。
咱医生就是靠着这些来诊断病情、判断治疗效果呢。
总之呢,医学统计学就像医生的秘密武器,能让咱看病更靠谱,治病更有把握。
大家可别小瞧它哟!好啦,今天就说到这啦,希望你们对医学统计学也有了更深的了解呀!拜拜咯!
怎么样,是不是对医学统计学有了点初步认识啦?哈哈,以后再遇到相关的事儿,就不会摸不着头脑啦!。
课堂笔记——医学统计学

第一章医学统计中的基本概念一、医学统计工作的内容:实验设计(experiment design)、收集资料(collecting data)、整理资料(sorting data)和分析资料(analyzing data)二、变异:医学研究的对象是有机的生命体,其功能十分复杂,不同的个体在相同的条件下,对外界环境因素可以发生不同的反应,这种现象称为个体差异或称为变异三、总体(population)和样本(sample):总体是同质的个体所构成的全体。
从总体中抽取部分个体的过程称为抽样,所抽的部分称为样本,在一个样本里含有的个体数可以不同,样本包含的个体数目称为样本容量。
四、样本的特性:代表性(representation)——要求样本能够充分反应总体的特征;随机性(randomization)——需要保证总体中的每个个体都有相同的几率被抽做样本;可靠性(reliability)——实验的结果要具有可重复性,即由科研课题的样本得出的结果所推测总体的结论有较大的可信度;可比性(comparability)——指处理组(临床设计中称为治疗组)与对照组之间,除处理因素不同外,其他可能影响实验结果的因素要求基本齐同,也称为齐同对比原则。
五、误差:①系统误差(system error)②③六、概率(probability):是描述某一件事发生的可能性大小的一个量度。
习惯将P≤0.05或P≤0.01的事件称为小概率事件第二章集中趋势的统计描述一、频数表(frequency table):①概念:一种格式的统计表,即同时列出观察指标的可能取值区间及其在各区间内出现的频数。
由于这种资料的表达方式较完整地体现了观察值的分布规律,所以也称为频数分布表。
②制作图标的步骤:确定组数、确定组距、确定组段、对各组段计数及手工编制划记表。
二、直方图(histogram):①概念:直方图是以垂直条段代表频数分布的一种图形,条段的高度代表各组的频数,由纵轴标度;各组的组限由横轴标度,条段的宽度表示组距。
医学统计学笔记12

---------------------------------------------------------------最新资料推荐------------------------------------------------------医学统计学笔记12医学统计学笔记统计学:是收集、分析、解释与阐述数据资料的一门科学。
通过收集、分类、分析来处理数据变化的科学与艺术,获得可信结果。
医学统计学:将概率论和数理统计的原理和方法应用于医疗卫生实践和医学科研,研究其数据的搜集、整理与分析的一门科学。
是认识人群健康与疾病数量特征的重要工具,是进行医药卫生科学研究的重要手段。
国外统计学家:统计学并不能证明事物,但它能进行推断,发现线索,提供信息,使得人们有根据去改善事物。
科研原则:随机化原则,对照原则,重复原则,齐同原则(均衡原则)。
统计内容:设计,总体指标估计,假设检验,现象联系关系的分析,多因素分析,健康估计。
统计三大内容:科研设计,统计描述,统计推断。
变量:1/ 25被观察和测量单位的特征。
变量值:对变量的测量值。
同质:被研究指标的影响因素相同或具有相同性质的事物。
变异:在同质的基础上各观察单位之间的差异或同质事物之间的差别。
总体:根据研究目的确定的同质的研究对象的全体。
(无限总体,有限总体)个体:是构成总体最基本的观察单位。
样本:从总体中按照一定的目的随机抽取的有代表性的部分观察单位。
(随机性,可比性,可靠性)。
从总体中按照一定的目的随机抽取的有代表性的部分观察单位。
(随机性,可比性,可靠性)。
样本含量:样本中包含的个体数。
样本含量要大,越大越具代表性,随机抽。
参数:刻画总体特征的指标(用希腊字母表示)是常数。
统计量:---------------------------------------------------------------最新资料推荐------------------------------------------------------ 样本系统指标(用拉丁字母表示)是变化的。
医学统计学学习笔记

医学统计学笔记一、绪论及基本概念1. 资料类型①计量资料(定量资料、数值变量资料):连续型、离散型②计数资料(定性资料、无序分类变量、名义变量):二分类、多分类③等级资料(半定量资料、有序分类变量)信息量:计量资料>等级资料>计数资料2.误差类型①过失误差:可避免②系统误差:具有明确的方向性,可避免③随机误差:分为随机测量误差和随机抽样误差,没有固定的大小和方向,不可避免3.核心概念参数:u、σ;固定的常数,总体的统计指标,参数大小客观存在,但往往未知。
统计量:X̅,S,P;样本的统计指标,参数附近波动的随机变量。
概率为参数,频率为统计量。
4.医学统计工作的基本步骤:设计、收集资料、整理资料、分析资料二、计量资料的统计描述1.集中趋势的描述a.算术均数,简称均数(mean):主要适用于对称分布或偏度不大的资料,尤其适合正态分布资料。
不能用于开口型资料。
u(总体均数),X(样本均数)。
b.几何均数(geometric mean,G):适用于经对数转换后呈对称分布。
观察值不能为0 、不能同时有正有负。
同一资料算得的几何均数小于算术均数。
c.中位数(median, M)和百分位数(precentile, Px):适用于各种分布类型资料。
当计量资料适合计算均数或几何均数时,不宜用中位数表示其平均水平。
用频数表法计算百分位数时,组距不一定要相等。
P x=L x+i x(n∗x%−∑f L)f xL x:第x百分位数所在组段的下限i x:第x百分位数所在组段的组距f x:第x百分位数所在组段的频数∑f L:第x百分位数所在组段上一组段累计频数d.调和均数(harmonic mean,H):适用于表达呈极严重的正偏态分布资料的平均水平。
计算方法为求倒数的均值后再取其倒数。
SPSS:在Transform中输入公式。
2.离散(dispersion)趋势的描述a.极差(range,R):也称为全距。
b.四分位数间距(quartile range,Q):即统计图中箱子的高度,常用于偏态资料离散度的描述,多与M 合用。
2024年度-医学统计学重点笔记一复习必备

即标准正态分布,当样本量足够大时(n>30),t分布近似u分布。
14
总体均数置信区间估计
置信区间的概念
按一定的置信水平(1-α),根据样 本统计量估计总体参数所在的范围。
置信区间的计算
根据样本均数、标准差和样本量计算 置信区间。常用的置信水平为95%和
99%。
置信区间的意义
表示总体参数有100(1-α)%的可能性 落在此区间内。
适用条件
01
R×C列联表资料,即多行多列列联表,用于分析两个多分类变
量之间的关联。
检验统计量
02
卡方值,计算公式为χ2=∑(O-E)2/E,其中O为观察频数,E为
理论频数。
拒绝域
03
根据自由度和显著性水平确定拒绝域,自由度为(R-1)(C-1)。
29
配对设计四格表资料卡方检验
01
适用条件
配对设计四格表资料,即两个相 关样本的二分类变量之间的关联 分析。
26
06
卡方检验
27
四格表资料卡方检验
适用条件
四格表资料,即2×2列联表,用于分析两个二分类变量之间的关联。
检验统计量
卡方值,计算公式为χ2=(ad-bc)2N/(a+b)(c+d)(a+c)(b+d),其 中N为样本总量。
拒绝域
根据自由度和显著性水平确定拒绝域,自由度为1。
28
R×C列联表资料卡方检验
正态分布在医学中的应用 许多医学指标如身高、体重、血压等服从或近似服从正态 分布;在估计医学参考值范围、质量控制等方面有广泛应 用。
正态性检验方法 图形法(直方图、P-P图、Q-Q图)、计算法(偏度系数 和峰度系数检验、Shapiro-Wilk检验、KolmogorovSmirnov检验等)。
医学统计学知识点

医学统计学知识点医学统计学是应用统计学原理和方法于医学领域的一门学科,通过对医学数据的收集、整理、分析和解释,可以帮助医学研究者和临床医生更好地理解和应用医学知识。
本文将介绍一些医学统计学中的重要知识点。
一、数据的类型在医学统计学中,我们常常需要处理各种类型的数据,其中最常见的数据类型包括:1. 定性数据:也称为分类数据,指描述事物性质或属性的数据,如性别、疾病类型等。
2. 定量数据:也称为连续数据,指可以用数字进行度量的数据,如身高、体重、血压等。
3. 二分类数据:指只有两种可能取值的数据,如阳性/阴性、生/死等。
4. 多分类数据:指有多种可能取值的数据,如血型、既往医疗史等。
二、描述统计学1. 描述性统计:描述性统计是对数据进行整理、总结和描述的过程,主要包括以下指标:- 频数与频率:频数是指某一数值在数据集中出现的次数,频率是频数与数据总数的比值。
- 中心趋势指标:包括均值、中位数和众数,用于描述数据的集中程度。
- 离散程度指标:包括标准差、方差和四分位差等,用于描述数据的分散程度。
2. 绘图方法:绘图是描述性统计的重要手段之一,常用的绘图方法包括:- 饼图:用于展示分类数据的比例关系。
- 条形图:用于展示不同类别之间的数量关系。
- 箱线图:用于展示数据的分布情况和异常值。
- 散点图:用于展示两个变量之间的相关性关系。
三、推断统计学推断统计学是从样本中得出总体特征的方法,通过对样本数据的分析来进行推断。
其中的重要概念和方法包括:1. 总体与样本:总体是我们研究的对象的全体,样本是从总体中选取的一部分。
2. 参数与统计量:参数是总体的特征值,统计量是样本的特征值,通过统计量来估计参数。
3. 抽样分布:抽样分布是样本统计量的概率分布,常用的抽样分布包括正态分布和t分布。
4. 假设检验:假设检验是通过对样本数据进行统计推断,判断总体参数是否满足某个假设。
5. 置信区间:置信区间是对总体参数的一个范围估计,常用于估计总体均值和总体比例。
医学统计学知识点

第一章绪论1、统计学,是关于数据收集、整理、分析、表达和解释的普遍原理和方法。
2、研究对象:具有不确定性结果的事物。
3、统计学作用:能够透过偶然现象来探测其规律性,使研究结论具有科学性。
4、统计分析要点:正确选用统计分析方法,结合专业知识作出科学的结论。
5、医学统计学基本内容:统计设计、数据整理、统计描述、统计推断。
6、医学统计学中的基本概念(1) 同质与变异同质,指根据研究目的所确定的观察单位其性质应大致相同。
变异,指总体内的个体间存在的、绝对的差异。
统计学通过对变异的研究来探索事物。
(2) 变量与数据类型变量,是反映实验或观察对象生理、生化、解剖等特征的指标。
变量的观测值,称为数据分为三种类型:定量数据,也称计量资料,指对每个观察单位某个变量用测量或其他定量方法准确获得的定量结果。
(如身高、体重、血压、温度等)定性数据,也称计数资料,指将观察单位按某种属性分组计数的定性观察结果。
包括二分类、无序多分类。
(进一步分为二分类和多分类,如性别分为男和女,血型分为A、B、O、AB等)有序数据,也称半定量数据或等级资料,指将观察单位按某种属性的不同程度或次序分成等级后分组计数的观察结果,具有半定量性质。
统计方法的选用与数据类型有密切的关系。
(3)总体与样本总体,指根据研究目的确定的所有同质观察单位的全体,包括所有定义范围内的个体变量值。
样本,是从研究总体中随机抽取部分有代表性的观察单位,对变量进行观测得到的数据。
抽样,是从研究总体中随机抽取部分有代表性的观察单位。
参数,指描述总体特征的指标。
统计量,指描述样本特征的指标。
(4)误差误差,指观测值与真实值、统计量与参数之间的差别。
可分为三种:系统误差,也称统计偏倚,是某种必然因素所致,不是偶然机遇造成的,误差的大小通常恒定,具有明确的方向性。
随机测量误差,是偶然机遇所致,误差没有固定的大小和方向。
抽样误差,是抽样引起的统计量与参数间的差异。
抽样误差主要来源于个体的变异。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
copyright @ vivian.cat
2
(X - X) 注意对比: S n -1 (X - ) N
2、μ是位置参数,σ是变异参数。 描述方法:N(μ,σ2) 3、曲线下面积的意义:X1~X2 出现的概率。 μ±σ 68.3% 95% 99%
2
异的标准差。 X
n
实际工作中总体标准差σ 未知, ,用样本的标准 差 S 代替: S X
(X u / 2 S X
,X
u / 2 S X)
若σ已知,则可简化为
(X u / 2 X
,X
u / 2 X)
u0.05 1.96 , u0.01 2.58
Chapter 5 假设检验
假设检验(hypothesis test ) : 目的:比较总体参数有无差别 基本思想:首先对所需比较的总体提出一个无差 别的假设,然后通过样本数据推断是否拒绝这一假 设。 基本方法:反证法和小概率事件。 基本步骤: 1、建立假设和确定检验水准 无效假设( null hypothesis) :H0: μ=μ0( 或μd=0) , 总体均数无差别。 备择假设( alternative ~) :H0: μ≠μ0( 或μd≠0) , 总体均数有差别 假设有单侧和双侧两种。应用单侧检验一定要有 过硬的专业知识。一般选用双侧检验,因为双侧检验 得出有显著差别的结论,单侧检验结论也一定是显著 差别;然而反之不亦然。 检验水准亦称显著性水准(significance level) , 用α表示,是预先设定的拒绝域的概率值。一般取 0.05。 2、选择检验方法和计算检验统计量 t u 来自正态分布(或近似)的小样本(n<50) 1、无论何种分布的大样本(n≥50 时) 2、σ已知的正态分布小样本
copyright @ vivian.cat 小排序后,分成四个数目相等的段落,每个段落观察 值的数目占总例数的 25%。 去掉两端含有极端数值的 25%,取中间的 50%的观察值的数据范围即为~。 越大则数据变异越大。适用于偏态分布。 Q=P75 - P25 离均差平方和( sum of square of deviation ) :
应用
1、表示观察值变异程 度 2、结合样本均数描述 正态分布资料特征, 确 定医学参考值范围 3、计算标准误 4、计算 CV
n↑
趋于稳定(σ)
逐渐减小
Chapter 4 抽样误差与可信区间
中心极限定理:在样本含量很大的情况下(n≥ 50) ,无论样本测量量(X)服从什么分布,样本均数 标准误(公式)的意义: 1、与标准差的联系:在样本含量一定的情况下, 标准误与标准差成正比。 (1)当观察值的变异(标准差)较小时,样本均数 之间的抽样误差较小,抽到的样本均数与总体均 属可能相差较小,用 X 估计μ的可靠性较好
F 检验: 条件:表格略 1、H0:各组总体均数相同, H1:各组总体均数不全相同 2、 F
| X - |。
,SS,S
S lgX Q, R CV
小概率事件: P≤0.05 (有统计学意义) 或 P≥0.01 (有高度统计学意义) 。
Chapter 2 集中趋势的统计描述
手工整理资料频数表(frequency table)的步骤: 1、求极差(全距) 2、确定组数、组距 参考组距=全距 / 组数 3、确定组段 4、手工编制划记表 直方图(histogram ) : 高度:各组的频数 纵轴 宽度:组距 横轴表示组限
x- S/ n
服
n 1 的 t 分布。
t 的大小与α、自由度有关。 可信区间的计算:
(X t / 2 , S X
,X
t / 2 , S X)
F
1、独立的,水平 k≥3
4
医学统计学 重点 (2005 级 六年制)
copyright @ vivian.cat
方差 分析
2 ( X) SS (X - X) X n 2 2
X 1、算术均数(mean) :X
n
f X 2、加权均数: X
n
3、几何均数:
G lg1
lg X ,G lg1 f lg X M
n n
中位数 (m edian ) : 观察值按照从小到大排列时, 居中心位置的数值。 适用于 1、分布明显成偏态时,2、频数分布的一 端或两端无确切数值时。不便于统计计算。
2
非参
X1 X 2
2 S1 /n1 S 2 2 / n2
1.96 , u0.01 2.58
P 值的意义:假设检验下结论的主要依据,指在 原假设成立的条件下,观察到的样本差别是由机遇所 致的概率。 结论: 1、p<α,样本数据差异显著,有统计学意义, 拒 绝 H0,接受 H1 2、P>α,样本数据差异不显著,无统计学意义, 根据现有样本不足以拒绝 H0(不等于接受 H0) 。 单样本的 t 检验: 条件:μ, X ,S,n 1、H0:μ=μ0 ,α=0.05,双侧检验
总体方差
S
2
标准差(standard deviations ) :
S S2
SS
适用于近似正态分布。 p.s.1、可用于合并资料的直接计算 2、与均数结合可以完整概括一个正态分布。 变异系数(CV ) :用于均属相差交大或单位不同 的几组数据观察值的比较。
n x% f L PX L x ( ) i fx
2、均来自于正态分布的总体 3、方差齐 推断 2 个或 2 个以上总体率、构成比之间的 差别 1、总体分布偏态或未知 2、个别数据偏大或某段不确定 3、等级资料 3、确定 P 值、做出统计推断结论 3、 u0.05 成组设计实验的两样本均数比较 条件:n1,n2, X 1, X 2,S1,S2 1、H0:μ1=μ2 , 2、u=
单位不同或均数差别大
医学统计的资料类型:计量资料、计数资料、等 级分组资料 医学统计学的对象:有变异的事物 总体和样本: 总体(population )的特性:同质性、大量性、 差异性。
抽样
总体
样本
均数(average ) : 适用:对称分布或偏度不大的资料,尤其适合正 态分布。
1
推断
参数
统计量
医学统计学 重点 (2005 级 六年制)
(X - X) n -1
S ) n
x-
标准差较小, 表示观察 小,表明样本均数围绕 值围绕均数波动较小, 总体均数的波动较小, 说明样本均数代表性 好 说明样本均数可靠性 好 1、估计样本均数抽样 可靠程度 2、估计总体均数的可 信区间 3、进行假设检验 Nhomakorabea。
医学参考值范围(reference value range )的 制定方法: 1、选择足够数量的正常人作为参照样本 2、对选定的参照样本进行准确的测定 3、决定取单侧范围还是双侧范围值 4、选择适当的百分范围 5、估计参考值范围的界限
S 100% X
正态分布(norm al distribution ) : 1、正偏态分布:高峰向左,长尾向右 负偏态分布:高峰向右,长尾向左。 2、μ和σ是正态分布总体的两个参数,对应样本 统计量中的 S 和 X。实际应用中μ和σ通常未知,可以 将 S 和 X 作为总体参数的估计量使用。
2
医学统计学 重点 (2005 级 六年制)
S n
标准差与标准误的区别: 标准差 含义 描述观察值的变异程 度的大小的指标 标准误 描述样本均数的抽样 误差大小的指标
μ±1.96σ (单侧μ±1.645σ) μ±2.58σ(单侧μ±2.33σ)
公式
S S2
SS
2
X
SX
n
(
标准正态分布(standard~ ) :是μ=0,σ=1 的正 态分布。 对于任何参数为μ、σ的正态分布,都可以通过变 量变换转化成标准正态分布: u 意义
医学统计学 重点 (2005 级 六年制)
copyright @ vivian.cat 抽样的要求:代表性、随机性、可靠性、可比性。
Chapter1 基本概念
显著性检验(test of significance) :计算 P 值 医学统计工作的内容: 1、实验设计:最关键最重要 2、收集资料:最基础 原始资料:实验数据 现场调查资料 医疗卫生工作记录 报表 报告卡 质量控制——精度和偏倚 3、整理资料 (1) 资料的逻辑检查(坏数) (2) 一致性检查 (3) 原始数据加工:频数分布表 4、分析资料:统计描述(表、图、离散趋势、 集中趋势)和统计推断 统计描述类型的选择: 集中趋势 对称、正态 对数正态 偏态及其他 μ, x G M 离散趋势
样本的三性:代表性、随机性、可靠性。 可靠性(reliability ) :实验的结果要具有可重复 性。即由科研课题的样本得出的结论所推测总体的结 论有较大的可信度。 两样本间具有:可比性。
误差的类别: 1 、系统误差(system error) :在资料的收集过 程中,由于仪器初始状态没有调零、标准试剂未经矫 正、标准指定偏高或偏低等原因,造成的观察结果的 倾向性的偏大或偏小。必须克服。 2、 随机测量误差( random measurement error) : 在避免系统误差的情况下,由于各种偶然因素的影响 造成对同一对象多次测量值的不一致。 3 、抽样误差(sampling error) :由于抽样造成 的的样本统计量与总体参数之间的差别。不可避免。 样本含量越大,抽样误差越小。如均数的抽样误差:
众数:一组观察值中,出现频率最高的那个观察 值。若为分组资料,则为频率最高组的组中值。适用 于大样本,但粗糙。
CV=
Chapter 3 离散程度的统计描述
离散的表述指标: 1、按间距计算:极差、四分位数间距 2、按平均差距:离均差平方和、方差、标准差、 变异系数 极差(range ,R ) :即全距。粗略。适用于任何 分布。 四分位数间距(quartile ,Q ) :一组观察值按大