统计数字会撒谎ppt

合集下载

《统计数据会说谎》课件

《统计数据会说谎》课件

描述统计数据误导
当描述性统计数据被断章取 义或无视背景时,会导致人 们产生错误的印象。
推断统计数据误导
当推断性统计数据的样本选 取或分析方法存在问题时, 会导致错误的结论。
统计数据的谎言案例分析
案例一:政治民调数据 的谎言
政治民调常常被用来操纵公众 舆论,通过有选择性的数据展 示来达到特定的政治目的。
案例二:商业广告中的 谎言
许多商业广告使用模糊的统计 数据或夸大的效果来误导消费 者,以增加销售量。
案例三:科学实验数据 的谎言
有些科学研究可能受到资金、 压力或偏见的影响,导致其结 果被错误地呈现或解读。
如何辨别统计数据的谎言
1
多方获取信息
通过多个不同的渠道获取信息,以避免过于依赖单一数据源。
2
1 自然观测
通过观察和记录自然现象、行为或事件来收集数据,例如天气变化或动物行为。
2 人工实验
在控制环境中进行的实验来收集数据,例如药物试验或心理学实验。
3 抽样调查
通过随机抽样收集数据,以便代表总体进行统计推断。
统计数据的谎言
误导性统计数据
通过选择性地呈现数据或使 用不正确的统计方法来误导 观众。
《统计数据会说谎》PPT 课件
统计数据是我们生活中无处不在的一部分,它们既普遍又重要。然而,我们 必须认识到统计数据可能存在谎言的问题。
统计数据的类型
描述性统计数据
用于总结和展示数据的特征,例如平均值、中位数和标准差。
推断性统计数据
基于样本数据进行推断以得出总体数据的估计值和结果。

统计数据的来源
调查统计样本
仔细检查统计数据的样本,确保其代表性和可靠性。
3
检查数据来源

统计数字会撒谎

统计数字会撒谎

8. 如何反驳统计资料——真相只有一个
•问题二:他是如何知道的?
数值是否足够大,从而能解释问题?观察值是否足够多,从而保证结论的可靠性? ——对亍许多报告中的内容,通过观察,你会収现由亍缺乏足够多的观测值,报告的内容丌足 以说服仸何人。(前面的抛硬币的栗子)
•问题三:遗漏了什么?
通常,你幵丌会被告知包含了多少观测值,这个数据的缺失,特别当信息来源亍信息存在利害 关系一方时,已足以使你对整件事情提出质疑。比如,当均值不中位数相差甚进时,需要注意 那些没有标明类型的平均数。 很多数据因为没有比较而发得缺乏意义。 Longlongago,x大学开始接收女学生时,一丌赞成异性同校的人做 了一个惊人的报道:x大学1/3的女生嫁给了大学老师!民风狠彪悍 啊。
高露洁广告
广告说啥我信啥
某位统计与家曾经建议,在被告知某个调查的结果时,你需要做的就是反问一句 :“你调查了多少名被访者” 采用严重有偏的样本几乎能够产生仸何人需要的仸何结果。
2. 没有披露的数据——想要什么结果就有什么结果
广告骗术中,怎样才能完全依靠机遇形成毫无指导性的结论呢?答案就是足够小的样本
1. 精心挑选的平均数——我们为什么老是拖后腿
你也来上海啦?
恩,魔都是个好地 方~
实际上,即使我们的工资都丌涨,也有让平均工资涨的方法:假设盖茨和乔布斯
搬来上海,我们的平均工资就会涨到10k啦~~~
1. 精心挑选的平均数——我们为什么老是拖后腿
起码拉高一千咧! 你知道吗?咱拉高了 上海人的平均收入呢
7. 如何进行统计操纵——见证奇迹的时刻
•发换基数还能产生增加折扣的幻觉。 折上折!!!“50%折扣再打20%折扣” =
70% ?
60%
•将一些看似能直接相加却丌能这样操作的事情加在一起,会产生大量的欺骗和隐瞒

《统计与可能性》新人教版小学三年级数学上册21页PPT

《统计与可能性》新人教版小学三年级数学上册21页PPT
50次,摸到红铅笔的 次数比蓝铅笔多。
每次任意摸一枝,摸 50次,摸到红铅笔的 次数比蓝铅笔少。
在布袋里放4枝铅笔,应 该怎样放?
每次任意摸一枝, 摸50次,摸到红铅 笔和蓝铅笔的次数 差不多。
在每个口袋里任意摸一个球,可 能会怎样?你能用线连一连吗?
摸到红 摸到黄 摸到红球和 摸到的
球的可 球的可 黄球的可能 一定是

1、袋子里放3个黄方块,3个红方块。 2、每次任意摸一个方块,摸后放回搅动 共摸20次。 3、小组分好工:谁记录?谁摸?谁摇? 4、完成记录表。 5、抓紧时间,比一比,看哪组合作得又 快又好。
摸方块结果记录表 红方块 黄方块
摸方块结果统计表 合计 红方块 黄方块
次数 30
摸方块统计记录

27、只有把抱怨环境的心情,化为上进的力量,才是成功的保证。——罗曼·罗兰
▪Leabharlann 28、知之者不如好之者,好之者不如乐之者。——孔子

29、勇猛、大胆和坚定的决心能够抵得上武器的精良。——达·芬奇

30、意志是一个强壮的盲人,倚靠在明眼的跛子肩上。——叔本华
谢谢!
21
能性大 能性大 性相等
红球
前几天老师在一个商场门口发现
了这样一种情况:一个人手里拿着一 个布袋,布袋里红、绿两种玻璃球各 5个,只需一一元钱就能玩一次,谁 能在布袋里摸10次,摸10个红球或 10个绿球就奖励10元钱。如果你在 场,你会不会去玩?为什么?

26、要使整个人生都过得舒适、愉快,这是不可能的,因为人类必须具备一种能应付逆境的态度。——卢梭
红色3个 黄色3个
方合第 第 第 第 第 第 第 第

一二三四五六七八

一起学奥数--数字谜(四年级)ppt课件

一起学奥数--数字谜(四年级)ppt课件
【分析】填符号的技巧在于缩小数字范围,或者说,对等号左边的数字进行分组,使一组能够使等 式成立,而另一组为0或1. 我们可以先对1~5进行分组。使一组等于1,另一组等于0或1.由连续数字的性质可以知道,相邻 两数差为1.则剩下三个数在组合成一组。 找4、5为一组,-4+5=1,而1+2-3=0.再把两组数做连接。
得到○代表的数字,“□”就可以通过第二个等式算出:□=4
引导学生对以上变化做小结,让学生了解等式加减。
完整版ppt课件
5
例3、在下列方框中填上适当的数,使等式成立:
1) □÷5=40……3
2)148÷ □=8……4
【分析】根据题目中给定等式的特点,我们可以利用带余数除法的特点来计算代表“□”的数字。
数字谜
风子编辑
完整版ppt课件
1
教育目标
灵活地运用运算法则和整数的性质 学会发现问题、分析问题
教育重点
掌握数字谜解题思路,及数字与数字之间的规律
教育难点
综合运用数论的知识,来解决数字谜问题
完整版ppt课件
2
第一课 横式数字谜
完整版ppt课件
3
例1、下列算式中,△、○、□、☆各代表什么数字?
1) △+ △+ △=129
因为与3相加个位为1的数只有8,所以可以确定第三行个位数 为8。 558÷6=93,所以可以确定除数的个位为3
在□41-551时,产生连续借位,且差最高位为0,所以被除数 最高位为6,余数为83。 被除数的个位是非常清楚的,应该一眼就能够看出为7
接着,只要做837÷93=9即可。
完整版ppt课件
15
1)“□”代表的是被除数,这个等式的意思为:一个数被5除,商为40,余数为3。根据带余数除法 的特点,或者采用还原法, “□”代表的数为:40×5+3=203

《统计数据会说谎》课件

《统计数据会说谎》课件

详细描述
一些学者在研究中为了证明自己的观点,可能会篡改或编造 实验数据,或者选择性地使用部分数据来支持自己的论点, 导致研究结果失真。
05
如何避免统计数据的说谎
提高公众的数据素养
培养对数据的敏感性和批判性思维
01
让公众了解数据的基本概念、特点和局限性,学会从多角度分
析数据,不盲目相信或传播数据。
惕,仔细核实数据的真实性和可靠性。
04
统计数据的说谎案例
媒体报道中的数据误用
总结词
媒体在报道时往往为了制造轰动效应 或引导读者做出某种判断,会选择性 地使用或解读数据,导致数据误导。
详细描述
媒体在报道时有时会忽略数据的背景 信息,只选取部分数据来支持他们的 观点,或者对数据进行断章取义的解 读,使读者产生误解。
数据的选取偏差
总结词
在收集和选择数据时,可能会因为主观因素或外部压力而产生偏差,导致数据不 能客观反映实际情况。
详细描述
数据的选取偏差通常源于对数据的理解不足或偏见,导致只选取符合某种观点或 利益的数据,而忽略其他重要信息。例如,在市场调研中,如果只选择有利于自 己产品的数据,而忽略其他竞争产品的优点,就会产生数据选取的偏差。
损害信任
不准确的统计数据会破坏 人们对数据和信息来源的 信任,影响数据和信息的 公信力。
浪费资源
基于错误数据的决策可能 导致资源的不合理分配, 造成资源浪费。
提高对统计数据的重视和警惕性
增强意识
通过培训和宣传,提高人 们对统计数据重要性的认 识,了解数据质量对决策 的影响。
严格审核
建立数据审核机制,对统 计数据进行严格把关,确 保数据的准确性和可靠性 。
数据解读的误区

爱说假话的危害主题班会PPT课件

爱说假话的危害主题班会PPT课件

坚定做诚实人
诚实是为人之本,我们应牢牢地树立诚实正直的价值观,在日常生活中大力培养诚实的品质,成为一个值得信赖的人。
为未来奠定基础
诚实待人是通向美好人生的基石。我们要从现在开始,用诚实书写人生,给自己和他人一个美好的未来。
诚实是美德
品德高尚
诚实是人类最高尚的品德之一,它体现了一个人内心的品质和道德修养。
受人尊敬
诚实的人往往受到他人的尊重和信任,因为他们的行为与言语一致。
心安理得
诚实的人内心平静,无需隐藏和伪装,可以光明正大地面对生活。
塑造良好形象
诚实的品质有助于树立一个人正直、可靠的公众形象和社会声誉。
选择诚实的好处
获得他人支持
一个真诚待人的人常常能赢得他人的尊重和支持,从而得到更多的帮助和机会。
树立良好形象
诚实守信的品格可以帮助个人树立一个值得信赖的形象,增加他人对自己的认可。
诚实给生活带来的正能量
建立信任
诚实让我们与他人建立深厚的信任关系,增进人际交往。
内心平静
诚实可以让我们内心充满正能量,不必隐藏或欺骗自己。
说谎损害诚信
说谎导致内疚焦虑
说谎遭受谴责
他人难以相信
身心健康受影响
被他人批评谴责
说谎对家人的危害
5
家庭关系
说谎可能造成家庭成员之间的矛盾和误解。
90%
信任破碎
说谎会严重损害家人对自己的信任。
3X
家庭冲突
说谎可能引发家庭成员之间3倍的矛盾冲突。
说谎会给家庭带来重重的负面影响。说谎可能导致家人之间的关系紧张、误解和矛盾加剧。一旦失去家人的信任,修复家庭关系将变得更加艰难。同时,频繁的说谎也会引发家庭成员之间更多的争执和纷争。

不靠谱的统计数字如何欺骗了你?

不靠谱的统计数字如何欺骗了你?【⼀】在这个信息爆炸的时代,我们的周围总是充斥着各种各样的新闻和数据,⽐如“⼴东本科⽣平均⽉薪7000,你拖后腿了吗?”、“北京⼈初婚平均年龄为27岁,结婚越晚越稳定”、“从除⼣开始放假会让很多员⼯觉得浪费⼀天假期”……⾯对这些数字时,你是否会在被戳中痛点后默默回⼀句“我⼜⼀次被代表了”或者“哥⼜拖后退了”?当然,还有⼀些所谓的研究结果甚⾄通过⽹络被快速传播,成为了⼈⼈都知道的“科学”事实:“近视眼戴眼镜会眼球变突”、“家⽤电⼦设备辐射⼤,所以⼿机不要放床头、电脑⼀定要⽤防辐射的机箱,接电话时不要离⽿朵太近”、“碱性体质的孕妇更容易⽣⼉⼦”……这些所谓的“科学”通过“⽤数字说话”的⽅式吸引了你的注意⼒。

可是,客观真实的数字摆在那,我们就能正确认识世界了吗?今天,精读君就为⼤家推荐⼀部美国统计专家达莱尔·哈夫的著作《统计数字会撒谎》,看看我们周围的数据中都暗含了哪些骗局。

作者达莱尔是⼀名⾃由记者,因其1954年出版的这本精彩、⼤为畅销的《统计数字会撒谎》⽽深受数代极客的爱戴。

【⼆】“平均年收⼊10万”,对你来说是什么概念?作为揭露数据造假的经典⼯具书,这本《统计数字会撒谎》在50年代⼀出版,就成为有些⼈的“⼼头⼤患”,他们在全世界对其进⾏围追堵截,就是因为害怕读者看到书中的真相。

它诞⽣之后,不仅被奉为“世界统计学普及读物第⼀畅销书”、“25本投资经典之⼀”、“经典社会学读本”,⽽且被誉为“数据造假曝光宝典”,在世界畅销50年⽽不衰。

达莱尔⽤风趣的插图和通俗的语⾔把⾼深的统计写得像“故事书”⼀样精彩,这种独具⼀格的⾏⽂和编排使得此书更具魅⼒。

此外,书中还揭露了⼤量⾄今仍被销售员、专家、记者或者⼴告撰稿⼈频频使⽤的“⾏骗⼯具”,如:有偏的样本,精⼼挑选的平均数,遗漏某些重要的数据,混淆因果关系,滥⽤⼀维图形等。

更为重要的是,达莱尔在书中破解了如何识破虚假统计数据。

逻辑推理问题--说谎问题 ppt课件

ppt课件 15
问题6:从前有三个和尚,一个讲真话,一个讲假 话,另一个有时讲真话,有时讲假话,一天,一位智 者遇到这三个和尚,他问第一位和尚:“你后面是 哪位各尚?”和尚回答:“讲真话的.”他又问第 二位和尚:“你是哪一位?”得到的回答是:“有 时讲真话,有时讲假话.”他问第三位和尚:“你 前面的是哪位和尚?”第三位和尚回答说:“讲 假话.”根据他们的回答,智者马上分清了他们各 是哪一位和尚,请你说出智者的答案.
ppt课件 7
做好事 姓名
小红做 小华做 小明做 小娟做
小红
小华
×


×

×

×
小明 小娟
合 计 对 错
√ ×
2 2
√ √
3 1
ppt课件
× ×
1 3
√ ×
2 2
8
问题3:在一星期的七天中,狼在星期一、二、 三讲假话,其余各天都讲真话;狐狸在星期四、 五、六讲假话,其余各天都讲真话. ①狼说:“昨天是我说谎日子.”狐狸说:“昨 天也是我说谎的日子.”那么今天星期____? ②一天狼和狐狸都化了装,使人不容易辨认 它们.一个说:“我是狼.”另一个说:“我是狐 狸.” 先说的是_______,这一天是星期_______.
ppt课件 22
从已有的条件看,C当然有可能不在理发店。所以, 我的“证明”肯定是错的。错在哪儿呢?其实, “若A不在则B一定在”和“若A不在则B也一定不在” 并不是互相矛盾的,它们有可能同时成立,并且这 将会告诉我们A一定在。也就是说,正确的推理过程 和由此得出的结论应该是这样的: (1) 如果C不在的话,那么A不在就意味着B一定在; (2) 如果C不在的话,那么A不在就意味着B一定不在; (3) 所以,如果C不在的话,那么A不在就会发生矛盾; (4) 所以,如果C不在的话,那么A一定在。

《美妙统计数据谎言》PPT课件


诡诈的曲线
当一个人在他的头脑里只有数字和图形的时候,他就不能找到踪迹间的因果关系。 ——叔本华 某企业10年销售额飞速增长:
无所不能的调整
110
100
100 101 100.5 102 101.5 103 102.5 101.5 103 105
90
80
70
60
50
40
30
20
10
0
1
2
3
4
5
6
7
——本杰明. ——马克.吐
准确度的假象
统计学是一门完全特别的、完全稀奇古怪的科学。 廉.拉贝(Wilhelm Raabe)
——威
1909年4月6日,美国人罗伯特·埃迪温·皮尔里(Robert E. Peary)到达地球的北极,从而 成为世界上第一个到达北极的人。至少皮尔里本人是相信这一点的。说得确切一些,他希望 全世界的人都相信他所取得的这个结果,所以,他确定了他到达北极的位置是北纬89度57分 11秒,距离北极点大约5公里—这些数据对于皮尔里的实际目标来说已经是一个巨大的成功 了,并且准确地说,这种效果也是他精心策划出来的。
伦敦《时报》(Times)文章“50%的女性被害者是被自己的男朋友或丈夫杀死的” 对婚姻生活的危险性进行了推论。只有约10%的被害妇女是由完全不认识的人谋 杀的,一般来说,犯罪嫌疑人来自受害人的家庭生活圈(特别是在周末或度假中, “这时家庭成员是在一起的”)。 与老年人相比,青少年被误认为是具有较多自杀倾向的一类人群,这一基本判断 就是建立在错误的比较基础上的。一家德国报纸文章“老年时会变得更幸福”分 析论证了下面的结果:在20岁以下的青少年中,自杀在所有死亡中所占的比例最 大,共计25%。而30~40岁的人自杀率占到10%,超过70岁的老年人自杀率不足 2%。“年龄越大,决定自杀的比率就越低,”这家报纸如此写道,因此我们会随 着年龄的不断增长而变得越来越幸福。

第一章 生物统计学基本知识

5
从什么是统计谈起
6
日常生活中,我们常听到很多关于“统计”的词汇. 例如:
▪ 国家统计局公布,2004年全国GDP增长9%,CPI指 数;
▪ 国家气象局预报,明天北京天气阴,降水概率40%;
▪ 2003年,北京市人平寿命77.93岁, 婴儿死亡率为 5.56‰, 儿童计划免疫接种率98%. 这些主要健康 指标已接近或超过中等发达国家的水平.
况下,同一情节大家描述的都差不多,但由于个人写作特
点和习惯的不同,所用的虚词是不会一样的),计算出每
一回里变量出现的次数,用多元分析中的聚类分析法进行
分类,果然将120回分成两类即前80回为一类,后40回为
一类,很形象地证实了不是出自同一人的手笔。
12
后40回出自谁的手笔

之后,这时又找了一本曹雪芹的其它著作,做
了类似计算,结果证实了用词手法完全相同,
断定为曹雪芹一人手笔。

而后40回是否为高鹗写的呢?论证结果推
翻了后40回是高鹗一个人所写。这个论证在红
学界轰动很大,他们用多元统计分析方法支持
了红学界观点,使红学界大为赞叹。
13
统计的误用
▪ 对同样数据为何会有不同反响 ▪ 数据和信息有本质区别 ▪ 有些统计的误用者是无意的,但
生物统计与实验设计
Biological Statistics And Experimental Designs
课程内容:
生物统计与试验设计 所涵盖内容(学科基础,预备课程) 生物统计学基础(统计的眼光看问题) 统计学基本概念 统计推断——参数估计、假设检验 统计分析方法及应用(统计的方法解决问题) 方差分析、回归分析、试验设计等等
图 1-1 120名正常成年男子 红细胞计数直方图
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

是否拥有了更对哪些医务职务的尊敬, 医生就能比其他人掌握更多关于香烟品牌的 资料?是否自身的知识能够促使他们选择危 害性最小的品牌?当然不是,也许你的一生 第一个就会反驳这种观点,但“27%”又仿 佛暗示着能解释一些问题。
相关关系与因果关系
如果B紧跟A出现,那么A一定导致B。这一古老的 谬误然而它仍频繁的出现在统计资料中,并被大量让人印 象深刻的数据所伪装。这在很多人脑海中已根深蒂固,所 以导致很多人陷入陷阱中 。 哈夫先生举了如下的例子:六月是自杀率最高的月 份。那么,是否自杀导致了六月的婚礼—抑或六月的婚 礼促成了被抛弃者的自杀?一个更合理的解释是(同样 未经证实):整整一个冬季,某人抚慰自己沮丧的心情, 并满怀希望春天一切会重新开始。可是到了六月,他仍 没能从低落中解脱出来,于是用自杀表示放弃。
是比较聪明的孩子,彼得是个笨孩子。
对待智力测验以及许多其他类似的抽样结果应注意
它的范围。正常的智商不应该只是100这样一个数值,而 应是诸如90~110的一个范围。将处于这个范围的孩子与 低于或高于此范围的孩子进行比较时会得出一些有用的 结论。但比较相差不大的两个数据则毫无意义。结论: ◆我们可以定量地衡量你的样本能以多大的精度代表总体, 那就是:可能误差和标准误差。 ◆在所有抽样研究中都有误差,忽略这些误差将导致一些
谁说的?即究竟是谁的出的结论。当某个权威人士被引用时,要弄清 楚到底资料的内容是权威的,还是仅仅与权威人士沾边,有些时候数据 是来自权威人士,然而结论却是作者自己得出的。 • 他是如何知道的?即他到底是通过什么渠道得到的,所选样本是否有 偏,样本容量是否足够大,所取样本又是否具有代表性。 • 遗漏了什么?即样本包含多少案例、平均数有没有标明类型、数据有 没有对照组、数据是否够清晰、对照组是否具有对照性。 • 是否有人偷换了概念?即将甲说成乙。 • 这个资料有意义吗?即当所接触的资料是建立在未经证实的基础上, 那么这个 资料毫无意义。
它没有披露的其实是:1、样本容量 2、实验过程 3 、事物整体范围的全距和与平均数偏离水平的数据
这些没有透露的数据,其欺骗性在于经常人们忽略了它
们是否存在。这当然也是它取得成功的奥秘。
彼得和琳达做了公认最好的智力测验——斯坦福-比内 测验,结果是琳达的智商为101,彼得的只有98。专家
告诉我们智商的平均数是100,于是进一步推断,琳达
愚蠢的举动。
◆只有当差别有意义时才能称之为差别。
很多情况下,表格中的数字是禁用的,而文字又不能达到很好的效果,这个 时候解决的方法就只有一种:画图。例如: 国 民 收 入 增 长 图
抹去下面大部分之后:
与之前的图相比,看起来有很大提高
另一种情况是改变横轴与纵轴的的比例关 系: 任何 人看 到之 后都 会觉 得国 民收 入正 在疯 狂增 长

《统计数字会撒谎》这本书是一本看似很浅显的书,
它里面有大量的例子幽默的语言和解析,使读者能够很容易的 理解。但它反映的内容却是很普遍的。在报纸、杂志和书籍中 看到统计材料、结论、以及数据时,应该经过认真思考后再接 受他们。有时候更仔细的一瞥有助于进一步了解真相。但武断
地拒绝统计方法也是因噎废食,不值得提倡。
这本书既告诫统计工作者们要诚实严谨的对待问题, 不可欺骗他人。又告诉人们不要被漫天的各种数据所迷惑,还 要多保持一些理智和清醒,用理性和怀疑的眼光看问题。
以下是几个有关相关性的观点:
1. 所谓“相关”往往是通过相关系数这个精确的数据来证
明两个数据之间具有关联关系,它可以有很多类型: • 机缘巧合下产生的相关 • 联合变动的相关,但无法确定谁因谁果 • 所有变量之间没有任何影响,却存在显著的相关 2. 正相关到了一定的程度后便急剧地转化为负相关 (例如,一般情况下,雨下得越多,谷物长得越好, 收成越好,但超过一定的降雨量,雨越多,收成越 少)。 3. 相关显示了一种趋势,而这种趋势通常并不是那种 理想的一对一关系。 所以,由相关关系来得出因果关系是不理智的,只会 得出一些似是而非的答案,进而让自己陷入谬论。
"1924级的耶鲁毕业生平均年收入为25111美元" 这个数字很大又非常精确,所以作者对此提出了质疑: 没有人能够掌握所有在世的1924级学生的情况,并且许多人
并不愿意回答这些问题。这个样本的代表性强吗?也就是说,
能否假设样本与未被样本包括的那些人-——无法联系的人或 者不愿意回答的人-具有同等的收入水平?结论: •为了结论具有价值一定要采用具有代表性的样本,这样才能避 免各种误差。
•无形的误差与有形的误差一样容易破坏样本的可信度。所以只
要有产生误差的可能,都要对结果保持怀疑。
•最基本的样本是随机样本,它是指完全遵循随机原则从总体 中选出的样本。 •纯随机样本是惟一有足够把握经受统计理论审查的样本,但 难度大成本高。分层随机抽样是一个更经济的替代品。 •一般而言,民意调查都带有一定程度的误差。
利用统计资料传递错误信息来误导他人可称得上是一 种操纵行为,用一个词来概括,那就是统计操纵。统计操 纵的方式分为:
•地图操纵 •模糊不清的平均数 •百分数的应用
把一些看似能直 接相加却不能这 样操作的事情加 在一起会产生大 量的隐瞒和欺诈。
怎样凭借双眼就能识破虚假的统计资料并揭穿它?同样的提出了五 个问题: ,如何在具有欺骗性的数据海洋中找到可靠有用的资料?哈夫 先生提出了五个问题:
正是由于选择的平均数不同,才导致了数值的不同。结论:
当你被告知某个数是平均数时,除非能说出它的具体种类--均值,中位数, 还是众数,否则你对它的具体涵义仍知之甚少。
在处理诸如人类特征的数据时,各种平均数的数值十分接近。
当你看到某个平均收入时,首先问问:是什么的平均?包括了哪些人? 类似的概率和误差范围构成了一个很好的估计。
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
本章举了这样的一个例子:某公司说:“自从使用了 多克斯牌牙膏,我们的蛀牙减少了23%。”其实被测试的 用户仅有12户,并且准备几组人,试验到得到满意的数字 为止。
由此哈夫先生提出“多少才算足够呢?它取决于抽 样是你所研究的总体,其容量有多大,以及变动范围有多 大”。但有时样本中的数量看上去已经足够,但其实并非 如此。对于这种情况就可以用显著性检验方法,如果某条 信息提供了显著性程度,就会对它有更深的了解。
美国与罗坦提亚木匠的平均周工资进行比较,它们分 别是60美元和30美元
画成平面图之后,很显然美国木匠的收入要多得多
图果虽 形的然 滥按两 用体个 的积袋 影算子 响话的 竟高 然度 有之 比 :只 !有 这: 就 是但 平是 面如
1 8 1 2~来自相匹配的资料如果你想证明某事,却发现没有能力办到。那 么试着解释其他事情并假装它们是一回事。在统计 资料与人类思维冲撞所引起的耀眼光芒中,几乎没 有人会发现它们的区别。不相匹配的数据是保证你 处在有利位置上的武器,而且通常如此。你可以得 到你想要的效果而又不必负任何责任。 对著名内科医生香烟品牌的调查结果:27%的 被调查者选择了喉宝—该品牌的比例高于其他品牌。 这个数据也许本身就是虚构的,不用去管它。对于 这种不相关的数据,唯一的回答是:“那又如何?”
房地产商大力宣传,居的年均收入是10000英镑;而该 区域的纳税人委员会却反复强调,这里居民的平均年收入只 有2000英镑。谁在说谎?
算术平均数:指的是所有用户的总收入除以总的用户数量。但是如果基
本都是一般家庭但有几家是富翁的话,得出的数值会变大。
中位数:数值较小,它告诉我们一半家庭的年收入超过2000英镑,另一 半家庭的年收入不及2000英镑。 众数-:所有家庭收入序列中出现次数最多的那个收入。
相关文档
最新文档