数据中异常值的处理方法_总(仅供参照)
数据中异常值的处理方法总

数据中异常值的处理方法总异常值,也称为离群值,是指与其他值相比显著偏离的数值。
异常值可能是由于测量错误、数据输入错误、记录错误或真实的异常情况引起的。
处理异常值是数据预处理的重要步骤之一,其目的是确保数据的准确性和可信度。
本文将介绍一些常见的异常值处理方法。
1.可视化分析法:可视化分析法是最常用的异常值处理方法之一、通过将数据绘制成图表,可以直观地观察到数据中是否存在异常值。
常用的可视化方法包括箱线图和散点图。
箱线图可以显示出数据的分布情况以及异常值的位置。
散点图可以显示出数据之间的关系,通过观察数据点的分布,可以发现异常值所在的区域。
2.统计方法:统计方法是异常值处理的常用方法之一、常见的统计方法包括平均值、中位数、标准差等。
平均值是指所有数据的总和除以数据的个数,中位数是指将所有数据按照大小排序后,位于中间的值。
标准差是一种衡量数据的离散程度的方法。
通过计算平均值、中位数、标准差等统计指标,可以判断是否存在异常值。
3.3σ原则:3σ原则是一种常用的异常值处理方法,也被称为“3倍标准差原则”。
该原则认为,如果一个数据与均值的差值大于3倍的标准差,那么该数据可以被认为是异常值。
通过使用该原则,可以确定数据中的异常值,并进行相应的处理。
4.缺失值填充法:缺失值填充法是一种常用的异常值处理方法。
当其中一数据缺失时,可以通过填充其他相关数据来恢复缺失值。
常用的缺失值填充方法包括平均值填充、中位数填充和众数填充。
平均值填充是指用数据的平均值来填充缺失值。
中位数填充是指用数据的中位数来填充缺失值。
众数填充是指用数据的众数来填充缺失值。
5.插值法:插值法是一种常用的异常值处理方法。
它通过在已有数据之间进行插值,来预测缺失数据的值。
常见的插值方法包括线性插值、多项式插值和样条插值。
线性插值是指通过已知点的线性关系来求取缺失值。
多项式插值是指通过已知点的多项式函数来求取缺失值。
样条插值是指通过已知点的样条函数来求取缺失值。
数据中异常值的处理方法-总

数据中异常值的处理方法-总数据中异常值的检测与处理方法一、数据中的异常值各种类型的异常值:数据输入错误:数据收集,记录或输入过程中出现的人为错误可能导致数据异常。
例如:一个客户的年收入是$ 100,000。
数据输入运算符偶然会在图中增加一个零。
现在收入是100万美元,是现在的10倍。
显然,与其他人口相比,这将是异常值。
测量误差:这是最常见的异常值来源。
这是在使用的测量仪器出现故障时引起的。
例如:有10台称重机。
其中9个是正确的,1个是错误的。
有问题的机器上的人测量的重量将比组中其他人的更高/更低。
在错误的机器上测量的重量可能导致异常值。
实验错误:异常值的另一个原因是实验错误。
举例来说:在七名跑步者的100米短跑中,一名跑步者错过了专注于“出发”的信号,导致他迟到。
因此,这导致跑步者的跑步时间比其他跑步者多。
他的总运行时间可能是一个离群值。
故意的异常值:这在涉及敏感数据的自我报告的度量中通常被发现。
例如:青少年通常会假报他们消耗的酒精量。
只有一小部分会报告实际价值。
这里的实际值可能看起来像异常值,因为其余的青少年正在假报消费量。
数据处理错误:当我们进行数据挖掘时,我们从多个来源提取数据。
某些操作或提取错误可能会导致数据集中的异常值。
抽样错误:例如,我们必须测量运动员的身高。
错误地,我们在样本中包括一些篮球运动员。
这个包含可能会导致数据集中的异常值。
自然异常值:当异常值不是人为的(由于错误),这是一个自然的异常值。
例如:保险公司的前50名理财顾问的表现远远高于其他人。
令人惊讶的是,这不是由于任何错误。
因此,进行任何数据挖掘时,我们会分别处理这个细分的数据。
在以上的异常值类型中,对于房地产数据,可能出现的异常值类型主要有:(1)数据输入错误,例如房产经纪人在发布房源信息时由于输入错误,而导致房价、面积等相关信息的异常;在数据的提取过程中也可能会出现异常值,比如在提取出售二手房单价时,遇到“1室7800元/m 2”,提取其中的数字结果为“17800”,这样就造成了该条案例的单价远远异常于同一小区的其他房源价格,如果没有去掉这个异常值,将会导致整个小区的房屋单价均值偏高,与实际不符。
异常值处理的四种方法

异常值处理的四种方法异常值是数据分析中常见的问题,它们可能是由于测量误差、数据输入错误或其他原因导致的。
异常值对数据分析的结果有很大的影响。
因此,处理异常值是数据分析的一个重要环节。
本文将介绍四种常见的异常值处理方法。
一、删除异常值删除异常值是最常见的异常值处理方法之一。
该方法是将数据集中的异常值删除,然后重新计算统计指标。
这种方法的优点是简单易行,但也有一些缺点。
首先,删除异常值可能会导致数据集的大小减小,从而影响统计分析的准确性。
其次,删除异常值可能会导致数据集的偏差,从而影响数据分析的结果。
二、替换异常值替换异常值是另一种常见的异常值处理方法。
该方法是将异常值替换为数据集中的其他值,例如平均值、中位数或众数。
这种方法的优点是可以保留数据集的大小和形状,从而减少数据集的偏差。
但是,替换异常值可能会导致数据集的平均值、中位数或众数等统计指标发生变化,从而影响数据分析的结果。
三、离群值检测离群值检测是一种用于识别异常值的方法。
该方法是通过统计学方法或机器学习方法来识别数据集中的异常值。
常用的离群值检测方法包括箱线图、Z分数、Tukey方法和LOF方法等。
这种方法的优点是可以准确地识别异常值,从而提高数据分析的准确性。
但是,离群值检测可能会导致一些正常值被错误地标记为异常值,从而影响数据分析的结果。
四、分组处理分组处理是一种将数据集分组并分别处理的方法。
该方法是将数据集中的异常值分组,并对每个组进行单独的处理。
例如,可以将数据集按照年龄、性别、职业等因素分组,并对每个组进行单独的处理。
这种方法的优点是可以保留数据集的大小和形状,从而减少数据集的偏差。
但是,分组处理可能会导致数据集中的某些组大小太小,从而影响数据分析的结果。
综上所述,异常值处理是数据分析的一个重要环节。
不同的异常值处理方法有不同的优缺点,需要根据具体情况选择合适的方法。
在实际应用中,可以根据经验和领域知识来选择合适的方法,并结合多种方法进行处理,以提高数据分析的准确性和可靠性。
数据分析中的异常值处理方法

数据分析中的异常值处理方法引言:在数据分析的过程中,异常值是一种常见的问题。
异常值指的是在数据集中与其他数据明显不同的观测值。
异常值的存在可能会对数据分析的结果产生严重的影响,因此在进行数据分析之前,我们需要对异常值进行处理。
本文将介绍几种常见的异常值处理方法,并对其优缺点进行分析。
一、标准差法标准差法是一种常见的异常值处理方法。
该方法基于数据的标准差,将与平均值相差较大的观测值视为异常值。
具体步骤如下:1. 计算数据的平均值和标准差;2. 根据平均值和标准差,确定异常值的阈值范围;3. 将落在阈值范围之外的观测值视为异常值。
标准差法的优点是简单易行,适用于大部分数据集。
然而,该方法的缺点在于对数据分布的假设较为严格,对于非正态分布的数据集可能会产生误判。
二、箱线图法箱线图法是另一种常见的异常值处理方法。
该方法基于数据的四分位数,将位于箱线图上下限之外的观测值视为异常值。
具体步骤如下:1. 绘制数据的箱线图;2. 根据箱线图上下限,确定异常值的阈值范围;3. 将落在阈值范围之外的观测值视为异常值。
箱线图法的优点是对数据分布的假设较为宽松,适用于各种类型的数据集。
然而,该方法的缺点在于对数据分布的假设较为粗略,可能会将一些正常的观测值误判为异常值。
三、3σ法3σ法是一种基于正态分布的异常值处理方法。
该方法假设数据服从正态分布,将与平均值相差3倍标准差以上的观测值视为异常值。
具体步骤如下:1. 计算数据的平均值和标准差;2. 根据平均值和标准差,确定异常值的阈值范围;3. 将落在阈值范围之外的观测值视为异常值。
3σ法的优点是基于正态分布的假设,适用于符合正态分布的数据集。
然而,该方法的缺点在于对数据分布的假设较为严格,对于非正态分布的数据集可能会产生误判。
四、局部离群因子法局部离群因子法是一种基于数据密度的异常值处理方法。
该方法通过计算观测值与其邻近观测值的距离,将距离较远的观测值视为异常值。
具体步骤如下:1. 计算每个观测值与其邻近观测值的距离;2. 根据距离,确定异常值的阈值范围;3. 将距离超过阈值范围的观测值视为异常值。
异常数据处理常用技巧介绍

异常数据处理常用技巧介绍异常数据处理常用技巧介绍1. 异常数据的定义异常数据,也称为离群点或异常值,是指与数据集中的其他数据明显不同的数据点。
它们可能是由于测量误差、数据录入错误、设备故障、不完整数据或真实世界中的罕见事件而产生的。
处理异常数据是数据分析中的重要任务,因为它们可能对结果产生不良影响。
2. 异常数据处理的重要性处理异常数据的目的是识别和纠正异常值,以确保数据分析的准确性和可靠性,并提高模型的预测能力。
如果不对异常数据进行处理,它们可能导致错误的结论、不准确的预测或对模型的性能产生负面影响。
3. 异常数据处理的常用技巧以下是几种常用的技巧,可用于处理异常数据:3.1 识别异常数据需要识别数据集中的异常数据。
可以使用统计方法、可视化方法或机器学习算法来辅助确定异常数据。
统计方法包括使用均值和标准差来识别超出正常范围的数据点。
可视化方法可使用箱线图、直方图或散点图来可视化数据分布,从而帮助发现异常数据。
机器学习算法可以使用聚类或异常检测算法来自动识别异常数据。
3.2 删除异常数据删除异常数据是最简单和最常见的处理方法。
如果异常数据是由于数据录入错误或测量误差导致的,可以将其从数据集中删除。
然而,在删除异常数据之前,需要仔细考虑异常数据的原因以及删除它们对分析的影响。
3.3 替换异常数据替换异常数据是一种常见的方法,可以用数据集中的其他值来代替异常值。
替换异常数据的方法包括使用均值、中位数、众数或回归模型来估计异常值。
需要根据数据的性质和分布选择合适的替换方法,并进行仔细的评估和验证。
3.4 剔除异常数据剔除异常数据是一种更严格的处理方法,可以将异常数据视为干扰,完全从数据集中剔除。
这种方法适用于异常数据对分析结果造成极大影响的情况,但需要慎重使用,因为可能剔除了有用的信息。
3.5 分箱处理异常数据分箱处理异常数据是一种将异常数据放入合适的箱子或类别中的方法。
分箱可以根据数据的特点和分布进行划分,将异常值与普通值分开,从而提高模型的鲁棒性。
机器学习中的异常值处理技巧(Ⅰ)

机器学习中的异常值处理技巧异常值是指在数据集中不符合正常规律的数据点,它可能是由于测量误差、数据录入错误或者真实情况下的罕见事件所造成的。
在机器学习中,异常值会对模型的训练和预测产生不良影响,因此需要对异常值进行合理的处理。
本文将介绍机器学习中常用的异常值处理技巧,并探讨它们的优缺点。
1. 标准差方法标准差方法是一种最简单的异常值处理技巧,它基于数据点的标准差来判断是否为异常值。
具体来说,如果一个数据点的数值与整个数据集的平均值相差超过3倍标准差,那么就认为它是一个异常值。
这种方法简单易行,但是对数据分布要求较高,且对极端值的处理不够准确。
2. 箱线图方法箱线图方法利用数据的四分位数来判断异常值。
通过计算上四分位数(Q3)与下四分位数(Q1)的差值(IQR),然后将倍IQR加到Q3上,将倍IQR减去Q1,得到异常值的范围。
数据点超出这个范围的就被认为是异常值。
这种方法对数据分布的要求较低,且对极端值的处理相对准确,因此在实际应用中较为常见。
3. 离散值处理有时候,异常值可能是由于数据录入错误所造成的,这种情况下,可以考虑将异常值进行修正或者删除。
修正的方法包括用均值或者中位数替代异常值,或者进行插值处理。
而删除的方法则是直接将异常值从数据集中剔除。
这种方法适用于少量异常值的情况,但是需要谨慎处理,以免影响整体数据的准确性。
4. 高斯分布方法高斯分布方法是一种基于正态分布的异常值处理技巧。
它通过计算数据的均值和标准差,然后利用正态分布的性质来判断数据点是否为异常值。
这种方法对数据分布的要求较高,但是对于符合正态分布的数据集,效果较好。
5. 孤立森林方法孤立森林方法是一种基于集成学习的异常值处理技巧。
它通过构建随机森林模型,利用数据点在树中的深度来判断其异常程度。
这种方法对于大规模数据的处理效果较好,但是计算复杂度较高。
综上所述,异常值处理是机器学习中的重要问题,合理的异常值处理技巧能够提高模型的准确性和鲁棒性。
数据处理中常见的错误和解决方法(一)

数据处理中常见的错误和解决方法一、数据清洗中的错误数据清洗是数据处理的第一步,也是最关键的一步。
在数据清洗过程中,常见的错误包括数据丢失、重复数据、错误数据和异常数据。
1. 数据丢失问题数据丢失是指在数据采集或传输过程中,由于各种原因导致部分数据无法获取或传输过程中丢失。
例如,在大规模数据采集任务中,由于网络故障或采集程序错误,可能导致部分数据丢失。
解决这个问题的方法是定期备份数据并进行错误处理。
当发现数据丢失时,可以根据备份的数据进行恢复或重新采集数据。
2. 重复数据问题重复数据是指在数据集中存在多个相同的数据记录。
这可能是由于数据采集、传输或存储过程中的重复操作导致的。
解决重复数据的方法可以是使用数据去重算法对数据进行去重操作,例如使用哈希算法对数据进行唯一性判断,并删除重复数据。
3. 错误数据问题错误数据是指数据中存在不符合规范或不合理的数据。
例如,数字类型的数据中包含了非数字字符,或者日期格式不正确,或者数据类型不符合预期。
解决错误数据的方法可以是使用数据校验算法对数据进行检查,例如使用正则表达式进行数据格式验证,或者使用统计方法进行异常值检测。
4. 异常数据问题异常数据是指与其他数据明显不一致的数据。
例如,在一个身高数据集中,出现了一个异常的极高数值,明显超过了正常范围,这可能是数据采集或输入过程中的错误。
解决异常数据的方法可以是使用统计方法进行异常值检测,例如使用3σ原则判断数据是否异常,并进行处理或删除。
二、数据转换中的错误数据转换是将原始数据转化为目标数据形式的过程。
在数据转换过程中,常见的错误包括数据类型转换错误、缺失值处理错误和数据归一化错误。
1. 数据类型转换错误数据类型转换错误是指在数据转换过程中,将数据转换为错误的类型。
例如,将字符串类型的数据错误地转换为数字类型,或者将日期类型的数据错误地转换为字符类型。
解决数据类型转换错误的方法是在转换过程中进行类型判断和错误处理,例如使用try-catch机制捕获类型转换异常,并进行相应的处理。
异常值处理的四种方法

异常值处理的四种方法异常值,也称为离群值,是指在一组数据中与其他数据显著不同的数值。
异常值的出现可能是由于测量误差、数据输入错误、系统故障或者真实存在的特殊情况等原因造成的。
在数据分析中,异常值会对结果产生影响,因此需要进行异常值处理。
本文将介绍四种常见的异常值处理方法。
一、删除异常值删除异常值是最简单的处理方法之一,直接将异常值从数据中删除。
这种方法适用于异常值数量很少的情况,删除后对数据分析结果的影响很小。
但是,如果异常值数量较多,删除后可能会导致数据量减少,从而影响分析结果的准确性。
二、替换异常值替换异常值是指用其他数值替换异常值。
替换的方法有多种,如用该变量的平均值、中位数或者众数替换异常值。
这种方法适用于异常值数量较多的情况,可以保持数据量不变,但如果替换的数值过于接近其他数据,可能会对结果产生误差。
三、分组处理异常值分组处理异常值是将数据按照一定的规则分组,然后对每个组的异常值进行处理。
这种方法可以避免异常值对整体数据的影响,同时可以更好地反映数据的真实情况。
例如,在统计某个城市的房价时,可以将房价按照不同区域分组,然后对每个区域的异常值进行处理。
四、使用统计方法处理异常值使用统计方法处理异常值是一种更为科学的方法,包括基于分布的方法和基于模型的方法。
基于分布的方法是指根据数据分布的特征来判断异常值,常用的方法有箱线图、Z分数法和3σ原则等。
基于模型的方法是指使用模型来判断异常值,例如线性回归模型、聚类模型等。
这种方法可以更好地反映数据的真实情况,但需要一定的统计知识和技能。
综上所述,异常值处理是数据分析中不可避免的一部分。
不同的处理方法适用于不同的情况,需要根据实际情况选择合适的方法。
同时,需要注意处理异常值的原则,不能简单地删除或替换异常值,应该根据数据的特点和分析目的来进行处理,保证数据分析结果的准确性和可靠性。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据中异常值的检测与处理方法
一、数据中的异常值
各种类型的异常值:
•数据输入错误:数据收集,记录或输入过程中出现的人为错误可能导致数据异常。
例如:一个客户的年收入是$ 100,000。
数据输入运算符偶然会在图中增加一个零。
现在收入是100万美元,是现在的10倍。
显然,与其他人口相比,这将是异常值。
•测量误差:这是最常见的异常值来源。
这是在使用的测量仪器出现故障时引起的。
例如:有10台称重机。
其中9个是正确的,1个是错误的。
有问题的机器上的人测量的重量将比组中其他人的更高/更低。
在错误的机器上测量的重量可能导致异常值。
•实验错误:异常值的另一个原因是实验错误。
举例来说:在七名跑步者的100米短跑中,一名跑步者错过了专注于“出发”的信号,导致他迟到。
因此,这导致跑步者的跑步时间比其他跑步者多。
他的总运行时间可能是一个离群值。
•故意的异常值:这在涉及敏感数据的自我报告的度量中通常被发现。
例如:青少年通常会假报他们消耗的酒精量。
只有一小部分会报告实际价值。
这里的实际值可能看起来像异常值,因为其余的青少年正在假报消费量。
•数据处理错误:当我们进行数据挖掘时,我们从多个来源提取数据。
某些操作或提取错误可能会导致数据集中的异常值。
•抽样错误:例如,我们必须测量运动员的身高。
错误地,我们在样本中包括一些篮球运动员。
这个包含可能会导致数据集中的异常值。
•自然异常值:当异常值不是人为的(由于错误),这是一个自然的异常值。
例如:保险公司的前50名理财顾问的表现远远高于其他人。
令人惊讶的是,这不是由于任何错误。
因此,进行任何数据挖掘时,我们会分别处理这个细分的数据。
在以上的异常值类型中,对于房地产数据,可能出现的异常值类型主要有:(1)数据输入错误,例如房产经纪人在发布房源信息时由于输入错误,而导致房价、面积等相关信息的异常;在数据的提取过程中也可能会出现异常值,比如在提取出售二手房单价时,遇到“1室7800元/m2”,提取其中的数字结果为“17800”,这样就造成了该条案例的单价远远异常于同一小区的其他房源价格,如果没有去掉这个异常值,将会导致整个小区的房屋单价均值偏高,与实际不符。
(2)故意的异常值,可能会存在一些人,为了吸引别人来电询问房源,故意把价格压低,比如房屋单价为1元等等;(3)自然异常值。
房价中也会有一些实际就是比普通住宅价格高很多的真实价格,这个就需要根据实际请况进行判断,或在有需求时单独分析。
二、数据中异常值的检测
各种类型的异常值检测:
1、四分位数展布法
方法[1]:大于下四分位数加1.5倍四分位距或小于上四分位数减1.5倍。
把数据按照从小到大排序,其中25%为下四分位用FL表示,75%处为上四
分位用FU 表示。
计算展布为:L U F F F d -=,展布(间距)为上四分位数减去下四分位数。
最小估计值(下截断点):F L d F 5.1-
最大估计值(上截断点):F U d F 5.1+
数据集中任意数用X 表示,F U F L d F X d F 5.15.1+<<-,
上面的参数1.5不是绝对的,而是根据经验,但是效果很好。
计算的是中度异常,参数等于3时,计算的是极度异常。
我们把异常值定义为小于下截断点,或者大于上截断点的数据称为异常值。
优点:与方差和极差相比,更加不容易受极端值的影响,且处理大规模数据效果很好。
缺点:小规模处理略显粗糙。
而且只适合单个属相的检测。
2、识别不遵守分布或回归方程的值
方法:双变量和多变量离群值通常使用影响力或杠杆指数或距离来衡量,像Mahalanobis 的距离和Cook‘s D 这样的流行指数经常被用来检测异常值。
在
SAS 中,我们可以使用PROC Univariate, PROC SGPLOT ,为了识别异常值和有影响力的观测,我们还研究了STUDENT 、COOKD 、RSTUDENT 等统计指标。
马氏距离法[1]:假设两个变量Xi 和Xj 具有较高的正相关关系,某样本Xk 在这两个变量上的取值为(Xki ,Xkj ),若Xki 远远大于Xi 的平均值,而Xkj 却远小于Xj 的平均值,则这个样品就很可能是异常的。
检验这种异常品可以采用马氏平方距离法。
主要思想是:把n 个P 维样品看作p 维空间中的n 个点,则第i 个样品所对应的坐标为(Xi1,Xi2,…,Xip )。
样品在空间中的相对位置可通过各样品与总体重心(以各变量均值(X1,X2,…,Xp )为坐标的点)之间的距离来求得。
设X(1),X(2),…,X(p)(其中(Xi1,Xi2,…,Xip )为来自Np 中的n 个样品,其中1212(,,...,),(,,...,)p k k k nk X X X X X mean x x x ==
则样品X(i)到重心12(,,...,)p X X X 的马氏平方距离定义为
1
211221122(,,...,)'(,,...,)i i i ip p i i ip p D x x x x x x x x x x x x -=------∑ 其中∑可由样本协方差阵来估计
'()()1
1(,()())1n i i i S S x x x x n ===---∑∑ 容易证明,当n 较大时,2i D 近似服从2p
x 其临界值true D 可由2x 分布表来查出、当2i true D D >=时,将第i 个样品判为异常。
稳健马氏距离:
由于异常值的存在会显著影响中心值和协方差矩阵的估计,使一般马氏
距离不能正确反映各个观测的偏离程度。
对于这类数据,需要通过稳健统计的方法,构建稳定的均值和协方差矩阵统计量。
具体算法:
设数据集为一个n 行p 列的矩阵X n×p ,从中随机抽取h 个样本数据,并计算这个样本数据的样本均值T 1和协方差矩阵S 1。
然后通过)()()(d 111'11T x S T x i i i --=-计算这 n 个样本数据到中心T 1的马氏距离,选出这n 个距离中最小的h 个,再通过这个h 个样本计算样本均值T 2和协方差矩阵S 2。
根据Rousseeuw,Van Driessen(1999)可以证明 det(S 2)≤ det(S 1),仅当T 1=T 2时候等号成立。
这样子不断迭代下去,当 det(S m )≤ det(S m-1)停止迭代。
这时再通过S m 进行加权计算就能求出稳健的协方差矩阵估计量。
(1)确定h 的值。
h 值在0.5n 和n 之间,一般来说h 越小,它的抵抗异常值能力越强,但是最小不能少于50%,因为少于50%已经不能分辨哪些是正常值哪些是异常值,所以作为一种折中,h 默认是取h=0.75*n ,而当样本数量比较少时,h 一般取0.9n 。
(2)如果h=n ,这时计算的是整个样本数据的均值向量和协方差矩阵,返回计算结果并停止。
(3)从n 个样本中随机抽取p+1个样本构造协方差矩阵,并计算其行列式,如果行列式为0,再随机加入一个样本直到行列式不为0,这时这个协方差矩阵为初始协方差矩阵S 0,并利用随机选择出来的样本计算初始样本均值 T 0。
(4)当n 值较小(小于600)时,直接从T 0、S 0计算得到T 1、S 1并开始迭代,。