stata中变量的生成与处理

合集下载

stata结构方程模型分类变量处理

Stata是一种常用的统计分析软件，常用于处理各种统计数据和应用。

在Stata中，结构方程模型（SEM）是一种用于建立和评估多变量关系的统计模型。

在SEM中，我们经常需要处理分类变量，使其适用于模型的分析。

本文将介绍如何在Stata中处理分类变量以进行结构方程模型分析。

一、分类变量的处理方法1. 创建虚拟变量在Stata中，我们可以使用`tabulate`命令来查看分类变量的取值情况，并使用`egen`命令来创建虚拟变量。

假设我们有一个名为“gender”的分类变量，其中1代表男性，2代表女性，我们可以使用以下命令创建虚拟变量：```stataegen male = group(gender)```该命令将创建一个名为“male”的虚拟变量，其中1代表男性，0代表非男性。

2. 使用哑变量处理分类变量除了使用`egen`命令创建虚拟变量外，我们还可以使用`tabulate`命令和`recode`命令来创建哑变量。

假设我们有一个名为“education”的分类变量，其中1代表初中，2代表高中，3代表大学，我们可以使用以下命令创建哑变量：```statatabulate education, gen(edu)recode edu2-edu3 = 0recode edu1 = 1```上述命令将创建三个哑变量，分别代表初中、高中和大学，其中1代表有该学位等级，0代表没有该学位等级。

3. 使用`xi`命令处理分类变量在Stata中，我们还可以使用`xi`命令处理分类变量。

假设我们有一个名为“occupation”的分类变量，其中1代表教师，2代表医生，3代表工程师，我们可以使用以下命令处理该变量：```stataxi: reg ie i.occupation上述命令中的“i.”表示将“occupation”变量视为分类变量进行处理，该命令将对“occupation”变量的每个取值分别进行回归分析。

二、结构方程模型中的分类变量处理在结构方程模型中，分类变量的处理与普通的线性回归模型略有不同。

stata中gen和egen命令 -回复

stata中gen和egen命令-回复Stata中的gen和egen命令：数据管理的利器Stata是一种广泛使用的统计软件，它提供了丰富的数据管理和分析功能。

在Stata中，gen和egen是两个常用的命令，用于生成新变量或进行变量计算。

本文将逐步解析这两个命令，并详细介绍它们的用法和常见应用。

一、gen命令gen是Stata中的一个命令，用于生成新的变量。

它的全称是"generate"，可以通过各种计算和转换来创建新的变量。

具体的语法如下所示：gen newvar = expression其中，newvar是我们要创建的新变量的名称，而expression则是用来计算新变量的表达式。

下面是一些常见的gen命令的使用示例：1. 创建一个连续的编号变量：gen id = _n这行命令将生成一个名为id的新变量，其值等于观测的观测号。

这在需要对样本数据进行编号时非常有用。

2. 根据某一变量的取值创建一个二值变量：gen binary_var = (varname == value)这行命令将根据变量varname的取值是否等于value来生成一个二值变量binary_var，取值为1表示相等，取值为0表示不相等。

3. 创建一个以时间为单位的变量：gen year = date(year)这行命令将根据变量date中的日期值提取出年份，生成一个名为year 的新变量。

通过gen命令，我们可以根据所需的计算和转换操作，轻松地创建新的变量，从而更好地满足数据处理和分析的需求。

二、egen命令egen是Stata中的另一个常用命令，用于进行变量计算和生成。

它的全称是"extended generate"，提供了更多的功能和选项，可以进行更复杂的计算操作。

与gen命令不同，egen命令的输出可以是多个变量。

基本的语法如下所示：egen newvar = function(varlist)其中，newvar是我们要创建的新变量的名称，而function则是所需的计算函数，varlist表示所需计算函数的参数。

stata 生产变量

stata 生产变量
Stata是一种非常流行的数据分析工具，它可以帮助我们进行数据处理、统计分析、建模等操作。

在Stata中，我们可以使用各种命令来生产新的变量，以便更好地进行数据分析。

Stata中最常用的生产变量的命令是generate。

使用generate 命令可以生成一个新的变量，并根据现有的变量进行计算。

例如，我们可以使用generate命令来创建一个新的变量，该变量的值等于原始变量的平方。

另外，Stata还提供了其他一些命令来生成新的变量，例如replace命令、egen命令等。

这些命令可以根据不同的需求进行选择和使用。

在生成变量时，需要注意一些问题。

首先，我们需要确保生成的变量与现有的变量具有相同的观测值数目。

其次，我们需要注意变量类型和变量标签的设置，以便更好地进行数据分析和结果展示。

总之，Stata提供了丰富的命令和工具来生产新的变量，这些变量可以帮助我们更好地进行数据分析和建模，提高我们的研究效果和水平。

- 1 -。

stata 生成条件变量

在Stata中生成条件变量（也称为虚拟变量或指示变量）的步骤相对直接。

虚拟变量常常用于表示分类变量，如性别（男性或女性）、学历（高中、大学等）或其他任何类别数据。

以下是如何为分类变量生成虚拟变量的基本步骤：1. 创建数据集：首先，你需要一个包含你想要转换的分类变量的数据集。

2. 使用tabulate命令：Stata的tabulate命令可以用来生成虚拟变量。

假设你有一个名为gender的分类变量，你可以使用以下命令：stata复制代码tabulate gender, generate(gender_m, gender_f)在这个例子中，gender_m和gender_f是生成的虚拟变量，分别表示男性（1）和女性（0）。

3. 结果解释：运行上述命令后，你会得到每个唯一分类的出现次数。

这些数字实际上就是你的虚拟变量的值。

4. 将结果导入到新数据集中：如果你想将这些虚拟变量添加到一个新的数据集中，可以使用以下命令：stata复制代码gen newvar = .foreach v of var gender_* {replace newvar = $v if`v' == 1}这个命令会创建一个新的变量newvar，并根据你的条件变量设置其值。

5. 注意事项：确保你的分类变量中没有缺失值或未知类别，因为这可能会影响虚拟变量的生成。

6. 其他选项：你还可以使用destring命令将分类变量转换为数值型，但这通常不是创建虚拟变量的标准方法。

对于大多数情况，使用tabulate和generate命令更为直接和简单。

这些步骤应该能帮助你在Stata中生成条件变量。

如果你有特定的情况或更复杂的需求，可能需要进一步的调整。

时间序列模型分析的各种stata命令解读

时间序列模型结构模型虽然有助于人们理解变量之间的影响关系，但模型的预测精度比较低。

在一些大规模的联立方程中，情况更是如此。

而早期的单变量时间序列模型有较少的参数却可以得到非常精确的预测，因此随着Box and Jenkins(1984)等奠基性的研究，时间序列方法得到迅速发展。

从单变量时间序列到多元时间序列模型，从平稳过程到非平稳过程，时间序列分析方法被广泛应用于经济、气象和过程控制等领域。

本章将介绍如下时间序列分析方法，ARIMA模型、ARCH族模型、VAR模型、VEC模型、单位根检验及协整检验等。

一、基本命令1.1时间序列数据的处理1)声明时间序列：tsset 命令use gnp96.dta, clearlist in 1/20gen Lgnp = L.gnptsset datelist in 1/20gen Lgnp = L.gnp2)检查是否有断点：tsreport, reportuse gnp96.dta, cleartsset datetsreport, reportdrop in 10/10list in 1/12tsreport, reporttsreport, report list /*列出存在断点的样本信息*/3)填充缺漏值：tsfilltsfilltsreport, report listlist in 1/124)追加样本：tsappenduse gnp96.dta, cleartsset datelist in -10/-1sumtsappend , add(5) /*追加5个观察值*/list in -10/-1sum5)应用：样本外预测: predictreg gnp96 L.gnp96predict gnp_hatlist in -10/-16)清除时间标识: tsset, cleartsset, clear1.2变量的生成与处理1)滞后项、超前项和差分项 help tsvarlistuse gnp96.dta, cleartsset dategen Lgnp = L.gnp96 /*一阶滞后*/gen L2gnp = L2.gnp96gen Fgnp = F.gnp96 /*一阶超前*/gen F2gnp = F2.gnp96gen Dgnp = D.gnp96 /*一阶差分*/gen D2gnp = D2.gnp96list in 1/10list in -10/-12)产生增长率变量: 对数差分gen lngnp = ln(gnp96)gen growth = D.lngnpgen growth2 = (gnp96-L.gnp96)/L.gnp96gen diff = growth - growth2 /*表明对数差分和变量的增长率差别很小*/ list date gnp96 lngnp growth* diff in 1/101.3日期的处理日期的格式 help tsfmt基本时点：整数数值，如 -3, -2, -1, 0, 1, 2, 3 ....1960年1月1日，取值为 0；1）使用 tsset 命令指定显示格式use B6_tsset.dta, cleartsset t, dailylistuse B6_tsset.dta, cleartsset t, weeklylist2)指定起始时点cap drop monthgenerate month = m(1990-1) + _n - 1format month %tmlist t month in 1/20cap drop yeargen year = y(1952) + _n - 1format year %tylist t year in 1/203）自己设定不同的显示格式日期的显示格式 %d (%td) 定义如下：%[-][t]d<描述特定的显示格式>具体项目释义：“<描述特定的显示格式>”中可包含如下字母或字符c y m l nd j h q w _ . , : - / ' !cC Y M L ND J W定义如下：c and C 世纪值(个位数不附加/附加0)y and Y 不含世纪值的年份(个位数不附加/附加0)m 三个英文字母的月份简写(第一个字母大写) M 英文字母拼写的月份(第一个字母大写)n and N 数字月份(个位数不附加/附加0)d and D 一个月中的第几日(个位数不附加/附加0)j and J 一年中的第几日(个位数不附加/附加0)h 一年中的第几半年 (1 or 2)q 一年中的第几季度 (1, 2, 3, or 4)w and W 一年中的第几周(个位数不附加/附加0)_ display a blank (空格). display a period(句号), display a comma(逗号): display a colon(冒号)- display a dash (短线)/ display a slash(斜线)' display a close single quote(右引号)!c display character c (code !! to display an exclamation point)样式1：Format Sample date in format-----------------------------------%td 07jul1948%tdM_d,_CY July 7, 1948%tdY/M/D 48/07/11%tdM-D-CY 07-11-1948%tqCY.q 1999.2%tqCY:q 1992:2%twCY,_w 2010, 48-----------------------------------样式2：Format Sample date in format----------------------------------%d 11jul1948%dDlCY 11jul1948%dDlY 11jul48%dM_d,_CY July 11, 1948%dd_M_CY 11 July 1948%dN/D/Y 07/11/48%dD/N/Y 11/07/48%dY/N/D 48/07/11%dN-D-CY 07-11-1948----------------------------------clearset obs 100gen t = _n + d(13feb1978)list t in 1/5format t %dCY-N-D /*1978-02-14*/list t in 1/5format t %dcy_n_d /*1978 2 14*/list t in 1/5use B6_tsset, clearlisttsset t, format(%twCY-m)list4）一个实例：生成连续的时间变量use e1920.dta, clearlist year month in 1/30sort year monthgen time = _ntsset timelist year month time in 1/30generate newmonth = m(1920-1) + time - 1tsset newmonth, monthlylist year month time newmonth in 1/301.4图解时间序列1）例1：clearset seed 13579113sim_arma ar2, ar(0.7 0.2) nobs(200)sim_arma ma2, ma(0.7 0.2)tsset _ttsline ar2 ma2* 亦可采用 twoway line 命令绘制，但较为繁琐twoway line ar2 ma2 _t2）例2：增加文字标注sysuse tsline2, cleartsset daytsline calories, ttick(28nov2002 25dec2002, tpos(in)) /// ttext(3470 28nov2002 "thanks" ///3470 25dec2002 "x-mas", orient(vert)) 3）例3：增加两条纵向的标示线sysuse tsline2, cleartsset daytsline calories, tline(28nov2002 25dec2002) * 或采用 twoway line 命令 local d1 = d(28nov2002) local d2 = d(25dec2002)line calories day, xline(`d1' `d2')4）例4：改变标签tsline calories, tlabel(, format(%tdmd)) ttitle("Date (2002)") tsline calories, tlabel(, format(%td))二、ARIMA 模型和SARMIA 模型ARIMA 模型的基本思想是：将预测对象随时间推移而形成的数据序列视为一个随机序列，用一定的数学模型来近似描述这个序列。

stata入门常用命令

stata入门常用命令Stata是一种统计分析软件，在社会科学、医学等研究领域很常用。

以下是Stata入门常用命令：1.数据加载use "文件路径"：加载Stata数据，文件路径为数据文件所在的路径。

describe：显示数据集的变量名、数据类型、缺失值和数据分布等。

2.变量处理generate 变量名=表达式：生成新变量（如指数变量），并可以使用算数、统计和逻辑运算。

replace 变量名=新值：替换某变量中的指定值（如缺失值）为新值。

drop 变量名：删除数据集中的变量。

rename 旧变量名 = 新变量名...：将变量改名。

recode 变量名(包含的值) = 新值：根据变量取值对其离散化。

3.数据子集sort 变量名...：按指定变量排序数据。

by 变量名:...:在一个或多个变量上划分数据集，然后对每个子集应用命令。

if (条件)：指定一个条件，只选取满足条件的数据记录。

merge 命令：将两个或多个数据集根据指定变量进行合并。

4.数据汇总summarize：按变量计算数值统计（如平均值、标准差、中位数和四分位数）。

tabulate 变量名：对变量进行交叉分析，并产生表格输出。

5.数据可视化histogram 变量名：绘制直方图。

scatter 变量名1 变量名2：绘制散点图。

graph 命令：绘制多种类型的图表，例如线图和条形图。

6.线性回归regress 因变量自变量1 自变量2...：通过最小二乘法拟合多元线性回归模型。

test 命令：进行t检验、F检验、方差分析等统计检验。

predict 新变量名：计算回归模型的预测值或残差值，并存储在新的变量中。

7.度量方法计算correlate 命令：计算并存储所有变量的相关系数矩阵。

haase 命令：计算哈斯变换矩阵。

Inflate 命令：计算一个变量的方差膨胀因子和条件数。

8.模态分析（模拟）simulate 命令：用随机抽样模拟数据，计算一个或多个变量的特定函数或方程，并存储结果。

生成虚拟变量的stata命令

生成虚拟变量的stata命令生成虚拟变量的Stata命令Stata是一款常用的统计分析软件，它提供了丰富的功能和命令，用于数据处理和分析。

其中，生成虚拟变量是一项常见的操作，用于将分类变量转换为二进制变量，便于进行统计分析。

本文将介绍在Stata中生成虚拟变量的相关命令及其用法。

一、什么是虚拟变量？虚拟变量，又称为哑变量（dummy variable）或指示变量（indicator variable），是一种用二进制数字表示的分类变量。

它通常用于对某个分类变量的不同类别进行编码，以便在回归分析等统计模型中使用。

二、生成虚拟变量的命令在Stata中，可以使用“tabulate”、“egen”、“xi”和“encode”等命令来生成虚拟变量。

下面将具体介绍这些命令的用法。

1. “tabulate”命令“tabulate”命令用于生成分类变量的频数表，并可以通过指定“generate”选项生成虚拟变量。

例如，假设我们有一个名为“gender”的分类变量，其中包含“男性”和“女性”两个类别，可以使用如下命令生成虚拟变量“male”：```tabulate gender, generate(male)```上述命令将生成一个名为“male”的虚拟变量，其取值为0和1，其中0表示“女性”，1表示“男性”。

2. “egen”命令“egen”命令用于生成新的衍生变量，其中包括生成虚拟变量的功能。

可以使用“egen”命令结合“inlist”函数来生成虚拟变量。

例如，假设我们有一个名为“color”的分类变量，其中包含“红色”、“绿色”和“蓝色”三个类别，可以使用如下命令生成虚拟变量“is_red”：```egen is_red = inlist(color, "红色")```上述命令将生成一个名为“is_red”的虚拟变量，其取值为0和1，其中0表示不是红色，1表示是红色。

3. “xi”命令“xi”命令用于在回归分析中处理分类变量，并可以生成虚拟变量。

stata常用命令

stata常用命令1. 生成变量1.1 gen生成新变量，可以是常数或基于其他变量的一般表达式。

1.2 replace替换已有变量的值。

生成专门函数如总和、均值、标准差等。

2. 数据子集保留指定的变量。

2.2 drop2.3 in子集数据只保留某些被满足条件的观察值。

更加灵活地较大判断条件。

3. 重塑数据3.1 wide将数据在垂直方向与一个变量进行“展开”（unstack）。

4. 数据合并将两个数据集根据一些共同变量进行合并。

5. 数据排序5.1 sort按顺序排列观测值。

5.2 by指定一组变量作为分类变量，然后对该变量使用stata命令。

6. 描述性统计和图形6.1 summarize描述数据集的基本信息。

6.2 tabulate生成列联表。

绘制直方图。

生成散点图。

6.5 twoway可用于绘制多元图形，包括线图、条形图、密度图等。

7. 频数用于表格中简单查看可以因为比较大的变量。

8. 回归分析8.1 regress线性回归分析。

8.2 logistic8.3 probit生成probit模型。

9. 时间序列9.1 tsset使用stata处理时间序列数据的第一步是指定数据集变量中的时间序列。

生成时间序列图。

10. 面板数据使Stata处理面板数据。

10.2 xtreg生成固定效应模型或随机效应模型。

11. 模型诊断使用模型生成新的预测值。

测试线性组合的系数的显著性。

12. 元分析进行元分析。

13. 子样本13.1 markin创建一个新文件并标记子样本。

标记子样本中的索引值。

以上就是stata常用命令，当然并不是所有的命令都一一列举，在实践用stata的经验中可以去发掘能否有更好的命令来使用。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

replace edu=5 if yrsch==15
replace edu=6 if yrsch==16 replace edu=7 if yrsch==21
replace edu=. if yrsch==. | yrsch==-9 replace edu=8 if yrsch==22
replace edu=9 if yrsch==23 tab1 yrsch edu *查看变量的生成是否成功
4.3．生成数值型变量
使用recode, …, gen命令生成新变量
. recode [原变量] （[原变量取值] = [新变量取值]）
① ⑤ ② ⑥ ③ ⑦ ④
*= [其他取值], gen [新变量]
①：给变量重新赋值的命令
②：现有变量的名称
③：现有变量的取值 ④：新变量的取值；③和④是一个整体
• 步骤2：生成感兴趣的变量 . by province: gen order =_n
① ② ③ ④ ①：按province的分类进行排序和计算 ②：生成新变量的基本命令
③：新变量的名称
④：新变量的取值等于同一province内观察值的序次
• 步骤3：使用频数分布查看生成的结果是否正确
. tab order
②：现有变量的名称
③：将现有变量的取值下移一行（[_n-1]）或前移一行（[_n+1]）的基本命令
. gen a = age[_n-1] (1 missing value generated) . gen b = age[_n+1] (1 missing value generated) . list
系统变量 _n
• _n 是指当前的观察值，即独一无二的观测序号，从1到 _N(_N=总样本） • _n是Stata系统内部独特的辨识器，标志从第一个观察值开始直到最后一个观察值（_N）的序列
• _n=1为第一个观测，_n=2为第二个观测，…，_n=_N是最后一个观测
• 该系统变量适于（1）指示观察值；（2）生成系列数值；（3）生成其他变量
3704057503
80
20
boy
3 |
+----------------------------------------------------------+
• 现在想看看每个孩子在省内的排序
使用系统变量_n生成新变量
• 步骤1：对province（即“关键变量”）进行排序
. sort province
replace edu=10 if yrsch==24 | yrsch==27 replace edu=11 if yrsch==25 | yrsch==28 replace edu=12 if yrsch==26 | yrsch==29 replace edu=13 if yrsch==31 replace edu=14 if yrsch==32 replace edu=15 if yrsch==33 replace edu=16 if yrsch==34 replace edu=17 if yrsch==35 replace edu=18 if yrsch==36
⑤：*符号表示所有其他没有列出的数值，包括缺失值；recode与gen 之间有逗号（,）隔开
⑥：生成新变量的命令 ⑦：新变量的名称
• 以本章数据中的变量“yrsch”为例。前面使用gen…replace 的方法在“yrsch” 的基础上生成变量“edu”；现在使用另一种简便的方法生成“edu”
– 由于变量edu已经存在，首源自需要删除该变量：• 数值型变量包括定距和定比变量。可以是整数、小数、负数和正数。数值型变量可以有多种存储方式（ Storage Types）
• 用str类型保存的定性等分类变量也可区分为多种形式，从 str1-str244
Stata的日期变量
• 日期（date）变量是数值型变量的一个特例。它们通常以字符的形式输入(如: 01JAN1992 or 01/01/92)，但必须以数值型数据存储才能有用 • Stata有几个命令可以工作于日期和时间依赖（timedependent）数据 • Stata将所有的日期保存为从1960年1月1日以来的天数或月份、季节等。此前的日期是负值，此后的是正值。SAS使用同样的日期方式，但其起始时间是1582年的10月14日。 Excel使用1900年1月1日为默认起始日。如果读入Excel数据，则以字符型变量输入日期，并重新格式日期
+----------------------------------------------------------------------------+ | province 1. | 2. | 3. | 4. | 21 32 32 35 personid 2106018504 3209163903 3205093703 3505154103 homesize 50 25 246 100 age 5 2 8 18 girl girl boy boy boy siblings 1 0 0 0 order 1 1 2 1 a . 5 2 8 b | 2 | 8 | 18 | 13 |
变量生成的规则（I）
生成新变量、重新定义旧变量时需遵循的一些基本规则： • 变量的名称可长达32个字符，必须以字母、汉字或字符（@，_，#，$等）开头（不能使用空白字符或!、?等特殊字符）。变量最后一个字符不能是句号
• 变量的名称必须唯一，不能有两个相同的变量名
• Stata区分大小写，对大写、小写敏感：Variable 不能写成 variable，反之亦然 • 使用描述性的变量名字：“变量a”这个名称没有任何意义。调查问题是变量名称的很好选择
第四章变量的生成与处理
导论
• Stata 对数据的处理是以变量为前提的 • 若没有需要分析的变量，则Stata将一无用处 • 熟悉变量的内容和分布、生成新变量、改变旧变量等是处理数据的第一步
4.1. 新变量的生成、规则及注意事项
Stata的变量类型
• Stata软件生成三类变量：numeric（数值型）变量，string （字符型）变量（相当于定性变量）和date（日期）变量。虽然日期变量以数值型变量的技术记录、存储，但二者的用途却不同
新变量对原变量的取值重新编码。原变量照旧保存着若无gen（edu）部分，则仅取代原有变量的取值
使用数学表达式生成新变量
生成变量的路径
Data — Create or change variables
生成变量的窗口
Data — Create or change variables — Create new variable
基本命令
Stata有四个基本的生成和修改变量的命令：gen、egen、 replace和recode • . gen和egen分别是generate和extended generate的缩写，它们用于生成新变量
boy boy girl
0 |
0 | 0 | 3 |
6. |
7. | 8. | 9. |
35
45 32 37
3501117305
4526057606 3209163903 3702093304
25
90 25 68
13
10 2 7
girl
girl boy boy
2 |
3 | 0 | 1 |
10. |
37
①：生成新变量或替代现存变量取值的基本命令
②：新变量或其取值将被替换的变量的名称 ③：在gen命令的取值不同于在replace命令的取值 ④：替换原有变量的取值必须满足if指定的条件
*yr of schooling recoded（这是一个注释；*代表注释） gen edu=0 replace edu=1 if yrsch==11 replace edu=2 if yrsch==12 replace edu=3 if yrsch==13 replace edu=4 if yrsch==14
变量生成的注意事项
• 尽量避免使用同一变量名称。换言之，不要使用新变量取代旧变量。保持原始变量有助于检验我们的命令是否正确
• 充分了解原始变量的分布以及每个数值代表的含义
• 遵循不重不漏（exhaustive and mutually exclusive）原则（详见“生成分组变量”一节） • 在变量生成后，将原始变量和新变量的取值进行对比，检查是否有误 • 注意原始变量的缺失值
生成滞后（lag）变量或移前变量（lead）
• 在分析某些类型数据（包括常用的家庭成员数据和纵向数据）的过程中，常常需要根据研究问题将一个样本的取值转移到上一个（或下一个）观察值中。 • . gen a = b[_n-1]
. gen a = b[_n+1]
① ② ③ ①：需要生成的新变量的名称
. drop edu
. recode yrsch 0=0 11=1 12=2 13=3 14=4 15=5 16=6 21=7 22=8 23=9 24 27=10 25 28=11 26 29=12 31=13 32=14 *=.,gen (edu)
–
– –
该命令在原变量yrsch的基础上生成一个新变量（edu)
|----------------------------------------------------------|
2. |
3. | 4. | 5. |
35
32 37 45
3505154103
3205093703 3708156203 4452082404
100
246 60 20
18
8 9 6
boy
使用系统变量_N生成新变量
• 系统变量_N代表样本总数。最后一个样本_n即是_N