statachfs描述性统计结果出问题

我用的chfs19年的数据。
目的:统计家庭股票持有率
把hh和ind两个数据表合并之后设虚拟变量
replace d3101=0 if d3101==2 (d3101代表家庭是否拥有股票账户 有设为1,无设为0)
drop if pline!=1 (仅保留户主数据)
summarize d3101
结果d3101的均值只有0.05,和别人的论文数据12%差了一半,有人可以回答一下吗

该回答引用GPTᴼᴾᴱᴺᴬᴵ
可能有多种原因导致您的统计结果与别人的论文数据不同。以下是一些可能的原因:

  1. 样本不同:可能您的样本与别人的样本不同,导致估计出的持有股票的比例也不同。

  2. 数据处理不同:您和别人可能对数据进行了不同的处理。例如,可能您使用的是不同的数据处理软件或数据处理方法,导致统计结果不同。

  3. 缺失值的处理:在计算统计量时,缺失值的处理方法也可能会影响结果。您可能需要检查数据中的缺失值,并确保在计算统计量时采取了适当的处理方法。

  4. 变量定义的不同:可能您和别人对股票持有的定义不同,导致估计出的比例不同。在这种情况下,您需要检查您的变量定义是否与别人一致,并在计算统计量时使用正确的定义。

综上所述,您需要仔细检查您的数据和代码,以找出问题所在。如果您仍然无法找到原因,请参考相应领域的专家或寻求其他人的帮助。