用stata
文件CEOSAL2.dta包含了177位首席执行官的数据,可以用来考查企业业绩对CEO薪水的影响。
要求:
1.描述整个数据文件,获得对变量的基本理解。
2.对salary、age、comten、sales、profits、mktval等5个变量进行统计描述,要求必须包含最大值、最小值和平均数3个统计量。
3.要求对研究生和非研究生(变量是grade)CEO进行对比描述。
4.利用箱线图找出salary和log(salary)的可疑异常值。
5.绘制salary和sales的散点图。
6.绘制salary和sales以及salary与profits的散点图,要求前者使用整体样式p9,后者使用整体样式p8.
7.绘制salary和sales以及salary与profits的散点图,要求散点图形状前者选择实心圆,后者选择大写字母X;散点颜色前者选择绿色,后者选择蓝色;散点大小均选择中等。
8.绘制salary和sales以及salary与profits的散点图,要求将图例放置在五点钟方向,同时图例排成一列。
9.通过散点图和曲线图的复合来绘制salary对sales一次线性回归的95%的预测置信区间。
10绘制复合图,包括salary对sales的散点图以及salary对sales的一次拟合图。
gen losalary = log(salary)
graph hbox losalary
5. scatter salary sales
6. scatter sales profits salary, mstyle(p9 p8)
7. scatter sales profits salary, msymbol(O X p) mcolor(green blue black) msize(medium medium medium)
8. scatter sales profits salary, c(l) legend(pos(5) ring(0) col(1) lab(1 “ sales ”) lab(2 “ profits ”)
)
9. quietly regress salary sales
. predict hat
. predict stdf
. generate lo=hat-1.96*stdf
. generate hi=hat+1.96*stdf
. scatter salary sales || line hat lo hi sales , pstyle(p2 p3 p3) sort
作者会了可以发一下吗
不知道你这个问题是否已经解决, 如果还没有解决的话: