数据集:
m2 = glmer(object_case ~ number + animacy + order + tense + resultativity + boundedness + (1|verb_lemma),
data = my_dataset, family=binomial(link = "logit"),
control=glmerControl(optimizer = "bobyqa"))
summary(m2)
数据如下
Generalized linear mixed model fit by maximum likelihood (Laplace Approximation) ['glmerMod']
Family: binomial ( logit )
Formula: object_case ~ number + animacy + order + tense + resultativity + boundedness + (1 | verb_lemma)
Data: lra
Control: glmerControl(optimizer = "bobyqa")
AIC BIC logLik deviance df.resid
139.1 173.7 -60.5 121.1 336
Scaled residuals:
Min 1Q Median 3Q Max
-0.5317 0.0000 0.0000 0.0007 0.5398
Random effects:
Groups Name Variance Std.Dev.
verb_lemma (Intercept) 1912 43.73
Number of obs: 345, groups: verb_lemma, 171
Fixed effects:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -45.5773 10.3034 -4.424 9.71e-06 ***
numbersingular 2.4965 2.2802 1.095 0.274
animacyeluta -2.7037 4.8314 -0.560 0.576
animacyinimene -6.2863 5.8948 -1.066 0.286
orderVO -0.8728 2.2550 -0.387 0.699
tensepresent -0.0722 2.5892 -0.028 0.978
resultativityyes 37.1170 7.2732 5.103 3.34e-07 ***
boundednessyes 24.1356 4.3747 5.517 3.45e-08 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Correlation of Fixed Effects:
(Intr) nmbrsn anmcyl anmcyn ordrVO tnsprs rslttv
numbersnglr -0.260
animacyelut -0.443 -0.384
animacyinmn -0.254 -0.292 0.846
orderVO -0.139 -0.106 0.187 0.178
tensepresnt -0.477 0.075 0.442 0.423 0.146
reslttvtyys -0.885 0.329 0.082 -0.106 -0.126 0.271
bounddnssys -0.537 0.370 -0.295 -0.544 -0.023 -0.062 0.680
请问根据这些所得到的数据怎么解释自变量(6个),因变量以及随机变量间的关系?或者有可视化这些数据的必要吗(麻烦给一下代码)?提前感谢帮忙,文科生真的搞不会T_T
根据提供的glmer模型结果,我们可以解释各自变量和因变量之间的关系:
number:这是一个二元变量,其取值为单数或复数。模型结果显示,单数与名词所属的格为nominative之间存在显著的正相关关系,即单数名词更有可能出现在nominative格中。
animacy:这也是一个二元变量,取值为有生命或无生命。模型结果显示,无生命名词更有可能出现在partitive格中,但无生命或有生命对应的系数没有显著差异。
order: 这是一个二元变量,指动词前面的名词是否为宾语。模型结果表明,宾语在partitive格中更有可能出现。
tense: 这是一个二元变量,指动词的时态是否为现在。模型结果表明,现在时态的动词更有可能出现在nominative格中。
resultativity: 这是一个二元变量,指动词是否表达了结果。模型结果表明,表达了结果的动词更有可能出现在nominative格中。
boundedness: 这是一个二元变量,指名词是否有界限。模型结果表明,有界限的名词更有可能出现在nominative格中。
至于随机变量verb_lemma,其系数(43.73)表示不同lemma之间的变异程度。这意味着,同样的自变量取值,在不同的lemma下,因变量的取值可能存在差异。
至于可视化,可以考虑对各自变量和因变量进行可视化分析,比如画出各自变量和因变量之间的散点图或箱线图,以帮助更好地理解它们之间的关系。例如,可以使用ggplot2包进行绘图,具体代码如下:
library(ggplot2)
ggplot(my_dataset, aes(x = number, y = object_case)) +
geom_jitter(width = 0.2, height = 0, alpha = 0.5) +
geom_boxplot(aes(fill = number), width = 0.2) +
theme_bw()
上述代码可以绘制出一个以number为x轴,以object_case为y轴的散点图,其中每个点的颜色代表其在number上的取值,箱线图则展示了各组数据的中位数、四分位数和离群值。通过这个图,可以更好地观察到number和object_case之间的关系。其他自变量和因变量之间的关系也可以用类似的方法进行可视化分析。
你得数据是什么类型的数据