对数线性模型是一族模型,主要是用于离散型数据的分析;解决复杂的高维列联表的一种方法,采用交叉乘积比分析高维交互作用,模型通过交互效应项反映各变量间的关系及其效应的大小。
在对数线性模型中,每个分类变量称为一个因素,基本思想类似于方差分析和线性模型,造成单元格频数变异的原因是各个因素的作用,所以该方法对单元格频数进行分解,与方差分析不同的是,因素的联合作用是相乘的关系。为了利用线性模型的分析方法,该模型对单元格频数取自然对数,这恰好等于各因素和其交互效应的线性函数。模型的假设,分为因素的主效应,以及因素之间的交互效应,在同一个列联表中,可以建立多个对数线性模型。其中模型分为层次模型和非层次模型。
层次模型(hierarchical model)中若包含高维的交互作用,则低维的交互作用一定包含在模型中。对数线性模型也可以是非层次模型(nohierarchical model),在实践中层次模型应用较多。对数线性模型的参数估计通常采用最大似然估计法。假设单元格频数服从多项分布(multinomial distribution)或possion分布。对数线性模型的统计检验包括四种主要检验:
(1)对于假设模型的整体检验:采用似然比卡方(likelihood ratio chi-square test,L2)
(2)分层效应的检验:
(3)单项效应的检验;
(4)单个参数估计的检验;
注意对数线性模型对于应变量的分类数据分析,如果自变量存在连续性的变量时,需要对这个变量定义为协方量分析。对数线性模型的优势在于如果数据为探索性的研究的时候,可使用对数线性模型,发现不同分类变量之间的关系,为证实性研究数据分析做准备。当研究的设计为证实性研究,可使用logit对数模型;或者logistic回归模型进行分析。
在SAS中采用catmod过程分析:
如proc catmod data=data;
Weight f ;
Model x1*x2*type=_response_;
Login x2 type x2*type;
Run;
Proc catmod data=data;
Weigth f;
Model a*b*c*d=_response_;
Login a|b|c|d;
Run;