曾慧楠:基于Logistic回归模型的中国居民主观幸福感实证分析论文

曾慧楠:基于Logistic回归模型的中国居民主观幸福感实证分析论文

摘 要 主观幸福感(SubjectiveWell-Being)是评价者自身对其生活幸福程度的总体评价.文章基于两水平Logistic回归模型,利用中国综合社会调查数据对中国居民幸福感的影响因素进行了实证分析.Logistic回归模型是一种广义线性模型,在线性回归的基础上,加入了逻辑函数,使其对非线性的部分可以更好地进行拟合,具有更强的解释力.结果表明:家庭经济满意度变量带来的幸福感差异是个体幸福感差异的最主要因素;家庭关系满意度、目前婚姻状况、工作满意度、个人社会地位、个人健康状况满意度、住房状况满意度、个人收入、教育程度、性别、年龄对居民主观幸福感的影响较大且依次递减.

在不同的地域与时代,影响人们主观幸福感的因素和其影响力度并不相同,了解影响当前中国居民主观幸福感的主要因素及其影响力度是十分重要的,它有助于了解当前中国居民的心理状态和制定相应的社会政策.但这些主要因素及其影响力度与当前英国居民、美国居民,或是20世纪80年代前的中国居民又有所不同.所以,为了了解影响当前中国居民主观幸福感的主要因素及其影响力度,我们不能直接挪用外国人或过去中国居民的数据,而应该分析当前中国居民的人口信息、教育程度、社会经济地位、生活满意度、家庭支持等有可能对主观幸福度产生影响的因素,以及它们的影响程度,才能够得出结论.本文旨在了解和分析影响主观幸福感的主要因素.

1 研究方法及假设

首先我们分析了全国综合社会调查数据,对调查数据进行了预处理.确定问题属于评价型的数学建模,对于解决此类问题一般使用多元线性回归分析,由最小二乘法求得模型参数的最优无偏估计.但在本问题中,由于影响因素的本质特征很难做到完全独立,它们之间往往存在着某种程度上近似于线性关系的内在联系,即多重共线性.当共线性趋势非常明显时,如果还强行实施最小二乘回归,往往会导致很多问题.所以在多数类似的心理学问题中,可以将变量处理为哑变量,进一步运用Logistic回归方法解决问题.

基于以上原因,我们先对调查数据进行了预处理,做出单项自变量和因变量主观幸福感的相关性分析,并选取具有显著性影响的18个因子作为哑变量.然后使用两水平Logistic回归模型进行拟合、列联表卡方检验等方法进行验证,判定了与中国居民主观幸福感相关的主要因素,并得到结果.

式中,f F(x1,x2)为限流器的成本;f L为限流器的损耗;x1,x2分别为不同材料的用量;C1、C2分别为不同材料的单位费用;C0为与设计变量无关的固定费用。

基于数据作出如下假设:

通过列联表分析以及皮尔逊相关性分析的筛选,最终进入回归方程的变量分别为:性别,教育程度,目前婚姻状况,个人收入,个人社会地位,家庭经济满意度,家庭关系满意度,个人健康状况满意度,住房状况满意度,工作满意度,年龄.

通过表7的结果,说明模型的拟合效果较好,可以使用该模型评定主观幸福感.

他进了我的院子,什么话也没说,握着刀子就朝我扑过来。我幸好是在猪圈里出粪,手里掂着一张铁锨。他一靠近我,我就用铁锨铲他。

3)假设随机误差服从正态分布.

2 定义与符号说明

表1 变量说明表

变量 哑变量描述 均值 标准差 符号性别 1表示男性;2表示女性 1.50 0.500 x1教育程度 1表示低等教育;2表示高等教育(大学专科及以上) 1.65 0.476 x2婚姻状况 1表示有伴侣;0表示无伴侣 0.87 0.336 x3个人收入 收入(万元/月) 0.721 0.5847 x4个人社会经济地位认可度 0表示不认可;1表示认可 0.57 0.496 x5家庭经济状况满意度 0表示不满意;1表示满意 0.48 0.500 x6家庭关系满意度 0表示不满意;1表示满意 0.93 0.254 x7个人健康状况满意度 0表示不满意;1表示满意 0.79 0.407 x8住房状况满意度 0表示不满意;1表示满意 0.57 0.496 x9工作满意度 0表示不满意;1表示满意 0.54 0.498 x10年龄 年龄(岁) 51.85 12.137 x11主观幸福感 0表示不幸福;1表示幸福 0.92 0.268 p第i个自变量的影响程度bi户口状况 0表示农业户口;1表示非农业户口 0.44 0.497 x12民族 0表示汉族;1表示非汉族 0.07 0.257 x13政治面貌 0表示非党员;1表示党员 0.09 0.290 x14家庭收入 收入(万元/月) 1.564 1.1212 x15人际关系满意度 0表示不满意;1表示满意 0.91 0.279 x16社区满意度 0表示不满意;1表示满意 0.67 0.472 x17

3 模型的建立与求解

3.1 设置哑变量

去除问卷调查数据无对应细项的列、不回答的数据点以及异常的野值和非法值(如出现的负值).然后,我们用统计软件SPSS对数据进行可靠性分析,结果得知处理后的数据信度较高.可靠性分析结果见表2.

表2 数据信度表

样本数N 占比/%无效 222 2.3有效 9295 97.7总计 9517 100 Cronbach'sAlpha 0.849

1)在对数据处理的时候,可能会对数据造成损失,造成结果出现误差;

我们以主观幸福感为例说明哑变量的选取.由于居民幸福感数据一般通过调查方式获得,且用以下方式来衡量:非常不幸福(记为1)、不幸福(记为2)、一般(记为3)、比较幸福(记为4)和非常幸福(记为5).但由于目前多层序次Logistic回归还难以实现,所以本文把幸福感分为两类,非常不幸福和不幸福为不幸福一类(记为0),一般、幸福和非常幸福为幸福一类(记为1),暂且用两水平Logistic回归模型进行分析.

3.2 建立模型

主观幸福感、个人基本信息和教育程度等均为定性数据,且为定序的分类变量.根据数据的特点,它们不能满足传统的多元回归分析的模型假设,无法直接应用其进行建模.在定性数据统计分析中,常常采用广义线性模型——Logistic回归模型建立模型.

逻辑函数的形式为:

根据离散型随机变量期望值的定义,用p代表自变量为x时y=1的概率,可得:

由于函数f(p)对x的变化在f(p)=0或f(p)=1的附近是不敏感的、缓慢的,并且非线性程度较高,因此引入Logistic变换,即:

通过主观判断,我们猜测家庭收入和个人收入有很强相关性,通过SPSS中相关性检验,得到如下结果.

3.3 数据拟合

对选出的所有变量直接在SPSS软件中进行拟合,拟合结果如表3所示.

表3 数据拟合表

方程式中的变量 系数 标准误差 Wald 自由度 P值年龄 -0.016 0.003 28.302 1 0.000性别(参考组:女性)男性 0.223 0.112 3.969 1 0.046户口状况(参照组:农业)非农业 -0.126 0.125 1.011 1 0.315民族(参照组:汉族)非汉族 -0.317 0.179 3.144 1 0.076教育程度(参照组:低等教育)高等教育 0.306 0.119 6.578 1 0.010政治面貌(参照组:党员)非党员 0.572 0.278 4.225 1 0.040目前婚姻状况(参照组:无伴侣)有伴侣 0.709 0.140 25.767 1 0.000个人收入 0.110 0.177 0.389 1 0.533家庭收入 0.169 0.089 3.564 1 0.059个人社会地位认可度(参考组:不认可)认可 0.495 0.214 5.368 1 0.021家庭社会地位认可度(参照组:不认可)认可 0.048 0.205 0.056 1 0.814家庭经济满意度(参照组:不满意)满意 1.216 0.165 54.151 1 0.000家庭关系满意度(参照组:不满意)满意 0.919 0.167 30.147 1 0.000人际关系满意度(参照组:不满意)满意 -0.004 0.173 0.000 1 0.984

续表

方程式中的变量 系数 标准误差 Wald 自由度 P值个人健康状况满意度(参照组:不满意)满意 0.563 0.117 22.988 1 0.000住房状况满意度(参照组:不满意)满意 0.412 0.131 9.810 1 0.002社区满意度(参照组:不满意)满意 0.113 0.123 0.844 1 0.358工作满意度(参照组:不满意)满意 0.590 0.136 18.744 1 0.000

从拟合的结果来看,效果并不是很好,可能造成这种情况的原因是自变量之间存在相关关系,使得模型中出现多重共线性问题.为此,我们决定通过皮尔逊相关性检验、列联表检验等方法对变量进行进一步的筛选.

3.4 得出结论

此时,可计算:

表4 家庭收入和个人收入相关性表

∗∗在置信度(双侧)为0.01时,相关性是显著的.

个人收入 家庭收入个人收入Pearson相关性 1 0.720∗∗显著性 (双尾) 0.000 N 5556 5556家庭收入Pearson相关性 0.720∗∗ 1显著性 (双尾) 0.000 1 N 5556 5556

由此我们可以看出,个人收入与家庭收入的相关系数为0.720,可视为高度相关,因此,我们决定将家庭收入这个变量从模型中剔除,只保留个人收入变量.应用同样的方法,我们计算出户口与个人收入的相关系数为0.470,故将户口因素从模型中剔除.

1)假设问卷数据真实可靠,基于此数据得到的模型可以真实反映客观情况.

古卷的名字,叫做《天下图》,起先用一幅地图,粗简地勾勒出中州各地的行政区划。从中,他得知了中州之下共分九州,地域广阔,山高水长。而自己所在的云浮山,就位于中州西侧的横断山脉中,向东翻越数道山脉,便是中州治下的巴州地界。

从SPSS软件的Logistic回归的结果可以看出,性别变量能够通过显著性水平为0.05的检验,其余变量均能通过显著性水平为0.01的检验,说明各自变量的参数估计效果较好.因此我们得到最终的评价模型.

表5 Logistic回归模型变量估计表

方程中变量 系数 标准误差 Wald 自由度 显著性x1:性别(参照组:男性)女性 0.240 0.108 4.998 1 0.025 x2:教育程度(参照组:低等)高等 0.380 0.116 10.657 1 0.001 x3:目前婚姻状况(参照组:无伴侣)有伴侣 0.706 0.137 26.407 1 0.000 x4:个人收入 0.399 0.130 9.366 1 0.002 x5:个人社会地位认可度(参照组:不认可)认可 0.556 0.122 20.943 1 0.000 x6:家庭经济满意度(参照组:不满意)满意 1.243 0.164 57.291 1 0.000 x7:家庭关系满意度(参照组:不满意)满意 0.874 0.145 36.475 1 0.000 x8:个人健康状况满意度(参照组:不满意)满意 0.516 0.113 20.890 1 0.000 x9:住房状况满意度(参照组:不满意)满意 0.465 0.124 14.179 1 0.000 x10:工作满意度(参照组:不满意)满意 0.620 0.132 21.911 1 0.000 x11:年龄 -0.016 0.003 31.918 1 0.000

我们可以看出,家庭经济满意度变量带来的幸福感差异为个体幸福感差异的最主要因素;家庭关系满意度、目前婚姻状况、工作满意度、个人社会地位、个人健康状况满意度、住房状况满意度、个人收入、教育程度、性别、年龄对居民主观幸福感的影响较大且依次递减.除了年龄因素以外,其他的变量系数都为正,说明相对于男性而言,女性的主观幸福感更高;相对于受教育程度低的人,教育程度的提高对主观幸福感有积极影响;相对于个人社会地位低的人,社会地位高会使主观幸福感增加;相对于家庭经济状况低的人,经济状况高的人主观幸福感会有明显的增加;相对于家庭关系满意度低的人,满意度高会提升主观幸福感;相对于个人健康状况满意度低的人,满意度高会提升主观幸福感;住房状况满意度高,相应的主观幸福感也有所提高;工作满意度高的会比工作满意度低的主观幸福感要高;其中婚姻状况、家庭经济满意度、家庭关系满意度、工作满意度对主观幸福感的影响最大,而年龄对主观幸福感的消极影响从拟合的结果来看相对较弱.

3.5 不同性别的模型分析

书中斯诺又对比性地描述了出身无产阶级、做过窑工的共产党员徐海东。与面目英俊,谈吐不凡的周恩来不同,徐海东是个 “大老粗”,却是斯诺所遇见的共产党领袖中 “阶级意识”最强的一个人, “他认为所有的问题都是那么简单纯粹:他要为消灭这一切坏事而奋斗。”[1]269在斯诺笔下,徐海东热情真诚,他大胆无畏却不盲目自大,也许是悲惨的童年生活让他更坚定成为一名优秀的革命者。这种绝对的信念体现在他领导的每次战役里,就是无坚不摧的武器。

显然,这种聚合轴上的“选择”与“被选”揭示的是底本与述本之间潜在的且无法穷尽的替代之可能性。无论是底本中材料的取舍还是再现方式的“选择”,所最终呈现出来的述本都只露出冰山之一角。如果将底本与述本之间的“双轴关系”结合可能世界理论,则可以发现底本存在于无边无界的“可能世界”。而述本则是“三界”(实在世界、虚构世界、可能世界)混合所形成的文本形态。因此,从“跨世界通达”这一理论视角来看,“底本”指涉的是可能显现(但不一定显现)的可能世界之素材与再现方式集合。而“述本”指涉的是显现在“三界”之中的叙述文本。

此番油价下跌的本质是全球石油供需状况相对宽松、库存上升,诱因是“供需状况因地缘政治局势影响而趋紧”的预期被证伪。

表6 性别分类拟合表

方程中变量 男性系数 女性系数教育程度(参照组:低等)高等教育 0.404 0.600政治面貌(参照组:党员)非党员 -0.946 -1.314目前婚姻状况(参照组:无伴侣)有伴侣 0.630 0.931个人收入 0.468 0.519个人社会地位认可度(参照组:不认可)认可 0.503 0.636家庭经济满意度(参照组:不满意)满意 1.228 1.187家庭关系满意度(参照组:不满意)满意 0.901 1.099个人健康状况满意度(参照组:不满意)满意 0.518 0.828住房状况满意度(参照组:不满意)满意 0.502 0.416工作满意度(参照组:不满意)满意 0.523 0.674

由模型可以看出,相对于男性而言,家庭经济满意度、住房状况满意度对主观幸福感影响更大;相对于女性,目前婚姻状况、家庭关系满意度、个人健康状况满意度等因素对主观幸福感影响更大.

4 模型的检验

由SPSS软件得到模型的检验.

冷拔低碳钢丝的延性好,耐腐蚀性强,可焊性强,试验选用的冷拔低碳钢丝各项性能均符合《一般用途低碳钢丝》GB/T343、《冷拔低碳钢丝应用技术规程》JGJ 19要求。

我们将5556个有效数据根据性别分成两组数据,其中男性有2792个观测,女性有2764个观测,接下来我们用Logistic回归分别拟合男、女两组数据.选入回归模型的变量为:教育程度、政治面貌、目前婚姻状况、个人收入、个人社会地位、家庭经济满意度、家庭关系满意度、个人健康状况满意度、住房状况满意度、工作满意度.得到的结果如表6所示.

表7 模型检验表
模型系数的Omnibus检验

卡方 自由度 显著性步长(T) 5278.989 11 0.000块5278.989 11 0.000模型 5278.989 11 0.000模型摘要步长(T) -2对数似然 Cox&SnellR平方Nagelkerke R平方1 2423.262a 0.613 0.818 Hosmer和Lemeshow检验步长(T) 卡方 自由度 显著性1 5.020 8 0.755

2)假设每个人对幸福理解判断并不是很准确,可抽象分为1与0.

5 模型评价与推广

优点:

因变量为二分类或多分类变量,自变量既可以为分类变量,也可以为连续变量.数据中分类变量较多,所以选用这个模型,可将分类变量进行量化.

缺点:

一是通过加强对水利工程选址和工程规模的掌控,充分分析是否有可能发生的滑坡、塌陷等地质灾害问题,尽可能避免在具有风险的地段进行施工;二是通过制定科学合理的施工进度表,将施工进度从时间轴上细化,确保水利工程的顺利进行;三是通过加强培训工作,提升施工人员专业技能,进而完善水利建设技术,确保工程施工进度的速度和质量;四是通过提高施工合同进度和安全管理,促使施工单位严格按照合同签订的内容进行施工,同时将安全教育工作贯穿于工程的始末,确保工程能够按时顺利完成。

《青苗法》每年获利息300万贯。单以熙宁六年为例,青苗利息就达 292万贯;《免役法》每年获利1872万9千3百,而支出只用所入的三分之一;《市易法》每年息钱和市利钱多达达133万2千缗之多。不仅如此,各州县岁收也大大增加。据统计,“诸路常平、免役、坊场、河渡、户绝庄乡之钱粟积于州县者无虑数十百巨万”,如作为地方政府经费,“可以支24年用”。 以上四组材料,充分说明王安石变法确实达到了“富国”的目的。

主观幸福感、个人基本信息(如性别、政治面貌、户口类型等)、教育程度、工作状况、家庭经济情况、个性特征、婚姻质量、满意度、家人基本情况(教育程度、婚姻状况、政治面貌等)、社会阶级认同等评价指标多为定性数据,且为定序的分类变量.根据数据的特点,它们不能满足传统的多元回归分析的模型假设,无法直接应用其进行建模.在定性数据统计分析中,常常采用哑变量进行处理.所以以主观幸福感为因变量,以个人基本信息、教育程度等作为自变量,利用统计软件SPSS,分析各个自变量对因变量的显著性影响程度,选取具有显著性影响的因子作为哑变量,分别对这些因子建立基于哑变量的主观幸福感关系模型,然后对各种模型进行精度检验与效果评价,选取最优模型,最优模型所采用的哑变量,即为最优哑变量.

2)哑变量的选取将在一定程度上影响模型的精度.

6 提高个人主观幸福感的建议

本文对影响幸福感的主要因素进行调查,并提出切实可行的改善建议.经过对各个方面信息的详细调查,以及对信息数据的分析,我们发现幸福感主要受家庭经济和家庭关系满意度、婚姻状况影响,其次受工作满意度、个人社会地位、个人健康满意度影响,再次受住房状况满意度、个人收入、教育程度和性别影响.其中,最主要的因素都与家庭有关,其次的因素则涉及工作、社会地位和健康状况,次要的因素则牵涉员工的生存状况——收入、住房状况、教育程度.另外,男性和女性的幸福感也有所不同.根据以上研究结果提出如下几点切实可行的建议.

6.1 关心家庭状况

影响幸福感的最主要因素便是其家庭经济、家庭关系满意度,以及婚姻状况满意度.家庭一般是我们最重要的生活圈,但是家庭关系不容易用量化的数据进行衡量,在研究中家庭是没办法涉及的范围,不可能直接干预被研究者的家庭生活,但是,建议一定要提高家庭生活的满意度.

例如,多与亲属一同参加聚会活动,以促进与家人、配偶的关系;部分企业和学校还配备家庭心理辅导室,专门解决家庭关系问题.当然,最重要的还是保障休息日和假日,休息日和假日是与家人、配偶团聚的重要时间,如果时间不能得到保障,与家人、配偶的关系有可能变得疏远,这可能会给家庭关系、婚姻状况带来不良的影响,所以,应注意利用休息时间改善家庭关系,提升家庭关系满意度.

6.2 获取更好的物质基础

人们对物质生活条件的需求是最基础的.每个人都有追求更好的生活条件的权利,所以应当积极向上,为自身获取更好的物质基础做准备.同时,也应该理性对待自己当下的物质生活水平,合理分配,使资源利用率最大化.

6.3 注意身心健康

鉴于影响因素中的工作满意度和个人社会地位受个人主观想法和社会主流思想影响较大,先不考虑对应这两个方面提高幸福感的对策.而个人健康满意度和教育程度则是自身可以控制的部分,因此我们提出了针对这两方面的建议:

在健康方面,应积极地锻炼身体,按时参加体检,合理利用周围资源,提升自己的身体素质,从而提升自身的健康满意度.学校或企业应建设一个方便员工锻炼身体的场所,从而协助员工提高健康满意度.

在教育程度方面,应努力学习,提升自身的教育水平.若是已经工作,应当积极参加各类培训与进修,提升自己的外在学历;同时,也应当不断扩充自身的知识储备,提升内在的自我满意与认同度.学校或企业也应多举办培训或讲座等,为大家提供更加丰富的资源,从而提升教育程度满意度.

2014年3月以来,武定门闸每天开闸下泄水量超过200万t,源源活水注入使河道水质有了明显改善,水质符合城市河道景观水标准。秦淮河似乎又恢复了碧波荡漾的昔日美景。“引江换水”为2013年南京亚青会的举办和即将召开的2014年青奥会作出了积极贡献。

6.4 具体问题具体分析

根据我们的调查分析结果,影响男性和女性主观幸福感的原因有所不同,相对于男性而言,家庭经济满意度、住房状况满意度对主观幸福感影响更大;相对于女性,目前婚姻状况、家庭关系满意度、个人健康状况满意度等因素对主观幸福感影响更大.同时,可以看出男性的主观幸福感指数普遍低于女性,所以应更加关注和提升男性的幸福感指数.因此,在以上几点建议的基础上,应当结合自身的具体情况,有效地提升自己的主观幸福感.

参考文献

[1]张慧颖,陈君彦,张颖春,等.社区和谐理念满意度评价的因子分析与聚类研究[J].统计与决策,2006(11):9

[2]易丹辉,何铮.Logistic模型及其应用[J].统计与决策,2003(3):26

[3]周春平.收入满意度对居民主观幸福感影响实证研究[J].南京航空航天大学学报(社会科学版),2013(1):40

[4]梁艳华.企业员工主观幸福感影响因素探研[D].镇江:江苏大学,2009

[5]娄伶俐.主观幸福感的经济学理论与实证研究[D].上海:复旦大学,2009

[6]马立英.企业员工工作幸福感影响因素实证研究[D].金华:浙江师范大学,2013

(作者单位:1.北京师范大学出版集团2.北京师范大学心理学部)3.广西柳州铁一中学

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

曾慧楠:基于Logistic回归模型的中国居民主观幸福感实证分析论文
下载Doc文档

猜你喜欢