基于人工神经网络的贵州省少数民族卫生服务利用预测模型研究
杜 薇1 刘婵婵2 李 端1 胡嘉琦1 樊兴颖1 周涵妮1 常 悦1▲
1.贵州医科大学医药卫生管理学院,贵州贵阳 550025;2.贵州医科大学科技处,贵州贵阳 550025
[摘要]目的 采用构建人工神经网络模型的方法,研究贵州省少数民族健康素养对卫生服务利用的影响,使卫生服务利用预测向智能化发展。方法 2019年6~12月,采用多阶段分层抽样抽取1031 名贵州省年龄15~69 岁常住少数民族居民。采用单因素检验筛选变量,建立人工神经网络模型。结果 1031 名少数民族样本中,门诊服务利用率为7.08%,住院服务利用率为8.44%。门诊利用组与门诊未利用组的不同基本特征、健康素养总体及各类别得分比较,差异无统计学意义(P>0.05)。住院未利用组的职业状况、健康素养总分、健康信息素养、安全与急救素养得分与住院利用组比较,差异有统计学意义(P<0.05)。筛选出职业状况(P=0.025)、健康信息素养(P=0.035)、安全与急救素养(P=0.000)作为输入层节点,构建人工神经网络住院服务利用预测模型。模型训练完毕后,用155 组数据做验证,样本数据误差的绝对值均不超过1,且误差在0 附近的频数最大,模型拟合效果较好。结论 职业状况、健康信息素养、安全与急救素养显著影响贵州省少数民族住院服务利用。人工神经网络模型准确率较高,能应用于进一步的卫生服务利用预测。
[关键词]贵州省;少数民族;健康素养;卫生服务利用;人工神经网络
“健康中国”2017年首次在总理政府工作报告中提出,以农村和基层为重点“提高居民健康素养水平”在《“健康中国2030”规划纲要》中被纳入为建设健康中国的十三个主要指标体系之一[1],十九大报告中阐述“人民健康是民族昌盛和国家富强的重要标志”。这些都意味着健康是民众生活的美好期盼,推进国民健康事业是最终实现全面发展的基本保证。提供卫生服务是推进健康事业的手段。个体从婴儿时期的出生到衰弱老人时期的临终,无不连续地需要卫生服务[2]。
健康素养指的是个人根据自身的知识储备,获取并理解健康领域的知识,并运用这些信息做出正确的健康行为决策,以促进和保持自身健康水平的能力[3]。世界卫生组织得出研究结论:健康素养与人均期望寿命、生命质量高度相关[4-5]。因此,研究健康素养对卫生服务利用的影响,有助于实现卫生资源的合理配置。本研究旨在提供一种新的方法研究贵州省少数民族健康素养对卫生服务的利用影响,构建卫生服务利用预测模型,让贵州省少数民族的卫生服务利用预测向智能化发展。
1 资料与方法
1.1 一般资料
采用多阶段分层抽样,于2019年6~12月在贵州省6 个市(州)抽取少数民族个体进行调查,共发放问卷1080 份,回收1031 份,有效回收率为95.46%。纳入标准:贵州省常住人口;少数民族;自愿参与本次调查。排除标准:精神障碍、认知障碍者。
被调查样本的基本特征方面,男482 名(46.75%),女549 名(53.25%);城镇225 名(21.82%),农村806名(78.18%);年龄15~69 岁;初中及以下学历459 名(44.52%),高中或中专学历168 名(16.29%),大专及以上学历404 名(39.19%);平均月收入1000 元及以下543 名(52.67%),1001~3000 元275 名(26.67%),3001~5000 元165 名(16.00%),5001~10000 元38 名(3.69%),10001 元及以上10 名(0.97%)。
1.2 调查方法
研究负责人统一培训课题组成员,贵州医科大学医药卫生管理学院熟悉少数民族语言本科生担任调查员,由调查员携带问卷分赴贵州省6 个市(州),按照调查方案和调查计划的要求,对被调查者进行访谈,并按照问卷的格式和要求来记录被调查者的回答。问卷内容包括以下三个部分。
第一部分基本情况,包括性别、年龄、学历、职业、平均月收入等。
第二部分参考原卫生部委托中国健康教育中心2015年制定的最新版《全国居民健康素养调查问卷》[4]。根据知信行理论分类,问卷可以分为三个方面,分别为基本健康知识和理念、健康生活方式与行为、基本技能;根据公共卫生问题为导向分类,可以将问卷分为六类,分别为科学健康观素养、传染病防治素养、慢性病防治素养、安全与急救素养、基本医疗素养和健康信息素养。
第三部分为卫生服务利用,包括4 周患病率、4周门诊服务利用率、年住院率。
选取150 名对象进行预调查,得到问卷的Cron bach′s α 系数为0.730,平均效度为14.2,内部一致性高,内容符合主题。
1.3 统计学方法
1.3.1 单因素分析
采用SPSS 22.0 统计学软件进行数据分析,符合正态分布的计量资料采用均数±标准差(±s)表示,两组间比较采用t 检验,不符合正态分布者转换为正态分布后行统计学分析;计数资料用率表示,组间比较采用χ2 检验,以P<0.05 为差异有统计学意义。
1.3.2 多因素分析
多因素分析采用人工神经网络模型。人工神经网络的工作原理是模仿人脑结构,根据所提供的数据,通过学习和训练,建立由自变量到因变量的模型[6]。输入和输出之间的关系不是线性的。根据输入的信息建立神经元,通过学习规则或自组织等过程建立相应的模型,并不断修正,使输出结果与实际值之间的差距不断缩小[7]。人工神经网络的具有高速运算的能力,模拟人脑进行自学习、自组织。其由输入层、隐含中间层、输出层组成,结构如图1所示。结构简单、意义明确、步骤分明。
图1 人工神经网络模型
本研究采用Matlab 神经工具箱构建网络结构,步骤如下。
①将所有数据导入Matlab。
②打开Netural Net Fitting 工具箱,建立神经网络,导入网络,确立输入层、输出层;确定所有数据中训练集、验证集、测试集的比例分配。
③设置中间层的节点数,确立传输函数。
④开始进行训练,可以加入修正数据进行权值修正。
⑤训练结束,验证并测试结果。
2 结果
2.1 卫生服务利用现状
被调查的1031 名少数民族样本中,4 周内因患病利用门诊服务的人数为73 名,门诊服务利用率为7.08%;1年内因患病利用住院服务的人数为87 名,住院服务利用率为8.44%。
2.2 影响门诊服务利用的单因素分析
贵州省少数民族门诊利用组的一般资料、健康素养总分及各类别不同得分与门诊未利用组比较,差异无统计学意义(P>0.05)(表1)。
表1 被调查少数民族4 周内门诊服务利用的单因素分析(n=1031,分,±s)
2.3 影响住院服务利用的单因素分析
贵州省少数民族住院利用组和住院未利用组的职业状况比较,差异有统计学意义(P<0.05);住院未利用组的健康素养总分、健康信息素养、安全与急救素养得分高于住院利用组,差异有统计学意义(P<0.05)。住院利用组的其他基本特征、健康素养其他类别得分与住院未利用组比较,差异无统计学意义(P>0.05)(表2)。
表2 被调查少数民族1年内住院服务利用的单因素分析(n=1031,分,±s)
2.4 基于人工神经网络的贵州省少数民族卫生服务利用预测模型
2.4.1 神经网络初始化
由上述单因素分析,门诊利用组与门诊未利用组的不同基本特征、健康素养总体及各类别得分比较,差异无统计学意义(P>0.05)。而住院未利用组的职业状况、健康素养总分、健康信息素养、安全与急救素养得分与住院利用组比较,差异有统计学意义(P<0.05)。因此,本研究利用人工神经网络构建住院服务利用预测模型。
2.4.1.1 输入层与输出层的确定 职业状况(P=0.025)、健康信息素养(P=0.035)、安全与急救素养(P=0.000)三个因素均有统计学意义,因此,输入层设置为职业状况、健康信息素养、安全与急救素养3 个节点。输出层确定为住院服务利用1 个节点。
2.4.1.2 数据标准化 由于职业状况与健康信息素养、安全与急救素养不是同一类变量,数值相差较大,需采用min-max 标准化(min-max normalization)对其进行处理[8],将其映射到(0,1)之间,采用的公式如下:。
2.4.1.3 中间隐含层节点数量的确定 中间隐含层的神经元节点数对人工神经网络模型的预测精度有较大的影响,节点数过多会导致过度拟合,且增加训练时间;节点数过少会出现欠学习状态,从而削弱了模型的预测能力[9]。根据经验公式[10]:(Z 为中间层节点数,n、m 分别为输入层、输出层节点数,a为1~10 之间的整数常数)。本研究确定的n、m 分别为3、1,根据公式计算,模型中间层节点数为(3,12)。
2.4.2 神经网络训练
Matlab 的神经工具箱中,网络设置为具有S 形的隐藏神经元和线性输出的神经元(fitnet)的双层前馈网络,如图2所示。输入层和隐含层的传递函数为tansig 函数,输出层的传递函数为purelin 函数,使用traincg 算法。学习率设置为0.05,迭代次数为1000次。在Matlab 中,训练函数Levevberg-Marquardt 法(L-M算法)收敛速度快且均方误根差最小,表现效果最优[11]。
图2 Matlab 神经工具箱的网络设置
神经网络建立好以后,导入经过标准化处理后的1031 组样本。将数据集按照70∶15∶15 的比例分为训练集、验证集和测试集。训练集用于训练模型,验证集用于衡量训练集构建网络,验证完成后再用测试集样本数据进行测试,确定所建立人工神经网络模型的有效性。
2.4.3 网络模型建立结果
根据上述初始化设置建立网络,调整中间层神经元个数,直到均方误差(MSE)最小,MSE 指的是输出和目标之间的均方差,值越低越好。调整中间层节点数从3~12,训练网络,确定隐含层为10 个时,为最优神经网络结构。如表3所示。
表3 各中间隐含层节点数的人工神经网络模型MSE
迭代次数与MSE 的关系如图3(封三)所示,蓝线为训练数据,绿线为验证数据,红线为测试数据。模型中,训练集、测试集、验证集数据的表现类似。最优表现为当训练次数为4 次时,MSE 达最小值,为0.069 076。
图3 迭代次数与MSE 关系图(见内文第7 页)
2.4.4 模型验证
为检验所建立的人工神经网络模型的有效性,训练前,将数据中的15%,共155 组数据设定为测试集,用于进行模型验证,结果见图4,所有测试集样本数据误差的绝对值均不超过1,且误差在0 附近的频数最大。由此可见,预测住院服务利用的人工神经网络模型预测准确,本模型有效。
图4 测试样本数据误差分布图
3 讨论
本研究构建的人工神经网络模型显示,职业状况、健康信息素养、安全与急救素养显著影响贵州省少数民族的住院服务利用。健康信息素养是指个体意识到自身对健康信息的需求,熟悉掌握检索健康信息的方法,评价检索到健康信息的质量,并根据自身具体情况,选择适合的信息分析和运用来做出健康决策[12]。安全与急救素养是个体应对突发地震、洪涝、爆炸、火灾、食品安全、交通事故等公共安全问题的能力,体现了个体的安全和急救方面的认知和能力[13]。健康素养是影响卫生服务利用的重要影响因素[14]。低健康素养水平导致低自我健康管理行为水平,伤害、发病的增加,治疗依从性差,疾病自我管理能力低,从而影响人的生命和生活质量,并增加对卫生服务的利用。
掌握正确的卫生服务利用影响因素,有利于在卫生资源有限的前提下,找准针对性的健康教育实施路径,深化医药卫生体制改革,为制定促进卫生服务合理利用的政策提供科学依据。
本研究旨在提供一种简便、高效的方法,对卫生服务的利用进行科学预测。人工神经网络和Logistics回归模型不同,其是一组程序控件构成的“黑箱”,输入和输出之间的关系在“黑箱”中,且为高度非线性的关系,需要借助R 语言、Matlab、Python 等实现和应用[11]。因此,构建人工神经模型,将拟合效果较好的模型储存到模型库中,让贵州省少数民族卫生服务利用的预测向智能化发展。
同时,本研究的主体是贵州省少数民族。少数民族群体作为中华民族的重要组成部分,促进其健康水平,关系到国家的长久治安,对实现民族地区的和谐稳定,维护国家发展具有积极的政治意义[15]。
综上所述,职业状况、健康信息素养、安全与急救素养显著影响贵州省少数民族住院服务利用。人工神经网络模型准确率较高,能应用于进一步的卫生服务利用预测。
[参考文献]
[1]赵黎.新医改与中国农村医疗卫生事业的发展——十年经验、现实困境及善治推动[J].中国农村经济,2019,(9):48-69.
[2]单诗洋.2014年辽宁省居民健康素养调查分析[D].长春:吉林大学,2017.
[3]金帅岐,李贺,沈旺,等.用户健康信息搜寻行为的影响因素研究——基于社会认知理论三元交互模型[J].情报科学,2020,38(6):53-61,75.
[4]中国健康教育中心.中国居民健康素养监测报告[M].北京:人民卫生出版社,2018:36-42.
[5]贾绪计,王庆瑾,李雅倩,等.健康素养的内涵与评价[J].北京师范大学学报:社会科学版(社会科学版),2019,(2):66-72.
[6]李玉翠,周正,彭漪,等.基于机器学习的东湖富营养化研究[J].人民长江,2018,49(17):12-17.
[7]杜栋,庞庆华,吴炎.现代综合评价方法与案例精选[M].北京:清华大学出版社,2018:102
[8]吴晖,韩海庭,屈秀伟,等.大数据征信算法的可解释性研究[J].征信,2020,38(5):44-51.
[9]刘志强,王玲,贾海江,等.基于BP 神经网络的驾驶员制动行为模型研究[J].机械设计与制造,2019,(6):37-41.
[10]朱瑜馨,张锦宗,赵军.基于人工神经网络的森林资源预测模型研究[J].干旱区资源与环境,2005,19(1):101-104.
[11]陈玉玲,吴保国,崔岩,等.基于BP 神经网络的华北落叶松小班蓄积预估模型研究与应用[J].中国农业科技导报,2019,21(7):82-93.
[12]周谦豪,姚占雷,许鑫.图书馆健康信息素养教育的调研与分析[J].图书馆学研究,2020,(10):77-86.
[13]戴明艳,张存辉,忻振慧,等.张家口市医学生安全与急救素养水平及影响因素分析[J].中国健康教育,2018,34(3):268-271.
[14]王虎峰.全球健康促进30年的共识与经验——基于全球健康促进大会宣言的文本分析[J].中国行政管理,2019,(12):133-139.
[15]雷明昊.发展型自治——中国民族区域自治的特色与优势[J].广西民族研究,2018,(2):49-58.
Research on prediction model of ethnic minority health service utilization in Guizhou Province based on artificial neural network
DU Wei1 LIU Chan-chan2 LI Duan1 HU Jia-qi1 FAN Xing-ying1 ZHOU Han-ni1 CHANG Yue1▲
1.School of Medcine and Health Management,Guizhou Medical University,Guizhou Province,Guiyang 550025,China;2.Department of Science and Technology,Guizhou Medical University,Guizhou Province,Guiyang 550025,China [Abstract]Objective To study the influence of the health literacy on health service utilization among ethnic minorities in Guizhou Province by a method of constructing artificial neural network model,making the prediction of health service utilization intelligent.Methods From June to December 2019,1031 resident ethnic minorities aged 15 to 69 years old in Guizhou Province were selected by multistage sampling for a questionnaire survey.Univariate analysis was used to screen the variables,and multivariate analysis was performed by an artificial neural network model.Results Among the 1031 minority samples,the outpatient service utilization rate was 7.08%,and the inpatient service utilization rate was 8.44%.There were no statistically significant differences in different individual basic information,total score of health literacy and scores of each category between outpatient utilization group and outpatient non-utilization group(P>0.05).There were statistically significant differences in the occupation,the total score of health literacy,and scores of health information literacy and safety and first aid literacy between the inpatient non-utilization group and the inpatient utilization group,the differences were statistically significant(P<0.05).Then occupation(P=0.025),health information literacy(P=0.025),safety and first aid literacy(P=0.000)were selected as input layer nodes,and an artificial neural network inpatient service utilization prediction model was constructed.Based on the model,155 sets of data were used for verification.All the absolute value of errors did not exceed 1,with the maximum near 0,so the model fitting effect was good.Conclusion Occupation,health information literacy,safety and first aid literacy significantly affect the utilization of inpatient service for ethnic minorities in Guizhou Province.The artificial neural network model is highly accurate and can be used for further prediction of health service utilization.
[Key words]Guizhou Province;Ethnic minorities;Health literacy;Health service utilization;Artificial neural network
[中图分类号]R193
[文献标识码]A
[文章编号]1674-4721(2021)1(b)-0004-05
[基金项目]贵州省社会科学界联合会理论创新课题(GZLCLH-2019-39)
[作者简介]杜薇(1988-),女,硕士,讲师,主要从事医药经济管理方面研究
▲通讯作者:常悦(1979-),女,博士,副教授,主要从事医药经济管理方面研究
(收稿日期:2020-05-09)
|