发育筛查量表的评价者间信度和共聚效度分析
刘 烨1 李家琼2 熊才运2 王耀洲2 罗林荫2 崔玉霞2 周 浩2▲
1.贵州省人民医院耳鼻喉科,贵州贵阳 550004;2.贵州省人民医院儿科康复,贵州贵阳 550004
[摘要]目的 分析发育筛查量表(DST)在婴幼儿发育评估中的可靠性和有效性。方法 选取2016年4月1日~2017年3月31日在贵州省人民医院儿科康复门诊就诊的0~6岁婴幼儿。两名经过严格培训的专业评估师对纳入研究对象进行DST评估,分析其评价者间的信度。纳入研究对象同时进行Peabody运动发育量表评估,该工具作为金标准评估工具,分析DST的共聚效度。结果 共有174患儿(男99例,56.9%)纳入本次研究,年龄为(10.23±9.43)个月。 DST 中发育商(DQ)得分为(67.83±19.63)分,智商(MI)得分为(61.94±15.90)分,女孩 DQ 和 MI得分均高于男孩,差异有统计学意义(P<0.05)。DST各维度得分的组内相关系数(ICC值)为0.76~0.89,提示评估师评分之间具有较好的相关性。Peabody中的粗大运动商(GMQ)、精细运动商(FMQ)、总运动商(TMQ)得分与DST的DQ和MI得分之间的相关系数分别为0.59 vs.0.57、0.62 vs.0.68、0.63 vs.0.64。Peabody中粗大运动中反射、姿势和移动得分与DQ和MI的相关系数分别为0.42 vs.0.36、0.54 vs.0.50、0.56 vs.0.58;精细运动中抓握和视觉运动整合的分与DQ和MI得分的相关系数分别为0.65 vs.0.70、0.62 vs.0.68,DST各维度与Peabody精细运动维度相关性最好,与粗大运动维度相关性稍低。结论 DST发育筛查测试量表具有较好的评价者间信度和共聚效度,提示该量表在中国儿童人群中是一个可靠和有效的运动发育筛查工具。
[关键词]DST发育筛查;Peabody运动发育量表;筛查;信度和效度
各种原因导致的发育障碍是儿童致残的首位原因,目前无特效治疗方法,主要以干预为主。循证学证据表明,早期有效干预可显著改善患儿的预后,尤其是在3岁之前干预效果最为显著[1-3],因此,对DD患儿进行早期筛查,使用评估工具对其运动和智能发育水平进行定量和定性评估,根据评估结果制订个体化的干预方案极其重要。
发育行为研究领域的专家根据儿童自然行为发展理论研发了不同发育评估量表,如Peabody运动发育量表、Griffith发育量表、Gesell发育评估量表、丹佛智力筛查量表、韦氏智力评估量表、发育筛查量表(development screening test,DST)等[4-8]。绝大多数发育评估工具均基于西方儿童人群研发,DST问卷是我国儿童发育行为专家基于中国儿童人群和文化背景研发的首个儿童发育筛查量表[9]。目前在康复和发育行为门诊广泛使用[10-11],迄今为止,少见该工具评价者间的信度和共聚效度研究。本研究主要分析DST工具评价者间的信度和共聚效度,旨在为该量表的临床使用提供依据。
1 对象与方法
1.1 研究对象
选取2016年4月1日~2017年3月31日在贵州省人民医院儿科康复门诊就诊的0~6岁婴幼儿,充分知情告知,家长签署知情同意后纳入本次研究,排除拒绝进行Peabody和DST评估婴幼儿。
1.2 评估工具
1.2.1发育筛查测试 DST是由儿童发育行为专家基于我国0~6岁儿童人群发育规律编制的发育评估量表,通过多中心样本建立了中国儿童常模数据。该量表共包括120个条目,可分为运动、社会适应和智力三个维度,其中运动、社会适应各有30个项目,智力有60个条目。结果以发育商(development quotient,DQ)和智商(mental intelligence,MI)表示。 通常情况下,DQ>70分,MI>70分属于正常范围。该量表由于操作简单、耗时短、灵敏度和特异度高,已作为发育行为和康复科常规的筛查工具。
1.2.2 Peabody运动发育评估量表 Peabody运动发育量表(Peabody developmentalmotor scale-2,PDMS-2)是国内外被广泛应用的运动功能评估量表,同样适用于0~6岁儿童的运动功能评估。该量表包括粗大运动评估量表和精细运动评估两个相对独立的量表,可以针对性对儿童的粗大运动(gross motor,GM)和精细运动(fine motor,FM)发育水平进行评估,是运动发育障碍与脑性瘫痪早期识别的重要工具之一。中文版Peabody由复旦大学附属儿科医院杨红等引进并进行了本土化研究,结果提示该量表在中国儿童人群中具有较好的信度和效度[12]。目前该量表已广泛应用于儿科临床[13-16]。本研究以该量表作为金标准评估工具进行DST共聚效度分析。
1.3 评估方法和质量控制
在专业评估专家的指导下,由2名经过严格培训的评估师对同一患儿进行DST评估,为了保证评估质量,使患儿处于最佳状态,两个评估中间间隔20~30 min。DST评估结束间隔20~30 min后由其第3名评估师进行Peabody评估。
1.4 统计学方法
采用SPSS 19.0统计学软件对数据进行分析,一般人口信息学特征采取描述性统计学方法,量表评估结果的相关性分析采用组内相关和双变量相关分析(Bivariate)方法,显著性水准 α=0.05,以 P<0.05 为差异有统计学意义。
2 结果
2.1 一般临床资料
共有174名患儿(男99例,56.9%)纳入本次研究,年龄(10.23±9.43)个月,其中 90 例(51.7%)为病因不明的发育迟缓患儿,56例(32.2%)为脑瘫患儿,17例(9.8%)为癫痫患儿,10例(5.7%)为缺氧缺血性脑病患儿,1例(0.57%)为胆红素脑病患儿。
2.2 DST和Peabody量表得分分析
DST 的 DQ 得分为(67.83±19.63)分,MI得分为(61.94±15.90)分。男孩和女孩的 DST 得分中,DQ 分别为(59.42±14.07)分、(65.29±17.70)分,MI分别为(64.17±17.49)分、(71.23±21.77)分,DST 运动和智力维度得分比较差异有统计学意义(P<0.05)。Peabody运动发育量中,总运动商(TMQ)得分为(80.41±15.36)分,粗大运动商(GMQ)得分为(81.40±14.62)分,精细运动商(FMQ)得分为(82.99±15.19)分。 研究人群 DST 和Peabody量表各维度得分分布见图1。
2.3 DST和Peabody量表评分评定者之间的信度分析
对两名评估师评定的分数进行评定者之间的信度分析,计算其组内相关系数(ICC),DST各维度得分的ICC值为0.76~0.89,提示评估师评分间具有较好的相关性。
图1 DST和Peabody量表各维度得分分布情况
2.4 DST与Peabody量表得分的相关性分析
DST发育量DQ和MI的相关系数为0.91。Peabody中的GMQ、FMQ、TMQ得分与DST的DQ和MI得分之间的相关系数分别为0.59 vs.0.57、0.62 vs.0.68、0.63 vs.0.64。Peabody中粗大运动中反射、姿势和移动得分与DQ和MI的相关系数分别为0.42 vs.0.36、0.54 vs.0.50、0.56 vs.0.58;精细运动中抓握和视觉运动整合得分与DQ和MI得分的相关系数分别为0.65 vs.0.70、0.62 vs.0.68,DST各维度与精细运动维度相关性最好,与粗大运动维度相关性稍低。
3 讨论
康复和儿童保健门诊常使用各种评估工具对患儿的发育进行量化评估,评估结果反映评估对象的发育情况以及在人群中所处的水平。康复医师可通过评估结果针对性地制订康复方案并进行疗效监测,因此一个可靠和有效的发育评估问卷可保证研究的可靠性以及方案的合理性。从事发育行为临床和基础研究的专家,根据婴幼儿不同年龄发育的常模数据编制了不同的评估量表,这些量表的应用提高了发育行为和康复学科的诊疗水平。目前我国临床上使用的发育评估工具绝大多数是从国外引进,虽然这些评估工具均被证实具有较好的信度和效度,可适用于我国儿童人群,但仍不可忽视不同的文化背景以及人群发育的多样性同样影响问卷评估结果的可靠性和有效性[17]。一个好的评估工具,应基于本土文化和人群研发[18]。
DST是由儿童发育行为专家基于中国儿童人群和文化背景研发的我国首个儿童发育筛查量表,并通过多中心研究样本制定了中国儿童的常模数据[9]。目前该工具在我国儿科康复和发育行为门诊得到了广泛使用。虽然该评估工具已广泛应用于临床和基础研究,但关于信度和效度的研究较少。信度是指评估的可靠性,常用的指标有条目间的信度、评价者间信度、折半信度等;效度是指量表或工具评估结果的有效性,常用效度指标有区分效度、一致性效度、表面效度和共聚效度[19]。本研究使用双人评分方法和国际广泛使用的发育评估工具Peabody量表作为金标准工具,对DST评价者间的信度和共聚效度进行分析。
本研究显示DST评分存在性别差异,女孩的得分要明显高于男孩,DST评估是否具有性别差异需要进一步在大样本普通人群中进行研究证实。然而,值得注意的是,目前绝大多数评估量表均未考虑性别评分的影响,未制定性别特异的切点值,这可能会降低评估工具的可靠性和有效性。对2名评估师的DST评估结果进行组内相关分析发现两个评估师评分之间ICC>0.7,文献报道ICC>0.7说明具有较好的相关性[20],提示DST量表结构稳定,内容设置合理,其评估结果具有较高的可信度。DST运动维度和智力维度得分的相关系数>0.9,提示DST各维度条目设置合理。DST各维度得分与Peabody各维度得分进行相关分析,结果提示相关系数为0.36~0.70,DST各维度与精细运动维度相关性最好,与粗大运动维度相关性稍低。可能的原因主要有:DST为发育筛查量表,主要关注儿童智力发育情况,其中运动维度的条目设置主要反映儿童相应的智力水平,DST内部相关系数>0.9可解释这种现象。Peabody是针对运动发育迟缓,特别是脑瘫患儿编制的评估量表,分为两个维度,粗大运动维度由反射、姿势、移动和物体操作4个亚维度组成;精细运动维度由抓握和视觉运动整合两个亚维度组成,其中Peabody精细运动包含的条目与DST运动维度条目内容均包含有抓握和视觉整合的内容。根据发育理论,精细运动属于幼儿高级功能,基本与智力发育平行。DST与Peabody精细运动维度相关较好,与粗大运动维度相关欠佳,这与两个量表编制的目的和条目的设置有关。
综上所述,DST具有较好的评价者间信度和共聚效度,提示该量表在中国儿童人群中是一个可靠和有效的运动发育筛查工具。本研究还发现DST评分存在明显性别差异,下一步应进行大样本研究评估性别对评分的影响,以期制订性别特异的评分标准或切点值。
[参考文献]
[1]Draper CE,Tomaz SA,Stone M,et al.Developing intervention strategies to optimise body composition in early childhood in South Africa[J].Biomed Res Int,2017[Published online].
[2]Uauy R,Corvalan C,Casanello P,et al.Intervention strategies for preventing low birthweight in developing countries:importance of considering multiple interactive factors[J].Nestle Nutr Inst Workshop Ser,2013,74(3):31-52.
[3]Crnic KA,Neece CL,Mcintyre LL,et al.Intellectual disability and developmental risk:promoting intervention to improve child and family well-being[J].Child Dev,2017,88(2):436-445.
[4]Gebhard AR,Ottenbacher KJ,Lane SJ.Interrater reliability of the Peabody Developmental Motor Scales:fine motor scale[J].Am J Occup Ther,1994,48(11):976-981.
[5]Lenaert B,Boddez Y,Griffith JW,et al.Aversive learning and generalization predict subclinical levels of anxiety:a six-month longitudinal study[J].J Anxiety Disord,2014,28(8):747-753.
[6]Accardo PJ.50 years ago in the Journal of Pediatrics:the pedictability of Gesell developmental scales in Mongolism[J].J Pediatr,2013,162(1):55.
[7]Dai XY,Ryan JJ,Paolo AM,et al.Factor analysis of the mainland Chinese version of the Wechsler Adult Intelligence Scale (WAIS-RC) in a brain-damaged sample[J].Int J Neurosci,1990,55(2-4):107-111.
[8]Brito CM,Vieira GO,Costa MC,et al.Neuropsychomotor development:the Denver scale for screening cognitive and neuromotor delays in preschoolers[J].Cad Saude Publica,2011,27(7):1403-1414.
[9]郑慕时,冯玲英,刘湘云,等.0~6岁儿童智能发育筛查测验全国城市常模的制定[J].中华儿科杂志,1997,35(3):6-9.
[10]王文丽,范果叶,张瑞芳.呼和浩特市婴幼儿发育商筛查分析[J].中国妇幼保健,2010,25(11):1510-1511.
[11]姜晏,邹文霓,查树伟,等.0~3岁婴幼儿发育状况的调查分析[J].中国医药指南,2015,13(21):3-6.
[12]王素娟,李惠,杨红,等.Peabody运动发育量表[J].中国康复理论与实践,2006,12(2):181-182.
[13]杨芳,龚建华,万瑞平,等.Peabody粗大运动发育量表与粗大运动功能测试量表在中枢性协调障碍康复评估中的应用[J].中国妇幼保健,2014,29(19):3097-3099.
[14]张兰,唐久来.Peabody和Gesell量表对引导式教育早期干预HIE患儿的疗效评估及两个量表间的相关性分析[J].中国儿童保健杂志,2015,23(7):730-732.
[15]张兰.Peabody和Gesell量表对引导式教育早期干预HIE患儿的疗效评估及两个量表间的相关性分析[D].合肥:安徽医科大学,2015.
[16]梁莉,刘文龙.Peabody运动发育量表评价贫血对婴儿运动发育的影响[J].中国妇幼保健,2016,31(5):968-970.
[17]Athanasiadou E,Kyrkou C,Fotiou M,et al.Development and validation of a mediterranean oriented culture-specific semi-quantitative food frequency questionnaire[J].Nutrients,2016,8(9):522.
[18]李莉,陈善佳,方云华,等.中文版SF-36用于评价亚急性脑卒中患者生存质量的信度和效度[J].中国康复医学杂志,2017,32(5):509-515.
[19]吴瑞林,Ke-Haiyuan.基于顺序数据的测验信度和效度分析方法[J].中国卫生统计,2013,30(5):773-776.
[20]钟韬,魏庆曜.职业能力测评中评分者信度FINN系数与ICC的计算与MATLAB实现[J].西南民族大学学报(自然科学版),2015,41(4):489-493.
Evaluation of the interviewer reliability and copolymerization validity of the development screening test
LIU Ye1LI Jia-qiong2XIONG Cai-yun2WANG Yao-zhou2LUO Lin-yin2CUI Yu-xia2ZHOU Hao2▲
1.Department of Ear-Nose-Throat,Guizhou Provincial People′s Hospital,Guizhou Province,Guiyang 550004,China;2.Department of Pediatric Rehabilitation,Guizhou Provincial People′s Hospital,Guizhou Province,Guiyang 550004,China [Abstract]Objective To analyze the reliability and validity of development screening test(DST)in the evaluation of infant development.Methods Infants and children in 0-6 years old who were treated in Department of Pediatric Rehabilitation of Guizhou Provincial People′s Hospital during the period of April 1,2016 to March 31,2017 were selected as the subject of this research.The DSTs of the subject were evaluated by two highly trained professional evaluators to analyze the reliability of their interviewer.The subjects also participated in the Peabody sports development test,which was used as a gold standard assessment tool to analyze the copolymerization validity of DST.Results A total of 174 children(male 99 cases,56.9%)were included in this study,with an average age of(10.23±9.43)months.The developmental quotient(DQ)score in DST was(67.83±19.63)points,and the mental index(MI)score was(61.94±15.9)points.The DQ and MI scores of girls were all higher than those of boys,with statistically significant difference(P<0.05).The intra-class correlation coefficient(ICC)value of each dimension of DST was between 0.76-0.89,and the results showed that there was a good correlation between the interviewers′score.The correlation coefficients between gross motor operator(GMQ),fine motion operator(FMQ),total motion operator(TMQ)in Peabody and DQ,MI scores of DST were 0.59 vs.0.57,0.62 vs.0.68,0.63 vs.0.64,respectively.The correlation coefficient of Peabody in gross motor between reflection,posture,mobile score and DQ,MI were 0.42 vs.0.36,0.54 vs.0.50,0.56 vs.0.58;the correlation coefficient of grasping and visual motor integration in fine motor and DQ and MI scores were 0.65 vs.0.70,0.62 vs.0.68;each dimension of DST was best correlated with fine motor in the Peabody and slightly lower correlated with gross motor dimensions.Conclusion DST has good inter-interviewer reliability and copolymerization validity,indicating that the test is a reliable and effective tool for motor development screening in Chinese children.
[Key words]DST development screening;Peabody motor development test;Screening;Reliability and validity
[中图分类号]R715.9
[文献标识码]A
[文章编号]1674-4721(2018)4(b)-0004-04
[基金项目]贵州省科技计划项目(黔科合基础[2016]1091);贵州省人民医院博士基金项目(GZSYBS[2016]07)
▲通讯作者:周浩(1982-),博士,儿科康复副主任医师,贵州贵阳人,研究方向:发育行为儿科
(收稿日期:2017-10-23 本文编辑:祁海文) |