摘要
随着胜任力导向的新一代医学教育改革的推进,中日两国临床执业医师资格考试均以考查临床医生岗位胜任力为目标进行了一系列改革。在命制试题时如何模拟临床真实场景,实现在模拟临床环境下考查考生综合能力和临床思维成为两国临床执业医师资格考试亚待解决的问题。通过比较中日两国临床执业医师资格考试试题,发现两国考试都致力于提高临床案例型试题的质量,日本临床案例型试题从提高融合型试题的比重人手,在命制临床案例型试题,切实考查考生信息处理能力疾病诊断能力、决策能力等方面,值得我国临床执业医师资格考试借鉴。
关键词
临床执业医师资格考试;临床案例型试题;岗位胜任力;临床思维;临床医生
中图分类号
文献引用
刘侃,庄然,郑淑园,王振禹,肖天,田甜,赵佳. 中日临床执业医师资格考试医学综合考试比较与思考[J]. 中华医学教育杂志,2023,43(01):72-76.
DOI
作者简介
刘侃 1 庄然 2 郑淑园 1 王振禹 3 肖天 3 田甜 4 赵佳 1
随着胜任力导向的新一代医学教育改革的推进,我国临床执业医师资格考试在 2019 年前后进行了诸如修订临床执业医师资格考试大纲(以下简称大纲)、调整试卷结构、开发新型试题推行计算机标准化考试、开展临床医学专业(本科)水平测试等一系列改革,旨在从考试形式、试题结构、命题方式改革等方面入手,以考查考生真正具备临床医生应有的知识、技能和态度 [1] 。随着胜任力导向的执业医师资格考试改革不断深入,命题的数量、质量和形式等都面临着巨大的挑战。日本的临床执业医师资格考试(日本医師国家試験)几乎在同一时期也进行了改革,分析比较两国临床执业医师资格考试有助于互相借鉴,取长补短。鉴于国内尚无日本2018年修订考试大纲、大量削减A1型试题数量后的临床执业医师资格考试的相关研究,本研究从考试形式、试卷结构、命题策略等方面对中日临床执业医师资格考试医学综合考试试题进行比较,以期为我国试题命制提供参考。
01
资料和方法
1.1
资料来源
以中国2017 至2021年和日本2019 至2021 年临床执业医师资格考试医学综合考试试题为研究资料。
展开全文
1.2
研究方法
采用资料描述、统计分析的方法,从定量和定性的角度分别比较修订大纲前后的中国考试与改革后的日本考试在考试形式、试卷结构、命题策略等方面的异同。
1.3
统计学处理
采用 SPSS 25.0统计学软件描述性统计历年试题结构分布,采用卡方检验多重比较和两两比较的方法分析中日间历年题型结构和认知层次结构的差异。P<0.05 表示差异具有统计学意义。
02
结果
2.1
考试形式比较
中日临床执业医师资格考试医学综合考试形式如表1所示,中国第一单元主要考查基础医学医学人文、预防医学相关内容;其他 3 个单元依次考查器官系统疾病,年度间会有微调。日本“各论”单元主要考查器官系统疾病,“必修”单元主要考查作为住院医师必须具备的职业意识和诊疗基础,总论”单元主要考查疾病的鉴别与治疗 [2] 。题型方面日本的一般试题、临床试题、长文试题分别与中国A1/B1、A2、A3/A4 对应。
2.2
试题构成比较
2.2.1 题型结构
相对于中国考试按题型分类历年试题数均有微调,日本考试题型结构没有年度间的变化。因此可以将日本 2017 至2021 年考试题型视为1组数据与中国5年的题型结构进行卡方检验多重比较,结果显示,中日临床执业医师资格考试年度间题型结构差异具有统计学意义(P<0.001)。对题型结构进行年度间两两比较,发现以2019年国家医学考试中心使用修订版考试大纲命题为分水岭,大纲修订前后年度间题型结构存在差异。而中国2017至2021年试题结构分别与日本考试进行比较,只有2019年差异无统计学意义(P = 0.191)。具体结果详见表 2。
2.2.2 认知层次结构
中日两国均以专家判断法将试题的认知层次划分为3类A1/B1型试题和一般试题均归为I型A2/A3/A4和临床试题/长文试题(以下统称为临床案例型试题)如果病历中给出了诊断则归类到I型,如果考查跟诊断有关的内容归入II型,需要做出决策的归入III型 [3] 。从考查考生解决临床问题能力的角度来看,越接近III型试题越被认为是理想的试题。因此比较中日两国临床案例型试题的数量和结构就可以了解其在认知层次上的差异。表3 结果显示,中国仅 2019 年临床案例型试题达到61.2%(367/600)而日本则常年在62.5%(250/400),2019 至2021 年中日两国临床案例型试题认知层次结构差异具有统计学意义(P<0.001)。年度间两两比较发现中日两国各年份临床案例型试题的认知层次差异均具有统计学意义(P<0.05)。
2.3
典型临床案例型试题比较
2.3.1 试题信息量
选取典型试题题干比较如下。
日本 109A35 题 [3]182-183 (109 次A 单元35 题,下同):女,45 岁。主诉腹痛,来院就诊。昨天午餐后出现心窝疼痛,伴恶心和上腹部不适。今早疼痛转至下腹部并逐渐加剧,行走时腹部出现响声。没有怀孕的可能性。查体:体温 37.8℃,脉搏92次/分,规律。血压112/70mmHg,呼吸18 次/分。腹平软,右下腹压痛,反跳痛(+)。肠鸣音减弱。肝、脾肋下未及。尿沉渣镜检:尿蛋白(-)、尿糖(-)、尿潜血(-)。血常规:红细胞 471 万,血红蛋白 Hb 14.5g/dL,Ht42%.白细胞 14800,血小板 32 万。血生化检查:总胆红素 1.3mg/dL、天门冬氨酸转氨酶15IU/L、丙氨酸氨基转移酶 15IU/L、碱性磷酸酶154IU/L(正常范围115-359)、y谷氨转移酶10IU/L(正常范围8-50)、淀粉酶35IU/L(正常范围37-160)、尿素22mg/dL、肌酐0.6mg/dL、血糖112mg/dL。C反应蛋白 3.4mg/dL。腹部超声检查因肠管积气所见不清。腹部 CT 影像如(Ⓐ、Ⓑ、Ⓒ)所示。
2.3.2 试题融合度
融合型试题是在一道试题中考查多个考核要点的试题 [4] ,例如下面试题。
日本 108H21 题 [3]94 :男,50 岁。患升结肠癌入院治疗,行右半结肠切除术后当天。无脉搏不规律既往史,术中无异常,术后置于监护室观察,疼痛一直处于可以忍耐的程度。术后 6 小时,心电图显示脉搏 110 次/分,规律,血氧饱和度 100%(氧气面罩,输氧 3l/分)。经确认,术后进入康复室时脉搏80 次/分,30分钟前逐渐增加到现在的数值。最恰当的应对是:(A)
A 确认血压情况 B建议早期离床活动 C迅速补充细胞外液 D使用阻断药 E安装自动体外除颤仪
这种命题方式融合了临床表现、辅助检查、诊断与鉴别诊断、具体处置措施、并发症及其诊断治疗等多个考核要点。
2.3.3 临床综合能力考查
以决定检查项目试题为例,比较不同命题策略考查能力的效果。
日本 108H23 题 [3]96 :男孩,3 岁。因声和喉鸣由母亲领来儿科就诊。2 天前开始发热,出现流鼻涕和声嘶,今天傍晚开始观察到吸气性喉鸣及犬吠样咳嗽。随后转诊到耳鼻咽喉科,未见三凹征和发维。血氧饱和度 100%(正常呼吸)。首先应该进行的检查是:(D)
A 颈部CT B 咽镜 C 颈部超声 D 喉镜 E 副鼻窦X线平片
能否考虑安排患者从耳鼻咽喉科到其他检查室进行检查所要花费的时间成本会成为答题线索。
A 脑血管造影 B 头颅超声 C 头颅CT D 脑电图 E 头颅MRI
当面对一个疑似颅内压增高、随时有生命危险的儿童,考虑迅速得到诊断结果比选择检查方式更重要。
03
思考与建议
3.1
中日两国考试形式各有特色
日本试题数少,但考试总时长更长。相较于我国正在推广阶段,日本已将临床医学专业(本科)水平测试(共用试 CBT)正式列入行业准入考试。因此自2018 年起,考试减掉水平测试已考过的100道“一般试题”,考试天数和试题数从原来的 3天500 道题变为 2天400 道题 [5] ,但答题总时长要长于中国。究其原因,一是考试的单元数多;二是试卷的阅读量大;三是仍然采用传统的纸笔考试。
中日两国的考试题型相似,但在试题呈现形式上日本更丰富。日本考试的一般试题、临床实地试题和长文试题分别对应中国的 A1、A2、A3/A4 试题。但是在试题呈现形式方面,日本试题中有1/4会配有心电图、CT染色标本等检查的图像以营造临床现场的氛围。中国从2020年才开始在计算机化考试中尝试使用图像手段,数量还比较少。此外,日本考试没有B1型题(标准配伍题)但是会有30余道多选题和2道英文题。
中国考试在信息化上优于日本,本考试的合格标准更加精细。中国考试已经全面实现计算机标准化考试,日本仍然采取传统的纸笔考试。合格标准方面,中国总答对率 60%就能通过考试;日本则需要同时满足 3 个条件,①必修单元试题的答对率高于 80%;②试卷中随机配置 10 道左右含有选 择了就会对患者造成侵害的禁忌选项的试题,选择这些选项不能高于3 题;③除必修试题外其他试题的总答对率要达到一定比例,这个比例一般在65%~70%之间,通过年度间的微调来平衡不同年度间试卷的难度,保证通过率 [6] 。
3.2
重视高认知层次临床案例型试题命题质量并提高融合型试题比重
中国 2019 年修订的《临床执业医师资格考试大纲》规定考试应符合临床医师岗位胜任力要求紧密结合工作实际和工作场景,考查考生综合应用临床思维解决临床实际问题的能力 [7] 。日本2018年版的《医师国家考试出题基准》也明确在考查从事诊疗工作所必要的知识和技能的同时,也要考查鉴别诊断和选择治疗方针的综合能力 [8] 。从考查考生岗位胜任力的角度出发,就要求试题不能仅仅测试考生记忆、理解层面的认知能力,而要从更高认知层次出题以检验考生综合能力和临床思维。鉴于临床案例型试题更加贴近临床实际,能够更好地反映考生的临床思维能力,中国考试此类试题比例也在逐年增加。为提高试题认知层次,我国也在不断探索基础医学、临床医学、预防医学与医学人文各学科之间的相互融合,通过融合试题改变传统的一道试题只考查一个考核要点(临床概念、发病机制、鉴别诊断等9项)的现状 [9] ,这与日本保证临床案例型试题中III型试题占比超过四成的目的是不谋而合的。然而,从统计分析上看,在认知层次结构上,目前中国考查临床应用能力的高认知层次试题比例仍然有待提高。因此,如何提高试题的认知层次成为中国临床执业医师考试改革的当务之急。
3.3
从临床实际出发调整命题策略以重点考查临床思维和综合能力
3.3.1 重视考查信息处理能力
临床医生的思考过程是从“给获取的信息赋予含义”开始的,需要医生具备病例信息的收集能力、相关医学知识和对信息分析取舍的能力。如果考题只给出诊断所必要的信息,容易让考生养成不通读案例,不考虑临床实际,靠关键词选择答案的习惯。而在临床实践中,当面对“突然剧烈头痛”和“发热”症状同时出现的患者,是给出“蛛网膜下隙出血”的诊断,还是给出“细菌性脑膜炎”的诊断,这恰恰是真正考查医生能力的地方。因此,在命题中描述临床案例时应该更注重病程和诊疗的完整性和时间轴,无论获取的信息是否与诊断有关都按病程发展和诊疗顺序直接呈现,这样才能切实考查考生解释病例信息的能力,有效将靠关键词答题的考生甄别出来。
3.3.2 重视考查疾病诊断能力
在设计考点时关注点应该放在推论的方法和思考过程上,考查考生根据症状列出疾病列表,归类相似疾病以提高诊断、减少误诊的能力。此外,试题与实际临床现场最大的区别在于不存在时间轴,只能将截止某个时间点的病例信息全部给出,这也是难以考查考生推理能力的原因之一。建议在命制 A4 题型时,在不司设问间增加病状、检查、治疗等进程的描述来增加临场感。例如感染性休克病例,第一问给出血常规检查结果,第二问给出脑脊液检查结果,第三问给出患者在翠日病情恶化死亡的信息。通过这样的设计完整重现整个诊疗过程实现考查考生通观全局的诊断推理能力.达到将诊断思维不严谨的考生甄别出来的目的。日本长文试题更多使用了这种方法,值得我国借鉴。
3.3.3 重视考查决策能力
在实际临床现场,医生做出诊疗决策时,通常需要考虑“紧急性”“治疗可能性”“侵袭性”“即时性”“便捷性”“时间成本”“金钱成本”等诸多要素,是一个非常复杂的判断过程 [10] ,这就要求临床医生具有综合判断上述要素、合理分配资源、开展行之有效的诊疗活动的能力。此外,医疗决策在判定治疗是否起效时也发挥着作用。以日本 110B57 题为例,因感染肺炎球菌住院患者,第四天液培养呈阴性,但检测出耐甲氧林金黄色葡萄球菌。考生需要对患者继续使用头抱曲松还是根据痰液培养结果更换频谱更窄的抗菌药做出选择。能够根据预先设定判定的指标,做出治疗起效的判断是本题答题的关键,这也是临床现场处置经常需要的能力,然而在中国试题中却几乎看不到。
04
结语
中日两国医师资格考试改革步伐一致,命题的侧重点均放在临床案例型试题方面,把从症状入手、按照临床思维过程逐步推进疾病鉴别和治疗方案选择的临床应用能力作为考查重点。但是基于综合笔试考试形式的局限性,如何利用试题重现临床现场环境以考查考生岗位胜任力一直以来都是两国医考试题命制最大的困难之一。中国致力于通过学科融合增加考核要点,日本则通过将病历体格检查辅助检查等信息全部给出的方式模拟临床现场,来实现考查考生病例信息解释、病情诊断做出决策等临床能力的目的。不同的探索方向使得两国医考之间更具有相互借鉴的意义。但同时也要看到,从试题文本中可以很容易得出结论的诊断,在临床实践中却需要医生按照诊疗程序,从一无所知开始一步步获取信息,这也是考试与临床实践之间决定性不同的地方。再加上诸如临床的即时性、低患病率疾病的考查以及诊疗环境的再现等内容,均是两国医考笔试难以解决的课题,尚有待进一步探讨。
利益冲突
所有作者声明无利益冲突
作者贡献声明
刘侃:研究实施、论文撰写;庄然、郑淑园:统计分析、摘要翻译;王振禹、肖天:数据采集;赵佳:总体酝酿
Comparative analysis and reflection on comprehensive written test of Medical Practitioners Examination in China and Japan
Liu Kan 1 , Zhuang Ran 2 , Zheng Shuyuan 1 , Wang Zhenyu 3 , Xiao Tian 3 , Tian Tian 4, Zhao Jia 1
【Abstract】With the advancement of the competency-based medical education reform, both China and Japan have carried out a series of reforms to test the competencies of clinicians in respective Medical Practitioners Examinations (MPE). How to reconstruct a high-fidelity representation of clinical environments by designing examination questions to assess comprehensive ability and clinical thinking in a simulated setting, has become anurgent problem to be solved in the medical examinations in both countries. By comparing the questions of Medical Practitioners Examinations between China and Japan, it is concluded that both countries are committed to improving the quality of clinical case type examination questions. The Japanese clinical case type examination questions, starting with increasing the proportion of fusion type examination questions , making clinical case type examination questions with higher cognitive levels, practically exanining examinees' information processing, disease inductionand reasoning, and ability to make decisions at the moment, which are valuable to inform China's MPE.
【Key words】Medical Practitioners Examination; Case-based test questions; Competence; Clinicathinking; Clinicians
参考文献
reference
向下滑动查看所有内容
(收稿日期:2022-04-24)
(本文编辑:梁峰霞)
特别声明
声明:本微信公众号对所有原创、转载、分享的内容、陈述、观点判断均保持中立,推送文章仅仅是出于传播信息的需要。若有来源标注错误或侵犯了您的合法权益,请原创作者持权属证明与我们联系,我们将及时更正、删除。谢谢!
相关链接
杂志投稿官网
联系地址
联系电话
联系邮箱
zazhi@bjmu.edu.cn
版权声明
本文仅代表作者观点,不代表本站立场。
本文系作者授权【久伴学 9banxue.com】发表,未经许可,不得转载。