随着“互联网+医疗”的迅速发展,在线问诊平台逐渐兴起,在线问诊是指医生通过对话和患者进行病情的交流、 疾病的诊断并且提供相关的医疗建议。在政策和疫情的影响之下,在线问诊需求增长迅速,然而医生资源是稀缺的, 由此促使了自动化医疗问诊的发展。自动化医疗问诊可以实现人机对话来辅助问诊过程,医患对话理解是其中重要的模块。 医患对话理解主要包括两个任务,分别是命名实体识别和症状检查识别。
医生与病人进行自动化问诊之后,需要就诊疗过程进行就诊报告的撰写,对病人的整体情况情况进行描述。 为了缓解医生撰写就诊报告的压力,我们提出针对医患问诊过程,进行医疗报告的自动生成。
对于一个正常的线下问诊流程,病人会首先介绍自己的当前信息并提问,医生在得知病人的基本情况后, 通常需要连续问病人几个与症状、检查相关的问题后,便可告知病人可能患有的疾病类型并提供用药或者检查建议, 因此就诊的过程即是一个带有目的的序列化交互的过程。智能化医疗诊断是任务型对话系统的重点研究方向, 此次智能化医疗诊断比赛含有一个任务。
基于规定轮次内模型对疾病判断的准确率和症状判断的召回率进行计算,
赛道三要求选手们提供一个可交互的程序来模拟实际问诊过程,baseline中使用了基于强化学习的方式,参赛者可以自己选择合适的方式模拟该过程,如用基于规则的方法。
更具体地,在交互阶段,我们给定模型以初始输入,即患者初始症状 explicit symptom,如“有发热症状,无拉肚子症状”,患者往往不会把一次性把症状表述清楚, 所以模型可以与用户模拟器进行进一步交互,询问用户是否还有其他症状implicit symptom,用户和模拟器的交互轮次不超过11轮,否则用户模拟器会报异常。 模型应该根据当前询问到的病人信息尽可能准确地判断用户还可能具备什么症状,否则可能询问到无效信息。
用户模拟器在初始化时,接受数据集路径参数以供查询,在查询阶段,接受疾病id和症状两个参数,当查询轮次小于最大轮次时,
会返回“0”—用户无此症状,“1”—用户有此症状,“2”—不确定三种可能,否则将直接抛出异常。
详情可见评测文件夹中user_simulator.py
在一定轮数之后,程序需要对疾病进行判断,并且给出收集到的症状情况,我们会使用疾病判断的正确率和对病人所有应问询症状的召回率进行评分。
第一赛段,发布的医患对话数据集包括超过2000组医患对话案例样本,覆盖4种儿科疾病,样本平均对话次数约为40次, 平均每个样本的对话字数约为523个。第二赛段,新增2种儿科疾病,超过800组对话数据。数据的标注由中山医院医学背景的老师同学完成。
三个赛道分开排名,分开颁奖,分别设置以下奖项。