
在许多在VHI下运营并直接向民众提供有偿服务的医院中,每位从业者都有一种“销售计划”。 通常通过不诚实的方式来实现该计划的实施,但要以牺牲被保险人为代价。 例如:
- 综合服务分为组成部分医疗操作,因此检查范围更大。
- 在治疗诊断时,需要进行过多的程序和研究,尤其是在医院最近购买了新设备的情况下。
对于自愿医疗保险(VHI)领域中的保险公司而言,这种滥用是一个巨大的损失项目,这些公司已经在激烈的竞争中被迫扩大其保险计划以吸引客户。 因此,就其本身而言,有专家医生参与账单的定期核查。 并且在发生违规的情况下-在医疗机构中进行所谓的“预防”。
所有这些都是一项长期而常规的工作,需要专家高度集中。 确实,服务的有效性受到与患者治疗历史和保险计划以及医院价格表特征相关的许多因素的影响。 自然,无论您在何处看到“常规”一词,都可以应用自动化。 我们做到了。 并非没有困难。
什么是非法服务
最近,我再次来到办公室隔壁的诊所,以获得有关VHI政策的服务。 发炎的痣几乎总是不可怕,但是观察皮肤科医生不会受伤(否则你永远不会知道)。
事实证明一切正常,但是医生拒绝对剩余的胎记进行例行检查,这些胎记是我软骨病的永久来源。 提到这样的事实,即此类服务未包含在保单中,并且下次专家检查保险公司时,她将被罚款。 医生是对的:在VHI计划下的保险案通常是急性疾病或慢性病的加重病。 所有这些情况都不包括预防检查,无论我要多少。
但是,并非总是来自医疗机构(或简称医院)的医生都清楚提供VHI服务的规则,甚至不自觉地遵守这些规则。 结果,在对被保险人进行治疗后,检查账目的专业医生可以看到例如以下内容:
同时,在医院的价目表中,有一项综合服务,其中包括两种按摩,并且比个别服务的价格便宜:
因此,对于每位(!)获得相似服务组合而不是复杂服务的患者,保险公司将蒙受损失。 当然,如果专家医生没有及时注意到这一点,并且不会在帐户中提供替换服务。
顺便说一句,如果您自己使用付费药,请务必检查帐户中会发生什么。 也许以大致相同的方式招募综合体。
牙科领域的另一个类似例子。如果您突然想做一个完整的口腔卫生,那么可以将其写成这样的支票:
几乎总是在医疗机构中提供“口腔综合卫生”服务,该服务已包括您在技术地图上用牙齿进行的所有操作。 根据规定,必须在发票上注明。 但是,如果综合设施要比全部设施便宜,那么在医疗机构中,他们很可能会采取相反的行动,希望保险公司不会注意到任何事情。
这些仍然是简单的情况。 我们进一步了解。
假设您有一个婴儿,并把他带到怀疑患有病毒性结膜炎的医生那里。 与其他任何疾病的治疗一样,医生应遵循临床实践和法规文件的指导。 例如,“护理标准”就像一张表格,其中列出了用于诊断和治疗特定疾病的强制性服务。 可以直接在
卫生部的
网站上阅读治疗您所谓的孩子的剧透。
但是,除了通常的付款服务外,保险还可能包括:
在研究该标准时,人们可以理解在这种情况下没有进行肺活量测定(这是确定眼压的一种方法)-而且,在眼部病毒性疾病的情况下,这是禁忌的。 我们的专家熟人只是简单地解释了这种非法服务:“如果诊所为新的医疗服务分叉了,那么它就必须以某种方式收回其成本。”
我们从哪里开始
我们为自己设定了一个目标,即使一家保险公司的专家医生从医疗机构进行账单检查的阶段自动化(我们不能向NDA披露所有名称,密码和外观)。 该计划如下:在机器学习模型的帮助下,在帐户服务的注册中查找并“突出显示”与以前识别的非法服务类似的服务。
为了教车区分“差”服务和“好”服务,我们需要有关被保险人的待遇以及专家在核对后从帐户中删除或替换了哪些服务的数据。 开了真实账户后,我们突然面对这样一个事实,即几乎不可能获得有关每种类型服务提供情况的明确统计数据。 事实证明,与MHI不同,VMI没有特定的医疗服务命名标准,在MHI中,医疗工作和服务的命名法典将严格对应所有服务。
例如,VHI中的专业卫生方法之一可以写成:
这些服务本质上也没有什么不同:
由于经常手动填写账单,这使情况更加恶化,并且由于打字错误,不必要的标记和缩写,这只会增加书写服务的可变性。 以下是此类难题的一些示例:
结果,几乎不可能理解它们在没有名称分类(以及使用文本分析技术)的情况下,如何在城市的不同地区甚至在不同的医院提供相同的服务。
我们使用SAS Visual Text Analytics武装自己,并首先使用机器学习和NLP技术进行了主题文本分析。 这有助于自动识别大量多样的服务中的所谓“主题”,即基于关键字组合,系统认为相似的一小部分文本。 我们与专家一起审查了所有结果,并概述了未来分类器的结构,并根据医学逻辑(例如,在“诊断”,“医生任命”等中)将所产生的“主题”组合成大类。 为了将训练集中的服务名称与结果类相关联,对于每个服务类,我们都在工具中编写了规则。
对于每个后续类,我们都重复了此步骤顺序,直到达到特定服务的详细程度为止。 因此,例如,从上面的示例来看,它看起来像是专业卫生方法的简化规则:
(OR,
"**",
"**", "**",
(ORDDIST_1, "a", "f"),
(DIST_2, "air*", "*flow"),
(DIST_2, (OR, "*", "*", "*"), "**"),
(DIST_3, "*", "*", "*"),
(DIST_2, (OR, "*", "*"), "**")
)
为什么这一切都是必要的? 为什么我们以这样一种困难的方式前进,而不是仅仅将所有东西都塞进神经网络?
自然地,我们没有任何标记的训练样本。 但是,主题领域本身的特殊性甚至是一个更大的障碍:由于缺乏对VHI中服务结构的严格要求,经常会出现例外情况和复杂的边境案件,不同保险公司的医学专家会以自己的方式进行解释。 规则的所有这些微妙之处使我们可以更准确地进行描述。
例如,这里的关键字是相同的,但是根据其顺序,服务的本质会完全改变:
牙齿修复冠
而且这是一种昂贵的骨科手术(顺便说一下,在VHI计划下很少见到这种手术)。
我们如何训练模型
在机器学习中,“您就是所吃的东西”规则非常有效。 如果将低质量数据“馈入”模型,结果将是相同的。 在我们的项目中,我们非常注意数据准备阶段。 在VHI领域尤其如此:保险公司从众多医院接收有关患者治疗的信息,每个医院都有自己的基地。 因此,当在医疗机构一侧填写帐户时以及将其加载到保险公司的数据库中时,都会出现错误。 结果,在检查数据时,我们发现帐户中提供了一项半服务,负价格以及患者性别的突然变化。
在考虑了纠正错误的方法之后,我们开始收集用于建模的指标。 我们对描述服务环境的各种信息感兴趣:服务本身的参数,其本质,与医疗机构互动的历史,被保险人的治疗历史等等。 总计,我们计算了超过2万个指标。 我们使用它们来训练模型,该模型自动揭示“不良”服务的特征模式。
然后,他们将模型应用于新帐户,并在每个医疗服务的对立评分中将得分从0改为1,这表明该服务与先前确定的违法行为有多相似:得分越接近1,相似度就越高。 实际上,这个数字背后是一个复杂的问题,对于一个人的决策过程来说并不总是显而易见的(就像机器学习中最常见的情况)。 如果您试图解释机器的逻辑,那么以简化的形式看起来像这样:
- 该服务属于“全面口腔卫生”类别(+ 0.01分) 。
- 先前的服务属于“去除牙菌斑”类别(+ 0.25分) 。
- 当前服务的费用超过3,000卢布(+ 0.1点) 。
- 该服务在克拉斯诺达尔的分支机构中提供(+ 0.05分) 。
- ...
如果结果结果是分数高于某个阈值,那么这对于专家是一个信号,该患者的服务需要在验证过程中进行特殊控制。 从这一刻起,开始对该事件进行详细调查,最后,专家医生做出他的最终裁决-“执行”或“仁慈”。 当然,不是患者,而是长期的服务。
项目总结
借助文本分析技术SAS来实现名称标准化的方法帮助组装了一个服务分类器(这在自动化之前是一个巨大的问题),并且使用机器学习模型来实现类似于先前确定的非法服务的服务定义。 根据系统内部测试的结果,我们确信我们能够确定帐户中最常见的错误类型,即:包括其他服务,偏离保险计划或标准治疗方案。
但是,这仅是VHI中实现自动化的第一步。 如果您仍然有疑问,或者您真的想知道我们还能做什么,请在
这里寻找我们。