毛利小五郎的徒弟
可以做一个评分的统计模型,把数据库的变量纳入模型,然后进行评分。
huarenqiang5
在pgAdmin中选中数据库,右键选择Query Tool,接着打开sofa.sql,可以看到,除了原生数据之外,sofa评分还使用了icu_hourly, ventilation, vitalsign等衍生数据,如果说sofa.sql是个大BOSS的话,表中的内容就是打BOSS前刷的小怪,要把对应的sql一个一个运行,生成衍生的数据,都准备齐活了才能运行sofa.sql。
1. Postgres的时间函数
由于MIMICIV官方给的SQL语句是适用于BigQuery的,因而有些function在PostgreSQL中没有。好在MIMICIII的代码中提供了这些function.用pgAdmin打开postgres-function.sql后,把SET search_path TO mimiciii;删除并运行。
这样就可以在PostgreSQL中使用这些function了;不过,也可以修修改改。
2.逐个运行需要的function
CREATE TABLE mimic_derived.icu_times AS
此外,原代码中的table名是'physionet-data.mimic_icu.chartevent',这里需要去掉physionet-data.以及两侧的引号。
程序运行后,会出现一个‘mimic_derived’的SCHEMA,在此之下会有个叫icu_times Table。
3. Bug的重灾区icu_hourly.sql可以直接运行,因为function已经定义过了。如果还是一直出问题的话,可以直接用Postgres的函数,需要进行修改。
接下来的过程大同小异,运行自己需要的sql即可。
P.S. 全自动的方法比较适合Mac, Linux系统,Windows系统会比较麻烦。
loveliufudan
要评估MIMIC数据库的质量,可以考虑以下几个因素:
数据的质量:包括数据的准确性、完整性、一致性等等。可以通过检查数据是否存在缺失、重复、错误等问题来评估数据的质量。
数据的可用性:包括数据的获取难度、数据格式、数据存储等等。可以通过考察数据的获取渠道、数据的格式和存储方式等问题来评估数据的可用性。
数据的代表性:包括数据的样本数量、样本的分布、数据的时间跨度等等。可以通过分析数据的样本数量、样本的分布情况以及数据的时间跨度来评估数据的代表性。
评估MIMIC数据库的质量需要考虑多个方面,因此评分也可以从不同的角度进行。可以根据具体的需求和使用场景来选择适合的评分标准和方法。