用好这 12 大公共数据库,没有自己的数据也能发 SCI
科研论文时间
大家都知道发表论文需要有数据支持,但是很多临床大夫没有课题、没有经费、也没有数据。那是不是发不了 SCI,只能洗洗睡了呢?并不。
一些公共数据库可以提供大量的临床研究数据,很多还是免费的,这就解决了没有自己的数据还想发文章的难题。那么,常见的公共数据库都有哪些呢?
1、NHANES 数据库
图片来源:网页截图
NHANES 是美国人群营养横断面调查的数据库,包含了用于评估美国成人及儿童健康与营养状况的调查研究。它的独特之处在于,除了调查研究,还结合了检查结果。
NHANES 调查包括人口统计、社会经济、饮食和健康等相关的问题,检查结果包括生理测量、实验室检测报告等。
实际上 NHANES 的内容并不局限于营养学,头痛、偏头痛、动脉粥样硬化等疾病也有所涉及。
NHANES 这个数据库是不需要注册的,数据可以直接从网页上下载使用
网址:https://www.cdc.gov/nchs/nhanes/
2、CHNS 数据库
图片来源:网页截图
CHNS 是中国的健康与营养调查,由美国北卡罗来纳大学人口中心与中国的预防科学医学院联合进行的大规模的社会健康调查。
与 NHANES 不同,它就是单纯的调查,没有检查结果。
调查涉及很多方面,包括健康学、营养学、社会学、人口学、经济学等多个学科,数据内容包括健康调查、营养和体质测验、食品市场调查、计划生育调查等。
CHNS 也不需要注册,数据可以直接下载使用,而且农村和城镇的数据都有,比较全面。目前有不少学者通过 CHNS 数据库发表过论文。
网址:https://www.cpc.unc.edu/projects/china
3、KNHANES 数据库
图片来源:网页截图
KNHANES 是韩国健康与营养调查数据库,可以反映韩国人群健康和营养状况的现状和趋势。
内容非常全面,包括肥胖和体重控制、体育锻炼、医疗用途、疫苗接种和健康检查、活动限制和生活质量、损害(意外和成瘾)、安全意识、心理健康、妇女健康、教育经济活动、饮食行为等。
KNHANES 也是网页直接下载使用,无需注册。目前国人用的相对较少。
网址:https://knhanes.kdca.go.kr/knhanes/eng/index.do
4、MIMIC 数据库
图片来源:网页截图
MIMIC 是重症医学数据库,是最常用的数据库之一,数据非常丰富,包含很多种变量。
MIMIC 包括 MIMIC-II、MIMIC-III、MIMIC-IV、eICU、PIC(儿科重症)、HIRID 这 6 个数据库,其中使用最多的是 MIMIC-III。
MIMIC-III 是由麻省理工学院计算生理学实验室发布的重症监护数据集,包含有将近数万条 ICU 住院记录,涉及到 ICU、CCU、创伤、心外、神内、新生儿等多个方面。
MIMIC 的使用需要在网页上进行申请,通过伦理考核后才可以获取该数据库的访问权限。一旦通过,数据下载就是免费的。
网址:https://mimic.physionet.org/
5、SEER 数据库
图片来源:网页截图
SEER 是一个肿瘤相关的数据库,由美国国立癌症研究所建立,是北美最具代表性的大型肿瘤登记注册中心,收集了大量医学相关的原始数据。
这个数据库的内容包括人口统计数据、患者个人信息、原发灶位置、肿瘤大小、肿瘤编码、治疗方案、死亡原因等等信息。
SEER 的数据获取方法与 MIMIC 类似,也是需要提交申请、审核通过以后才可以获得使用权限。通过申请以后,下载数据就是免费的。
网址:https://seer.cancer.gov/
6、Dryad 数据库
图片来源:网页截图
Dryad 是受美国国家科学基金会资助的一家非营利性组织,内容比较综合,储存了医学、生物学、生态学等领域的研究数据,向全球开放。
一些杂志鼓励投稿者在 Dryad 上传原始数据,截止到 2018 年 2 月,共有超过 600 种期刊与 Dryad 合作。
因此 Dryad 汇集了多种学科文章的数据,可免费下载进行二次挖掘,并且不需要提交申请。
但是这个数据库也存在一些弊端,比如有些数据拿到后比较乱、也可能不全,需要耐心进行整理后才可以使用。
网址:https://datadryad.org/stash
7、BioLINCC 数据库
图片来源:网页截图
BioLINCC 是生物标本和数据采集信息中心,由美国国家心脏、肺和血液学研究所(NHLBI)建立,用于帮助科研人员更便捷地获取研究数据,同时提高项目转化率。
BioLINCC 包含了两类数据:一是 NHBLI 生物标本数据,由相关血液疾病部门进行管理;另一类是 NHBLI 临床研究数据,由相关心血管科学研究中心进行管理。
对于我们来说,临床研究数据用的比较多。这类数据主要来源于近 70 年来的流行病学研究和临床注册研究,囊括了来自 145 家中心数十万患者的数据。
临床注册研究的数据包括患者基线资料、中期随访信息、辅助研究以及预后资料(当然也包括实验室检查);流行病学研究数据包括在整个观察周期内获得的所有监测结果。
BioLINCC 数据库需要注册账号,需要申请,才能免费下载数据。在进行申请不同信息的时候,需要提交不同的书面材料和证明材料。
网址:https://biolincc.nhlbi.nih.gov/home/
8、GHDx 数据库
图片来源:网页截图
GHDx 是全球健康数据中心,是一个全球卫生和人口数据的目录。
目的在于通过对所涵盖主题的数据信息进行编目、提供指向数据提供者的链接或解释如何获取数据,以及在获得许可的情况下直接提供数据以供下载,从而帮助人们定位数据。
数据内容包括人口普查数据、调查、注册、指标和评估,行政健康数据以及与健康相关的财务数据。
网址:http://ghdx.healthdata.org/
9、NCMI 数据库
图片来源:网页截图
NCMI 是国家人口健康科学数据中心,是国家科技部和财政部认定 20 个国家科学数据中心之一。
集成涉及基础医学、临床医学、药学、公共卫生、中医药学、人口与生殖健康等多方面的科学数据资源。
还建立了 16 项特色专题服务,如农村三级医疗卫生专题服务、国民体质与健康专题服务、面向国际肿瘤转化医学专题服务、热点传染病预警与追踪专题服务等。
网址:https://www.ncmi.cn/
10、GEO 数据库
图片来源:网页截图
GEO 数据库是一个免费的公共功能基因组学数据存储库,使用简单友好。接受基于阵列和序列的数据,提供的工具可帮助用户查询和下载实验和整理的基因表达谱。
可以通过直接检索 GSE number 获取数据集,也可以用关键词检索。
网址:https://www.ncbi.nlm.nih.gov/geo/
11、EMBL-EBI 数据库
图片来源:网页截图
EMBL-EBI 是欧洲生物信息研究所数据库,拥有非常全面的免费分子数据资源,致力于开发数据库、工具和软件,从而进行数据查询、共享、以及可视化。
检索方法和 GEO 一样,可以使用检索 number,也可以用关键词法。大多都是原始测序数据,也有一些是表达矩阵,对于没有生信上游分析经验的小伙伴不太友好。
网址:https://www.ebi.ac.uk/
12、Figshare、Zenodo 数据平台
图片来源:网页截图
图片来源:网页截图
它们是类似 Dryad 的开放数据存储网站,目前相对来说用的不是很多,不需要注册申请,直接在平台上查询下载使用即可。
网址:https://figshare.com/、https://zenodo.org/
丁香科研精品技能课 1 分钱学
内含外泌体、SCI 写作、文献检索
综述指导教学等海量科研课
👇👇👇