【课题设计】不用补湿实验的临床模型类生信 SCI ,5 大设计要点!
科研论文时间
临床模型类的生信 SCI,是我们临床上手最快,也是发文最多的一种文章,目前还不需要补充湿实验验证,可以用其他数据库或数据集展开验证,发文 2-6 分不等。
构建模型的靶标可以是 mRNA,也可以是非编码 RNA 如 miRNA 等等,疾病可以是肿瘤,也可以是非肿瘤如阿尔兹海默症。典型的文章如下图所示:
文章详情大家可以自己检索原文研读下,这类文章的检索词可以是GEO+疾病+model,肿瘤的还可以是 TCGA+model(图片来源:网页截图)
不过,随着生信 SCI 发表的文章越来越多,对生信 SCI 课题设计的要求水涨船高。那么这么一类相对比较好上手的文章,课题设计要注意哪些文章才相对好发表一些呢?
第一点:课题设计具有足够的创新性
这是最重要的一点。因为这类文章发文已经相当多了,大家选择的数据集如果一样那课题其实重复性非常高,到时审稿人就非常容易 argue 这样的问题:
The lack of novelty. A wide variety of prognostic gene signatures for the prognosis of xx cancer had been developed and validated in a great number of previous studies (see examples of previous publications below).
The authors of the current study have failed to list sufficient specific novel approaches and/or findings from their current study compare to those of previous studies.
(然后列一堆别人发表的模型文章,问你跟这些比,有什么区别?创新点在哪?)
怎么才能更好地出创新性?其中一个很好的方法就是结合热点。
如下图刚发表的这篇文章,其创新点就是结合了细胞焦亡,铁死亡以及缺氧等。相关热点的 related gene,也是模型类文章可以很好结合出创新的一个点。
图片来源:网页截图
当然,为避免跟别人重复,平时还是建议多读文献,紧跟热点,多关注热点。
第二点:别忘了验证
有些期刊可以接受数据集验证,测试集和训练集验证,而有的比较强调湿实验验证,如 qPCR 等。这种最好在课题设计前对目标期刊的 aim & scope 提前研读把握下杂志需要哪些内容。
All the experimental data presented and analyzed in the current study were downloaded from publicly available databases. The authors of the current study have failed to contribute any original laboratory finding or clinic observation from their own study to the existing databases.
Unfortunately your manuscript cannot be accepted for publication in XXX. Indeed, this journal no longer accepts bioinformatics analysis-based studies.
You can resubmit your article to the same journal once you can provide an in-lab validation (i.e., Western blot and/or qPCR) of the four implciated genes A, B, C, and D.
第三点:参考别人发表的模型类文章,注意文章的时效性
今年都 2022 年了,你发模型文章再去参考 2019 年的,说实话有点老了。生信 SCI 行情变化还是相当快的,如果你是看到一篇文章觉得不错,就开始换个疾病进行模仿,那很可能会被别人抢发的。
文章可以参考,但一定要注意时效性,尽量参考最近发表的 SCI。比如 PubMed 检索:prognosis model,早 2018 年的就是纯粹的预后模型(如下图所示)。
图片来源:网页截图
2020 年就慢慢就需要聚焦热点相关的预后,而且研究的内容涉及的面越来越多,除了预后,免疫是最常结合的点。
图片来源:网页截图
那你参考 2018 年发表的生信 SCI 文章进行课题设计,那明显是不太适宜的。
所以当你有个比较好的 idea 时,先别着急,一定要先 PubMed 仔细检索下是否被发表过了、别人发表侧重的点是哪些、我怎么跟它区分开,有自己的独特的创新点。
第四点:数据注意更新
优秀的同学前面 3 点都注意到了,但结合热点相关的基因选取时,有的图省事,直接选取别人发表的 SCI 里面的 method 介绍的方法直接选择这些 related genes。
「从文章《Identification and Validation of a Novel Six-Gene Prognostic Signature of XXXXX》中获得和 XXX 相关的通路(XX 个 GO 通路和一个 Reactome 通路),共提取 XX 个 XXX 相关基因」,然后就选取这些基因展开下文的分析。这样做常规是可以的,但要注意下数据是否更新,免得后期审稿人 argue,说你选取的数据不全。
新更新的基因没有纳入分析,那后续「返工」相当于从第一步的数据获取就得开始重新分析,那工作量相当于从头开始的量了。数据分析环环相扣,关键的步骤别图省事,有时候的慢就是快。
第五点:分析的时候,注意细节并提供好详细的细节信息
The lack of detailed criteria for patient selection. The authors have failed to present detailed criteria for the inclusion and exclusion of patients enrolled into their current study, which makes it impossible to know whether the enrolled patients may also harbor other diseases that may significantly impact the laboratory test results and the prognosis.
模型类的文章,对于数据获取和筛选的详细参数,审稿人的要求还是比较严格的。这些细节提供详实,会加印象分,也会在你文章代码复现的时候容易发现问题。养成及时记录并检查的科研好习惯。
以上 5 点是临床模型类生信 SCI 课题设计需要注意的点,希望大家在课题设计前仔细评估下,在PubMed 及时检索有无类似的发表,对比别人发表的文章提炼出自己的创新点,并在分析过程中注意细节。
祝大家发文顺利!