现在 PubMed 数据库越来越大,在浩如烟海的文献中如何找到自己最需要的文献越来越麻烦。PubReMiner 是一个很好用的工具,不仅可以利用 PubReMiner 汇总分析 PubMed 查询结果提高查询效率,另外还可以为论文选择可投期刊,查找某一研究领域的专家,并且还可以确定某一专家的研究方向。但是有许多人还是对 PubReMiner 不是太清楚,科研动力本文介绍一下 PubReMiner 常见的问题。
PubMed 数据库现在越来越大。在 PubMed 中检索时,可能得到很多的结果。但是这些结果可能并不是自己全部需要的。因此就需要对检索结果进行筛选,通过增加或变换检索词限制检索条件。但是改变哪些检索词更有效有些人可能不清楚。
PubReMiner 就是这样一个工具。可以先进行模糊搜索,之后通过增加/删除检索词/作者/期刊引导用户进行检索。检索词/作者/期刊以降序排列,因此可以清晰的了解哪些检索词才是最佳的组合。
另外还可以看到发表该类文章最多的期刊,在投稿的时候有助于选择命中率高的期刊。还能看到发表此类文章最多的专家,不仅在选择审稿人时有目的性,而且还能得出大牛的研究方向面获得研究思路。
使用方法
PubReMiner 可以利用 PubMed 的检索式就能检索。如果不会写检索式,可以利用 PubMed 的高级检索方法,最后得到的检索式 PubReMiner 也可以识别。详见:利用 PubReMiner 汇总分析 PubMed 查询结果提高查询效率。
当然也可以直接在 PubMeder 中直接输入检索词,但是这样可能会导致检索结果过多,而 PubReMiner 对检索结果有数量要求,一次最多只能处理 1 万个文献。因此如果检索式太简单,检索结果又更多时,会超出 PubReMiner 的处理能力。因此对于热门研究,建议检索式最好更具体一些,不然结果太多会报错。
当提交检索式的时候,PubReMiner 可以处理检索要求,并把结果以频率表的形式显示,以关键词出现的次数多少降序排列。比如我们检索一下最近两三年闹的挺凶的埃博拉病毒,在检索框中输入「Ebola virus」可以得到 3075 篇文献,此时需要把「Absract Limit」调成显示「10000」篇才能正常处理。
可以看到 PubReMiner 把检索结果根据不同的条件进行了降序排列,2014 年埃博拉病毒的研究呈爆发式增长,因为这一年出现了埃博拉病毒的流行,因此研究的也就相应的多了起来。
此时可以选择相应的限制条件,如选中某些期刊,或者还可以加上某些作者,或者加上一些 Mesh 词,通过「Operator」下拉列表中的「AND」还是「NOT」增加检索词或者排除某些结果。这样可以更能缩小检索结果,这比 PubMed 更直观,更有效。
结果分析
对 PubReMiner 的检索结果进行分析,我们可以得到很多有用的信息。
例如检索「PHOX2B」基因时,可以立即在检索结果中看到诸如转录,神经元,胚胎学和同源异型结构域。这些提示表明「PHOX2B」可能是一个转录因子,有同源异型结构域,在神经元的发育过程中可能起到重要的作用。
再比如上面有关埃博拉病毒的研究,可以看到发表这类研究最多的是「J Virol」,我们在投稿时可以根据这些期刊选择合适的投稿期刊。
在作者一栏还可以看到发表有关埃博拉病毒文献最多的作者是「FEKDNAN H」,如果想了解一下这位作者的全部研究,可以选中这位作者,然后「Search Again」,只看其研究。另外在投稿时有些杂志要求作者提供审稿人,可以根据 PubReMiner 的检索结果进行查找相关的专家。
另外 PubMeder 还可以用于研究课题的选择。首先选择一个研究方向,然后根据这个方向进行搜索,可以根据 PubReMiner 的检索结果看到当前研究的热点是什么,适不适合自己,不断的调整检索条件,相信会找到一个研究课题的。这对尤其是对研究生开题时不知道研究啥有很大的帮助。
总之 PubMeder 有许多功能,使用好了对课题研究还是有很大帮助的。
注意事项
使用 PubReMiner 时有几个问题需要注意和说明一下。
- 每一列中都有一个「OR」选项,选中后表明同时检索两个或者多个词,如第一列的「Year」中一栏,如果选中「2015」和「2014」,表明同时检索 2014 年和 2015 年发表有关埃博拉病毒的研究。
- Word 一列中单词后面大都跟了一个星号(*) ,如「INFECT*」,这表明 PubReMiner 同时检索「infect」「infection」「infectious」等词,星号代表了省略了一些后缀。
- Word 一列中有两个计数,一个是「#」,一个是「Count」。这两个计数代表的数字不相同。其实「#」下的数字是代表仅检索检索词的文献数量,而「Count」是检索检索词相似单词得出的文献数量。再比如「infect」一行,「#」下的数字是「392」,指仅检索单词「infect」得出的文献数量;而「Count」一行的数九寒天是「397」,也就是指此时不仅检索了「infect」,还同时检索了「infection」「infectious」等词,因此「count」得出的文献数要比「#」得出的文献数大。
- 有的列中的数字是红色,并且是不可选的,这表明再检索时,增加这些词并不会影响检索结果,因此这些词以红色显示,并且不可选择。比如下面这个例子,「dermatoscopy」和「nevi」前面的数字是红色,即使这两个选项可以选择,选上之后再进行筛选检索结果,都不会产生影响。因此这些对筛选检索结果不起作用的词都以红色显示,并且不可选择。
- PubMed 允许检索一个 Mesh 的主根词,但是 Mesh 数据库可以指定更多的层次。PubReMiner 在检索的时候也把这些 Mesh 的层次呈现给用户,但是不能进一步选择主根词下的 Mesh 词,因此使用蓝色显示,并且不可以选择。并且主根词检索结果一般要大于下一级所有 Mesh 词的检索结果之和。如下图的 Mesh 主根词是「diagnosis」,在 Mesh 数据库中,又可以包括很多不同的 Mesh 词,如「pathology」等等,这些词的计数就是蓝色显示,并且不可选择。
- 每个选项后面都跟一个蓝色的「P」,点击可以到 PubMed 检索相应的选项
- 检索结果中是不显示摘要的,如果想查看摘要,需要通过「Goto Pubmed with query」按钮打开 PubMed 进行查看