有时候我们经常看到某篇文献的一句话,可能是在其他论文或者网站中引用的,可是却没有给出出处,如何通过这句话才能找到原文呢?或者更有甚者,有的文章只给出了其中的一个作者或者其他一些信息,如何通过这些信息找到原始文献出处呢?科研动力本文就两个例子说明一下,希望对大家有所帮助。
通过一句话找到原始文献出处
首先看看如何通过一句话找到原始文献的出处。其实这个问题是看到丁香园某个网友问的,那我就借用他给出的这句话找找原文。
这位网友给出的这句话是这样的
it is therefore not too surprising that epidermal cells secreted less kgf in AhR-deficient cultures, in particular as the gene has four putative xenobiotic-responsive elements in its promoter.
看这句话的意思是:因此在无AhR成分(这鸟是什么不用管,这东西要联系上下文才能知道是什么)培养情况下,表皮细胞分泌较少的kgf(这厮也要看上下文才可明白是什么)也就不会大惊小怪了,尤其是这个基因在启动子处有4个可能的外源性反应元件。
大致就这个意思。根据这句话的意思推测很可能是生物医学方面的文章,那生物医学方面的文章查询首推PubMed了。
因此打开PubMed,直接把这句话输进去看看。我去,直接显示「No items found」。
是不是关键词太长了,因此可以减少一些关键词看看。从这句话中我们可以了解这句话最主要的几个词是「epidermal cells 」,「kgf 」,「AhR」,「cultures」和「gene」。因此用这几个关键词重新检索一遍看看。输入「epidermal cells kgf AhR cultures gene 」,检索一看还是显示「No items found」。
看来这篇文献的杂志PubMed很可能没有纳入到数据库中。肿么办?
这时候就需要Google了。打开Google,输入「it is therefore not too surprising that epidermal cells secreted less kgf in AhR-deficient cultures, in particular as the gene has four putative xenobiotic-responsive elements in its promoter」,发现只命中7篇。可惜这7篇中没有一个看样子是的,因为这7篇的结果都把这句话打散了。
继续缩短检索式,以「it is therefore not too surprising that epidermal cells secreted less kgf in AhR-deficient cultures」检索看看。只找到13个结果,可是看样子还不是。打开第一篇文献看看,是题为「Keratinocyte growth factor signalling: a mathematical model of dermal±epidermal interaction in epidermal wound healing」的一篇文献。先不用急,打开全文看一下,利用「Ctrl+F」查找一下有没有关键词「AhR」,居然没有这个词。那「kgf 」呢,这个到是有,原来KGF是「keratinocyte growth factor」的缩写,即表皮生长因子。而且通篇粗略看了一下,大致是建模的意思。与所需信息不符,忽略掉。
在Google中继续缩短检索式看看,以「epidermal cells kgf AhR cultures gene 」这几个关键词检索一下。这次到是命中的多,尤其是第一篇,含有的关键词最多。打开这篇题为「ARNT controls the expression of epidermal differentiation genes through HDAC- and EGFR-dependent pathways」的文献看看是不是。粗略读了一下文献,还不是啊。
第三篇的命中的关键词也不少,打开这篇题为「Cross-talk between intraepithelial γδ T cells and epithelial cells」原来AhR是转录因子中的一员,是一个受体,全称是「aryl hydrocarbon receptor」。这篇文章中有这么一句话:
Conditional knockout animals have demonstrated that it is specifically a deficiency in AhR in the DETC themselves that is responsible for the lack of retention in the epidermis [70].
有点意思了,看这句话的引文是第70个,打开这个引文看看。这篇题为「Exogenous stimuli maintain intraepithelial lymphocytes via aryl hydrocarbon receptor activation」是发表于Cell的和一篇文章,Cell可了不得啊。可惜这篇文章主要是关于 Specialized intraepithelial lymphocytes (IELs) 和 AhR 的,看来与所找的文献不太一致 。
到此还没打到,肿么办呢?那就用AhR和KGF的全称检索看看。以「keratinocyte growth factor AhR deficient cultures」关键词进行检索,检索出来不少,从第一篇往下看,第二篇就包含「AhR-deficient」这个关键词,为什么要看这个关键词呢,因为从原句看AhR-deficient是一个很重要的信息。打开第二篇「Activation of the aryl hydrocarbon receptor sensitises human keratinocytes for CD95L- and TRAIL-induced apoptosis」文献,略读了一下,发现与原句的主要内容表达还是有差距的。
第6篇文献包含关键词「keratinocytes, growth factor, AhR deficiency」,打开看看是题为「Dioxin Receptor Expression Inhibits Basal and Transforming Growth Factor β-induced Epithelial-to-mesenchymal Transition」,略读一下看样子不是。
就这样找,一篇篇的文献粗略的看一下。慢慢来,终于在第4页的第一篇文献发现了些踪迹。
打开这篇题为「Role of AhR/ARNT system in skin homeostasis」的文献,粗略的读了一下,发现在文中的第7页有这么一句话:
When cultured, AhR-deficient Langerhans cells show insufficient maturation and decreased expression of costimulatory molecules such as CD40, CD80, and CD24a. In keeping with this notion, AhR-deficient mice exhibit significantly weaker contact hypersensitivity to hapten[30].
这句话参考的是Jux B, Kadow S, Esser C (2009) Langerhans cell maturation and contact hypersensitivity are impaired in aryl hydrocarbon receptor-null mice. J Immunol 182(11):6709–6717. doi:10.4049/jimmunol.0713344。
打开这篇引文,从摘要到全文充斥着「AhR-deficient」,而且多数与要查询的那句话意思一致。如
We found that AhR-deficient LC were impaired in maturation; they remained smaller and less granular, did not up-regulate expression of costimulatory molecules CD40, CD80, and CD24a during in vitro maturation, and their phagocytic capacity was higher. Interestingly, the mRNA expression of tolerogenic Ido was severely decreased in AhR-deficient LC, and enzyme activity could not be induced in AhR-deficient bone marrow-derived dendritic cells. GM-CSF, needed for LC maturation, was secreted in significantly lower amounts by AhR-deficient epidermal cells.
但是好像还不是,但是继续往下读,呵呵,在讨论中发现了这句重要的话:
「It is therefore not too surprising that epidermal cells secreted less GM-CSF in AhR-deficient cultures, in particular as the gene has four putative xenobiotic-responsive elements in its promoter (46).」
其参考的文献是46:「Sun, Y. V., D. R. Boverhof, L. D. Burgoon, M. R. Fielden, T. R. Zacharewski.2004. Comparative analysis of dioxin response elements in human, mouse and rat genomic sequences. Nucleic Acids Res. 32: 4512-4523. Abstract/FREE Full Text」!
好了,至此终于找到这句话的出处,原来出自该文。不过引用这句话文献或者报道引用的时候引都没有完全引对!当然我没看全文,不知道上下文如何,因此这个结论有点武断。但是GM-CSF和KGF是完全两个不同的细胞因子啊!
如何根据部分信息查找原文出处
上面说的是根据一句话查找原文,有的时候部分报道仅提到了作者,就一篇新闻稿。那如何利用新闻稿中的信息找到引文的出处呢?
我们以MedlinePlus一篇新闻报道为例说明一下。
MONDAY, June 15, 2015 (HealthDay News) -- The more babies breast-feed, the less likely it is that they will develop any kind of misalignment in their teeth later on, a new study shows.
But pacifiers can negate some of that potential benefit, even if the children are breast-feeding, the Australian researchers said.
"While most benefits of breast-feeding can be attributed to the breast-milk, this study highlights one of the ways that the actual act of breast-feeding imparts its own benefits," said Dr. Joanna Pierro, a pediatric chief resident at Staten Island University Hospital in New York City.
……
从这篇新闻稿中我们可以了解一些重要信息。首先这篇文章肯定是发表于2015年5-6月份之间。因为新闻稿要求的就是及时,而杂志发表又有一个周期,因此时间上可以往后推一个月。
另外这个研究是关于母乳喂养的,研究发现母乳喂养可以减少孩子将来的牙齿错位。研究团队是来自于澳大利亚。Dr. Joanna Pierro可能是合作作者之一,他是纽约史丹顿岛大学医院(Staten Island University Hospital )的儿科主任。
知道了这些信息基本上就可以着手找原文了,如果不行将来再添加信息。在PubMed中我们以关键词「babies breast-feed misalignment teeth Australian Joanna Pierro 2015」进行检索。
有人问为何检索词搞这么长干吗?因为多个检索词可以提高命中率,但是会减少漏检的可能性。不过我们就想一下就命中,减少甄别和翻页的时间。因此可以先用多个关键词进行检索,不行再换短的关键词,就如同上例一样。
呵呵,看来这个多个检索词不行,PubMed一篇没命中。那就先去掉Joanna Pierro,因为这位教授可能不是作者,只是对这篇文章进行评价。还是一篇没有命中,悲催啊!继续减少关键词个数,当减少到「babies breast-feed misalignment teeth 」这4个关键词的时候,PubMed还是一篇没有命中。
这时候就应该想想了,是不是关键词出了问题。这时候就需要更换一下关键词了。首先换掉的是「misalignment」,为什么首先要换掉这个词,因为新闻稿要求的就是夺人眼球,因此有时候用词可能比较偏激。另外部分新闻稿也可能挑选一篇研究文章中自己感兴趣的东西来报道,而忽略了其他一些信息。而且这应该是一篇SCI,单单研究一个牙齿错位可能有点单薄,原文中牙齿的问题可能是其中的一个小的结果而已。所以我用「babies breast-feed teeth 2015 」检索命中4篇,可是这4入篇作者单位没有一个是澳大利亚的。
最后终于「babies breast-feed 2015 Australian」这5个关键词检索到8篇。其中第一篇「Cumulative risks and cessation of exclusive breast feeding: Australian cross-sectional survey」无论从题目,时间看都基本吻合。
下面的任务就是进行甄别到底是不是这篇文献了。看了一下摘要,好像也不是哦。肿么办呢?现在是需要再回过头来好好看看这篇新闻稿了。
在MedlinePlus这篇新闻稿中,又提示了一个重要的信息!
The researchers, led by Karen Peres at the University of Adelaide in Australia, tracked just over 1,300 children for five years, including how much they breast-fed at 3 months, 1 year and 2 years old. The study authors also asked how often the children used a pacifier, if at all, when the kids were 3 months, 1 year, 2 and 4. About 40 percent of the children used a pacifier daily for four years.
看来开始着急了,没有及时看一下这篇报道,这下好了,知道了作者和单位,还有研究样本数量,找起来就简单多了。那就先不用管研究内容了,直接找作者先。现在以关键词「Karen Peres Australia 2015 」进行检索,直接命中4篇。其中第二篇「Deciduous-dentition malocclusion predicts orthodontic treatment needs later: findings from a population-based birth cohort study.」作者及其单位到是对上了,但是内容好像不太对付。
没关系,直接点击标题下的作者查看一下该作者发表的文章。
可以看到这位作者共发4篇文章,但是这4篇文章一篇都没有相关的。我了了个去的!
再看看新闻稿,又发现一个重要信息:
The findings were published online June 15 in the journal Pediatrics
这下杂志也有了,那就加上作者和杂志,没有命中。那就去掉作者,只加杂志,妈妈个蛋的,结果太多了,669篇。加上Breast-Feeding,17篇,可是看上去没有一个像是的。
肿么办?每个杂志的主页都提供一个检索功能,PubMed也可以利用高级检索功能限制条件,但是哥懒的一个个限制条件了。我们可以利用Google搜索杂志的主页去检索特定的一期杂志,一个个对,不信找不到。
利用Google打到pediatrics的主页,不是文中提到发表于6月份一期吗,找到这6月这一期,居然没有!
利用高级检索功能,限制作者和时间为2015,终于找到了原文:「Exclusive Breastfeeding and Risk of Dental Malocclusion」,这下信息全对上了。
为什么杂志主页上有,可是PubMed却检索不到呢?而且PubMed是索引了Pediatrics这个杂志的啊?这是因为PubMed把杂志发表文章的数据纳入到数据库需要一段时间,这个时间差就导致了在杂志主页可以检索到最新的文献,可是在PubMed检索不到。不信过一段时间再在PubMed上检索一下这篇文献肯定能检索的到。
当然我们也可以处用Google直接检查,为什么没用Google直接检索呢?因为如果利用Google检索的话,很可能出现很多新闻报道,毕竟现在出了一篇新闻,大家都会相互转载和发表,即使可能是个蛋疼的研究,如我是如何把垃圾文章成功发表的一文中提到的情况一样。
如果利用专业的检索平台找不到的情况下,再利用Google查找可能会更好一些,最后可能利用Google找到结果,如本文的第一个例子。
小结
总之,利用一句话或者部分信息查找原文出处是一个细心耐心的活,急不得。我认为要有以下几个方面。
1. 首先可以利用现有的信息推测一下原文的类型,是论著还是报告,是哪方面的。然后根据现有的信息提取检索关键词。
2. 可以先利用专业的检索平台进行检索,关键词可以先是多个,这样可以提高命中率,减少文献的数量。
3. 如果多个关键词检索不到结果,可以不断的减少关键词个数,直到关键词不能再少了。再少结果就太多了,造成劳动量的急剧增加。
4. 如果专业检索平台检索不到文献,可以考虑使用Google了。当然也可以第一步就利用Google,但是不推荐Google学术检索,因为这样就把检索范围给人为的缩小了。
5. 利用Google检索时,一定要细心。可以看看检索结果中是否有自己需要特别重要关键词,如果有了再打开看看。看的时候可以利用「Ctrl+F」查找文中的关键词,这样看起来就快多了。
6. 不仅要看检索到的文献,还要看文献的引文。有时候可能我们需要的结果就是在检索到结果的引文中。
好了,就想到这么多,找到原文的出处,如果还想再找原文,那就是各人的本事了。当然科研动力也提到过如何查找全文,网友们有兴趣可以参考一下。推荐看一下:利用中文查找英文原始出处
另外我们的科研动力QQ交流群也有很多热心的网友,如@Thrilling大神,基本上是有求必应,谢谢!。在此也要非常感谢群友们辛勤的劳动和无私的付出!谢谢你们!!!