打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
谷歌学术H5指数及其与汤森路透影响因子对比分析

欢迎点击「科学网」↑关注我们!


每年汤森路透(Thomson Routers)的期刊引用报告(Journal Citation Report, JCR)在中国都引起了高度的关注。原因是在中国科研评价中,科研论文是否发表在被科学引文索引(Science Citation Index, SCI)或科学引文索引扩展版(Science Citation Index Expanded, SCI-E)收录的杂志上,以及该杂志的影响因子的高低都起着举足轻重的作用,甚至成为某些部门和单位唯一的科研评价指标。近年来,依赖汤森路透JCR的科研评价系统受到了质疑、争议、批评和诟病,因而出现了寻求新的科研评价系统的呼声。


谷歌学术(Google Scholar)在2012年推出了一个杂志评价系统,即谷歌学术计量(Google Scholar Metrics),用来评价各个领域杂志的影响力。该系统主要包括H指数(h-index或Hirsch index),H核心(h-core),H中值(h-median),H5指数(h5-index),H5核心(h5-core)和H5中值(h5-median)。


H指数于2005年由美国加利福尼亚大学圣地亚哥分校物理学家乔治·希尔施(Jorge Hirsch)首先提出,原本用来评价某一个学者的影响力,计算基于论文总数及各论文被引用的次数,即某学者如果在其所有学术论文中至少有N篇论文分别被引用了至少N次,那么该学者的H指数就是N。例如,王教授共发表200篇论文,其中有至少50篇被引用至少50次,那么他的H指数就是50。


在谷歌学术计量系统,杂志的H指数指在所有发表的论文中有至少h篇论文分别被引用了至少h次,那么这份杂志的H指数就是h。例如,某杂志共发表5篇论文,分别被引用17,9,6,3和2次,那么这份杂志的H指数就是3;H核心指该杂志最高被引用的h篇论文,如上述杂志的H核心包括被引用17,9和6次的三篇论文;H中值指H核心中位数论文的引用次数,如上述杂志的H中值为9。


相应地,H5指数,H5核心和H5中值的计算基于那些收录在谷歌学术系统中的杂志最近5年的论文数量及各论文被引用的次数。例如,如果某杂志在过去5年内所发表的论文中至少有h篇论文分别被引用了至少h次,那么这份杂志的H5指数就是h。H5核心和H5中值依上述方法计算。谷歌学术计量报告虽然公布各杂志的H5指数,H5核心和H5中值,但最重要的还是H5指数。值得一提的是,只有那些在5年内发表了100篇以上论文并且至少有一个引用的杂志才会被收录到谷歌学术。


一、谷歌学术计量报告简介:


到目前为止,谷歌已经连续四年发布了杂志学术计量报告。今年(2015年)所发布的报告共包括7211份杂志,由于其中有1761份杂志在不同领域排名中重复出现,因此该报告中实际上只收录了5450份杂志。报告中给出了9种不同语言(英语、中文、葡萄牙语、德语、西班牙语、法语、意大利语、日语、荷兰语)杂志的前100名的信息。另外,该报告对英文类杂志的统计更详细,包括八大领域(商务、经济与管理、化学与材料科学、工程与计算机科学、健康与医学科学、人文、文学与艺术、生命科学和地球科学、物理与数学、社会科学)及261个学科杂志的详细分类排名。每学科只有top20杂志信息,所以没有其余中低档次杂志的排名信息。


谷歌学术指标系统中还提供了搜索功能,输入杂志名称关键词就会给出包含该关键词前20名杂志的排名信息。但是,与汤森路透的JCR数据库不同的是:JCR数据库有往年的报告信息而谷歌学术计量报告没有往年报告信息,所以这两者之间不能进行横向比较。


二、英文杂志Top20分析:


Nature(自然)杂志以H5指数377(H5中值为529),排名第一(图1),也就是在2010年到2014年这5年期间,Nature发表的所有论文中引用数不低于377次的共有至少377篇论文;而在今年汤森路透的JCR报告中,Nature以41.456的影响因子(Impact factor)排名第7。


New England Journal of Medicine(新英格兰医学杂志)以H5指数328(H5中值为520),排在第二。这个排名和汤森路透JCR报告的排名一致。

Science(科学)杂志,H5指数为316(H5中值为446),排名是第三位;而该杂志在汤森路透JCR报告中排在第16位。


著名Lancet(柳叶刀)杂志以其258(H5中值为415)的H5指数排在第四位,其排名也和汤森路透JCR报告中排名一致。


Cell(细胞)杂志和Proceedings of the National Academy of Sciences(PNAS,美国国家科学院刊)杂志以216的H5指数并列排在第五位;而它们的H5中值数据不同,分别为330和280。另外,这两个杂志在汤森路透JCR报告中影响因子分别排在第20和186位。


其他进入Top20的杂志H5指数分别为:Journal of Clinical Oncology(202)、Journal of the American Chemical Society(199)、Chemical Reviews(196)、Chemical Society reviews(194)、Physical Review Letters(194)、Advanced Materials(190)、Journal of the American Medical Association(184)、Circulation(182)、Nature Genetics(182)、Nano Letters(181)、Angewandte Chemie International Edition(181)、Nucleic Acids Research (172)、ACS Nano(170)、arXiv Cosmology and Extragalactic Astrophysics(astro-ph.CO)(166)。其中排在第十八位的Nucleic Acids Research杂志在汤森路透JCR报告中排在第213位。有趣的是,排在汤森路透JCR报告中第一名的超牛杂志CA: A Cancer Journal for Clinicians,其影响因子为115.84,而其H5指数为57,没有排进前100名。


图1. Top20杂志


三、H5核心论文发表时间分析:


H5指数是对某杂志过去5年期间所发表的论文引用数进行的评价,例如,2015年对2010-2014期间所发表对论文引用数进行的评价。笔者根据汤森路透JCR报告中的影响因子,选择了五份高中低档次发杂志,对H5核心论文发表时间进行力分析。这五份杂志分别为Nature,CA: ACancer Journal for Clinicians,Cancer Research,PLoS ONE和Cutis,他们的H5指数分别为377、57、138、161、16。


Nature:对Nature杂志的这377篇论文发表时间分析发现,其中2010年有163篇(43.24%),2011年有128篇(33.95%),2012年有76篇(20.16%),而2013和2014年各有9篇(2.39%)和1篇(0.27%)(图2A)。也就是说,该杂志H5指数的377篇论文主要是来自于2010-2012这三年(97.34%);2013和2014年的论文比例仅为2.66%。


CA: A Cancer Journal for Clinicians:对影响因子排名第一的综述性牛刊CA: A Cancer Journal for Clinicians的57篇论文发表时间分析发现,其中2010年有16篇(28.07%),2011年有17篇(29.82%),2012年有12篇(21.05%),2013年有7篇(12.28%),以及2014年的5篇(8.77%)(图2B),综述性牛刊的57篇论文在2010-2012三年的占78.95%,而后两年2013和2014年的论文所占比例“高达”20%之多(相较其他四份杂志而言)。




图2. Nature, CA: A Cancer Journal for Clinicians, CancerResearch, PLoS ONE和Cutis杂志H5核心论文发表时间分析

Cancer Research:对CancerResearch杂志的138篇论文分析发现,2010年有77篇(55.80%),2011年有41篇(29.71%),2012年有14篇(10.14%),而2013和2014年各有5篇(3.62%)和1篇(0.72%)(图2C)。从中看出,前三年论文数占95.65%,2013和2014两年仅为4.35%。


PLoS ONE:PLoSONE杂志的161篇论文,其中2010年有91篇(56.52%),2011年有45篇(27.95%),2012年有21篇(13.04%),而2013和2014年各有3篇(1.86%)和1篇(0.62%)(图2D);前三年论文数占97.52%,而2013和2014两年仅为2.48%。


Cutis:Cutis杂志的16篇论文,其中2010年有10篇(62.5%),2011年有5篇(31.25%),2012年有1篇(6.25%)(图2E)。从中看出前三年论文数占100%,而2013和2014两年没有论文进入H5考量范围。


分析如上数据发现,这五份杂志H5指数论文中,前三年(2010-2012)发表的论文所占比例78.95%-100%。除了综述性牛刊后两年占20%以上外,其余杂志学术指标中后两年的论文都在5%以下。也就是说,虽然谷歌学术计量报告声称H5指数是对杂志过去五年发表论文的引用数进行评估分析,但实际上只是对杂志前三年所发表论文的引用情况进行评估,因此可以说是对一个杂志的持久影响力进行评估。然而,汤森路透JCR报告是对杂志2012和2013年所发表的所有论文在2014一年中的总引用数进行统计分析,是对一个杂志的当前影响力进行评估。所以,只有同时使用这两种评价系统来对杂志进行综合评估才算相对全面和客观。


四、谷歌学术H5指数和汤森路透影响因子的关系:


笔者对120个杂志的谷歌学术H5指数和汤森路透影响因子进行分析后发现两者具有一定相关性,尤其是低影响因子范围的杂志(图3)。



图3. H5指数和影响因子相关性


但这个相关性对个别杂志不适用,例如:个别杂志的影响因子很高,而H5指数相对偏低;有的杂志则相反,H5指数很高但影响因子却相对偏低;也有些杂志虽然影响因子不同,但是有相同的或相近的H5指数,比如NanoResearch和CA: A Cancer Journal for Clinicians的H5指数都为57,而它们的影响因子分别为7.01和115.84,相差甚远。这是由于在过去的五年内,NanoResearch发表的论文总量为500多篇,是CA: A Cancer Journal for Clinicians杂志论文发表总量的5倍,也难怪如此低影响因子的杂志会和CA: ACancer Journal for Clinicians有相同的H5指数,即Nano Research的500篇论文中有57篇论文的单篇引用数超过57次,而CA: A Cancer Journal for Clinicians的100篇论文中也有57篇论文的单篇引用数超过57次;就算CA: ACancer Journal for Clinicians的全部(100篇左右)论文的单篇引用数都超过100,那它的H5指数也就才100,挤进H5指数排名的Top100都有困难。


同样,PLoS ONE的H5指数为161,即在该杂志近五年内发表的10.6万多篇(106936)论文中,有161篇(占总发表量的0.15%)的单篇引用数超过161次。H5指数似乎更强调“大网捞鱼”,论文发表数量多的杂志很占优势(图4)。笔者从汤森路透官网收集了Top20杂志的2010-2013四年的论文发表总量,如图1数据显示:Top20杂志多数既有较高的“论文发表总量”,同时也有较高的“单篇论文引用数”;这两者犹如天平的两端,像CA: ACancer Journal for Clinicians这样的牛杂志,由于总论文发表量低,导致其H5指数偏低。


图4.影响谷歌学术H5指标和汤森路透影响因子平衡的两大因素


也有少数杂志是影响因子很高,H5指数也很高,比如新英格兰医学杂志(图3红框内最上面的杂志),前提是该杂志论文发表数量要足够多。谷歌学术H5指数前100名杂志的汤森路透JCR排名和影响因子见附表。


五、谷歌学术H5指数优缺点


优点

1.汤森路透集团JCR报告需要购买账号查询,而谷歌学术H5指数查询是免费的。

2.H5指数对9种不同语言的出版物前一百名进行评估分析,因此有广泛代表性。

3.H5指数不受有超高引用单篇论文的影响,相对比较客观。

4.谷歌学术数据库收入范围非常广泛,不仅包括学术期刊,而且还收录书籍、会议、以及各种预印本。


缺点

1.主要评估杂志近五年内头三年所发表论文的引用情况。

2.偏重年发表论文量大的杂志。

3.由于不能查看谷歌的H5指数往年数据,所以不能进行年度横向对比(除非有心人每年都存下当年数据)。

4.谷歌学术指标数据库只提供了英文杂志各领域前20名杂志信息,其余中低档次杂志信息未知。

5.谷歌没有提供对各领域及学科分类的标准,也没有提供每个杂志所隶属的学科信息。

综上所述,谷歌学术指标具有一定的代表性和指导意义,但由于谷歌的学术指标才发布了四年,有些问题仍有待完善,比如杂志数据库收录的各项指标等,一旦修改就会影响全部数据。

笔者花费数日完成以上数据的分析,希望惠及您及您的同事,并期望与您共同学习交流。更多精彩内容请继续关注美捷登。


进一步阅读请参考

http://scholar.google.com/intl/en-US/scholar/metrics.html#metrics

https://scholar.google.com/citations?view_op=top_venues

http://scholar.google.com/intl/en-US/scholar/metrics.html

http://nihlibrary.campusguides.com/c.php?g=38330&p=244518

EnriqueOrdu?a-Malea, Emilio Delgado López-Cózar. Google Scholar Metrics evolution: ananalysis according to languages. Scientometrics, 2014, Volume 98, Issue 3, pp2353-2367


附表:谷歌学术H5指数Top100杂志及其汤森路透JCR排名和影响因子

杂志名称 H5指数(JCR影响因子) H5中值 H5指数排名 JCR影响因子排名#

Nature 377 (41.456) 529 1 7

The New England Journal of Medicine 328 (55.873) 520 2 2

Science 316 (33.611) 446 3 16

The Lancet 258 (45.217) 415 4 4

Cell 216 (32.242) 330 5 20

Proceedings of the National Academy of Sciences 216 (9.674) 280 6 186

Journal of Clinical Oncology 202 (18.428) 296 7 56

Journal of the American Chemical Society 199 (12.113) 263 8 133

Chemical Reviews 196 (46.568) 351 9 3

Chemical Society reviews 194 (33.383) 282 10 17

Physical Review Letters 194 (7.512) 271 11 286

Advanced Materials 190 (17.493) 262 12 62

The Journal of the American Medical Association 184 (35.289) 277 13 13

Circulation 182 (14.43) 278 14 99

Nature Genetics 182 (29.352) 268 15 25

Nano Letters 181 (13.592) 257 16 110

Angewandte Chemie International Edition 181 (11.261) 243 17 147

Nucleic Acids Research 172 (9.112) 296 18 213

ACS Nano 170 (12.881) 255 19 122

arXiv Cosmology and Extragalactic Astrophysics 166 (NA) 233 20 NA

Journal of the American College of Cardiology 163 (16.503) 244 21 73

NBER Working Papers 163 (NA) 233 22 NA

Nature Materials 162 (36.503) 259 23 12

arXiv High Energy Physics - Phenomenology (hep-ph) 162(NA) 236 24 NA

PLoS ONE 161 (3.234) 210 25 1458

The Astrophysical Journal 155 (5.993) 202 26 426

Nature Medicine 153 (27.363) 228 27 27

Blood 152 (10.452) 202 28 162

arXiv Mesoscale and Nanoscale Physics (cond-mat.mes-hall) 148 (NA) 204 29 NA

arXiv High Energy Physics - Experiment (hep-ex) 146 (NA) 221 30 NA

arXiv Materials Science (cond-mat.mtrl-sci) 145 (NA) 225 31 NA

British Medical Journal 143 (17.445) 191 32 63

Nature Biotechnology 141 (41.514) 221 33 6

Energy & Environmental Science 141 (20.523) 191 34 45

Nature Nanotechnology 140 (34.048) 218 35 15

Journal of High Energy Physics 140 (6.111) 208 36 412

The Cochrane Database of Systematic Reviews 140 (6.032) 207 37 417

Neuron 139 (15.054) 198 38 85

Gastroenterology 138 (16.716) 190 39 71

Cancer Research 138 (9.329) 179 40 201

Physical Review D 138 (4.643) 178 41 687

The Lancet Oncology 137 (24.69) 228 42 31

Nature Photonics 133 (32.386) 201 43 19

The Journal of Clinical Investigation 133 (13.215) 180 44 116

Nature Reviews Cancer 131 (37.4) 250 45 10

Nature Reviews Genetics 131 (36.978) 232 46 11

Nature Physics 131 (20.147) 183 47 46

Physical Review B 131 (3.736) 172 48 1085

arXiv Quantum Physics (quant-ph) 130 (NA) 186 49 NA

Chemical communications (Cambridge, England) 130 (6.834) 169 50 333

Nature Immunology 129 (20.004) 218 51 48

Nature Reviews Molecular Cell Biology 129 (37.806) 216 52 9

The American Economic Review 129 (3.673) 196 53 118*

Hepatology 129 (11.055) 181 54 152

IEEE Conference on Computer Vision and Pattern Recognition, CVPR 128 (NA) 203 55 NA

European Heart Journal 128 (15.203) 202 56 84

Immunity 128 (21.561) 177 57 41

Nature Reviews Immunology 127 (34.985) 214 58 14

Monthly Notices of the Royal Astronomical Society 126 (5.107) 177 59 567

Nature Methods 125 (32.072) 185 60 21

Nature Neuroscience 125 (16.095) 175 61 76

Annals of Internal Medicine 125 (17.81) 166 62 58

Journal of Materials Chemistry 125 (NA) 164 63 NA

The Journal of Neuroscience 125 (6.344) 158 64 377

Molecular Cell 123 (14.018) 171 65 107

Accounts of Chemical Research 122 (22.323) 190 66 36

NeuroImage 122 (6.357) 168 67 376

Nature Communications 121 (11.47) 163 68 145

Nature Reviews Neuroscience 120 (31.427) 202 69 22

Biomaterials 120 (8.557) 156 70 232

arXiv High Energy Physics - Theory (hep-th) 120 (NA) 153 71 NA

The Journal of Experimental Medicine 119 (12.515) 173 72 126

The Lancet Neurology 118 (21.896) 191 73 39

Diabetes Care 118 (8.42) 178 74 241

Nature Cell Biology 118 (19.679) 165 75 49

The Journal of Physical Chemistry C 118 (4.772) 151 76 659

Clinical Cancer Research 118 (8.722) 148 77 224

Cell Stem Cell 117 (22.268) 187 78 37

Cancer Cell 117 (23.523) 177 79 33

Advanced Functional Materials 117 (11.805) 162 80 140

American Journal of Respiratory and Critical Care Medicine 117 (12.996) 160 81 118

Environmental Science & Technology 117 (5.330) 159 82 539

Pediatrics 116 (5.473) 168 83 506

Astronomy & Astrophysics 115 (4.378) 160 84 791

Clinical Infectious Diseases 114 (8.886) 153 85 219

Science Translational Medicine 114 (15.843) 153 86 78

Journal of Allergy and Clinical Immunology 114 (11.476) 147 87 144

Journal of Financial Economics 113 (4.047) 173 88 84*

Journal of Biological Chemistry 113 (4.573) 141 89 710

Renewable and Sustainable Energy Reviews 112 (5.901) 165 90 436

Bioresource Technology 112 (4.494) 163 91 743

Chemistry of Materials 112 (8.354) 156 92 246

CEPR Discussion Papers 112 (NA) 149 93 NA

The Journal of Clinical Endocrinology & Metabolism 112 (6.209) 144 94 400

Applied Physics Letters 111 (3.302) 142 95 1398

Genes & Development 110 (10.798) 154 96 157

Nature Reviews Microbiology 109 (23.574) 164 97 32

Nature Chemistry 109 (25.325) 157 98 30

Physics Letters B 109 (6.131) 150 99 410

IEEE Transactions on Industrial Electronics 109 (6.498) 147 100 359

#:JCR science edition rank; NA: Not available; *: JCR Social Sciences Edition



本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
研究方法 | SCI期刊分区,一次性整明白!
江晓原:我们不能再跪拜影响因子了!
一文读懂如何快速查询中科院JCR分区和汤森路透JCR分区
发文章还仅盯着SCI,影响因子?参考一下JCR和GSM吧
最新!2019年中科院分区表更新!!(附查询方法)
这都不了解,就敢说自己发过SCI?
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服