文章專區

2022-07-15期刊影響因子對教職升等比重太高?學術成就該如何評估? 487 期

Author 作者 葉俊廷/陽明交通大學醫學系學士。

學術體系的成功與否和高教機構大學教授的招聘與升等制度息息相關;對於大學教授學術表現的評量方式,不僅反應了機構對於研究品質的認知,更會直接影響學術行為。本文將介紹筆者所屬由陽明交通大學醫學院院長陳震寰領銜的團隊研究結果(延伸閱讀1),以質性和量性的方式,分析臺灣12所醫學院升等規範對於學術論文發表的審核標準。團隊研究主旨在運用實證(evidence-based)研究精神,審視並改良教授升等評核機制。

現行升等規範的CJA系統

進入數位時代,隨著期刊的商業模式、論文發表形式日新月異,該如何評估科學家發表論文的品質或是機構的學術影響力,一直都是學界爭論不休的議題。在此處介紹的研究中,團隊引用了萊斯(Danielle Rice)等人於2020年發表的框架(延伸閱讀2)來分析醫學院的升等政策。萊斯的研究提出了一些傳統及新興的評估方式,並且調查國際知名的生醫研究機構的採用情形。相較於傳統的評估包括論文的篇數、期刊影響因子(journal impact factor, JIF)、得到的計畫經費等;新興的評估方式包括引用數、資料公開、開放取用(open access)、是否有讓懷孕或生病的教職員展延等。這些新興的評估方式已經漸漸被學界所接受,被認為是評估個人或機構學術表現很重要的參考標準,甚至比傳統的評估方式更不受偏誤(bias)影響。但萊斯的研究也發現國際間採用這些新興因子的比例並不高。

而我們用此框架分析全臺灣醫學院升等規範時發現,幾乎現在所有醫學院都採用相當類似的CJA系統評估框架,也就是透過計算發表論文的「論文類型」(category)、「期刊品質」(journal quality)、「作者序」(author)的積分,作為學術表現的成績。大學教授在升等的過程中每個職級都有對應的CJA分數門檻,著作的累積分數要超過門檻才符合申請條件。CJA系統中的期刊品質,則主要參考發表期刊的JIF或是期刊排名,然而期刊排名也是按照期刊在該領域的JIF排序而訂,因此在此系統中,評估論文品質的核心就是發表期刊的JIF。CJA系統中的三個元素都屬於傳統的評估方式,而臺灣醫學院除了對於懷孕或生病的教師提供展延這點之外,幾乎沒有採用任何新興的評估方式。從質性的分析我們發現,除了臺灣大學醫學院近幾年有稍作修改,幾乎所有醫學院都採用類似的積分系統,並且幾乎沒有納入近年來被認為對於評估學術表現更具參考性的新興參數。

以JIF為評估研究影響力與品質的主力,合理嗎?

仔細分析CJA系統可以發現,「論文類型」跟「作者序」在撰寫論文時已經決定,且與研究成果的實際影響力並無直接相關,而「期刊品質」幾乎等同於JIF,因此可以說JIF在CJA系統中,是用來判定研究品質及學術影響的唯一指標。但是此一指標對於升等有多大的影響呢?透過比較研究人員作為第一作者的原創文章(original article)發在JIF為20分的期刊,或是發在最低JIF的期刊,兩者換算出的積分各自佔升等門檻比例,可以一窺它的影響。計算結果顯示每間醫學院的分布都不太一樣,有些醫學院高分跟低分的文章積分相差非常多,差距最顯著者最低分只能達到40%的助理教授升等門檻,但JIF達20分的期刊則可以達到門檻的333%,也就是說在此醫學院,發一篇JIF為20分的文章可以抵8篇低分的文章。我們無從評判醫學院當初制定政策時的想法,或這樣的分數差距是否合理,但從這些分析當中能得出一個結論,也就是對於在臺灣醫學院要申請教職或是升等的科學家來說,JIF是最重要、甚至是唯一重要的因子。

究竟何謂JIF?為什麼臺灣醫學院,乃至臺灣大部分的大專院校都採用JIF作為評估研究影響力及品質的重要參數?如此強調甚至獨尊真的合理嗎?JIF的定義是該期刊在一定期間的平均引用數,即總引用次數除以可引用文章。採用JIF作為評估研究品質因子背後的思路是「JIF相當於文章引用數,而文章引用數相當於研究影響力與品質」。如果這個思路是正確的,那在臺灣醫學院如此強調JIF的政策之下,老師們應該會致力於發表高JIF的文章,並且得到高的引用數,但實際上是否如此?

我們查詢了萊登排名(Leiden ranking in biomedical and health science)這個國際排名資料庫,此資料庫統計並排序了全世界1000多個生醫研究機構的論文數量及引用數,發現臺灣醫學院的「論文發表總數」在全世界的前半段,但是「發表文章引用數佔該領域前50%的比例」及「發表文章引用數佔該領域前10%的比例」的排序就在中後段。此現象的成因需要更深入的研究探討,一個可能是JIF的確代表著高引用,只是臺灣醫學院的論文發表的JIF都不高 ; 另一可能是雖然這個升等系統之下的確老師都會發比較高JIF的論文,但高JIF並不代表高引用數。不論真正的原因為何,每一篇論文發表都要耗費大量的個人及社會成本,而在如此高的論文發表數量下,卻沒有達到相對應的引用數值得深思。

總的來說,我們的研究發現全臺灣的醫學院在招聘及升等時對於研究品質的衡量都採用類似的積分系統,而JIF是該系統的核心。同樣是一篇第一作者的原創文章,高JIF文章的積分會比低JIF的文章高出非常多,甚至一篇高JIF的文章就能超過助理教授的升等門檻許多。而在如此獎勵發表高JIF文章的政策之下,臺灣醫學院教授發表的論文引用數仍在國際的後段。雖然目前的研究還無法回答這些現象發生的主因,但顯見以JIF作為評量學術研究最重要、甚至唯一標準的框架需要重新評估。

國際趨勢反對以JIF評估個人學術成就

近年來國際科研社群已經有明確共識,反對以JIF作為評估個人學術成就的指標,其中最大規模的就是2012年的舊金山科研評價宣言(San Francisco Declaration on Research Assessment, DORA),目前已有來自158國家共2萬1729位個人或機構簽署,該宣言開宗明義便建議停止以期刊導向的參數(例如JIF或是期刊排名)當作計畫補助、聘任及升等的參考,可惜的是目前臺灣還沒有任何一間學術機構參與簽署。

為何國際間會有強烈反對利用JIF評估個人學術成就的共識?JIF跟期刊排名都是以期刊為主的參數,這樣的設計本質上就不是用來評量單一篇論文、個人或是機構。另外也有研究對過往的「JIF相當於文章引用數,而文章引用數相當於研究影響力與品質」的假設提出質疑。安東那亞基斯(Manolis Antonoyiannakis)等人分析了1萬1639個期刊發現,其中有381個期刊去掉最高引用的論文後,JIF會減少0.5分,更有10%的期刊去掉前三高引用的論文後JIF會直接少一半(延伸閱讀3)。此研究結果代表著期刊的引用並非常態分布,因此以JIF作為期刊平均文章引用數並無法反映或預測單一篇文章的引用次數,那就更無法當作該文章作者的學術成就指標了。

有許多研究建議以h指數(h-index)來代替JIF評估個人的研究成果,所謂的h指數即是「如果一個研究者有至少x篇論文有至少x次引用,他的h指數即為x」。h指數的好處是同時考慮了發表論文的質(引用數)跟量(論文數),並且不會被單獨一篇高引用數的論文影響。但h指數也有一些缺點,例如對於年輕研究者較不利,且沒有考量到作者序、研究領域等。雖說已有明確證據及共識支持避免用JIF評估個人研究成果,究竟要用何種參數替代,或綜合多種參數來評量學術成果都需要進一步的研究探討。即使臺灣學術機構無法短時間停止使用JIF,也應該研擬納入更多不同角度的評估方式,多面向地肯認學者們的研究成就,而不只是一味獎勵高JIF期刊的發表。

大學教授招募和升等政策直接反映了高等教育機構對於學術的認知與價值判斷,而該系統又會直接的影響學術研究行為。現階段,臺灣尚無本土研究系統性地回顧及反思學術機構如何衡量教師的學術表現和論文發表,及該系統可能的缺陷。臺灣高教機構應當對其人才評估政策進行多觀點、綜合質化與量化方式的回顧檢討,不僅參考國際間對於學術評估的研究成果與共識以改良系統,更要進行本土、單機構甚至多機構的研究與驗證,才能實質改善臺灣的學術環境。

延伸閱讀
1. Jiunn-Tyng Yeh et al., Faculty appointment and promotion in Taiwan’s medical schools, a systematic analysis, BMC Medical Education,22(1),1-10, 2022.
2. Danielle B Rice et al., Academic criteria for promotion and tenure in biomedical sciences faculties: cross sectional analysis of international sample of universities, Bmj, 369, 2020.
3. Manolis Antonoyiannakis, Impact factor volatility due to a single paper:A comprehensive analysis, Quantitative Science Studies, 1.2, 639-663,2020.