文章專區

2023-04-24有生態資料又有問卷訪談,該如何管理研究資料?CIRES x 研究資料寄存所交流報導

Author 作者 黃寶霈/臺灣大學圖書資訊學系研究專員。

本篇文章與研究資料管理推進室共同刊載

該如何結合自然科學與社會科學的力量,讓綠能發展與在地的社會生態系統之間取得平衡?資料管理方案(data management plan, DMP)又能在這其中提供哪些幫助?今(2023)年1月,中研院「研究資料寄存所」(depositar)拜訪位於東華大學的生態及永續科學跨領域研究中心(Center for Interdisciplinary Research on Ecology and Sustainability, CIRES)★註一★,針對執行中的國科會專題研究計畫★註二★:「以地景尺度生態系統服務評估建構地面型光電發展之社會生態系統整合治理」(以下稱此研究),分享資料管理上的經驗。接下來,就讓我們一起來了解社會生態系統研究,在資料管理上會有哪些特點吧。

★註一★CIRES自2020年初開始活躍,2021年3月正式揭牌,主要推動社會生態系統韌性研究,以跨領域合作策略為基底,解決複雜的社會生態問題。CIRES同時也是臺灣永續棧(Taiwan Sustainability Hub, TSH)分棧網絡的一員,為永續轉型議題提供系統性專業與實務經驗。

★註二★國科會自然科學及永續研究發展處自2020年8月開始推動資料管理方案試辦計畫,透過經費補助的方式,鼓勵了數個整合型計畫提出 DMP。★

為了解光電廠對於周遭生態與社會系統的影響,需要建立長期監測的基礎設施以蒐集資料。花蓮溪流域海拔500公尺以下的地區(包含壽豐、鳳林、光復等三個鄉鎮)具大面積的國有地、休耕地、平地造林,是未來花蓮設置光電場的首選地,因此被設定為此次主要的研究區域。其中在新光兆豐休閒農場周圍地區,已由多方業者偕同兆豐農場提出開發申請,第一期開發案為66公頃的生豐電廠,於去(2022)年12月開設。在其他光電場尚未設置或拓展之前,CIRES團隊希望以生豐電廠所在地域作為研究基石,探究其與周遭生態與社會系統互動的全貌。

此研究計畫對生態系統的研究,可粗略分為植物、動物、以及微氣象三面向,主要是以觀測為基底,探查自然環境與土地利用改變間的互動現況;至於社會系統,則從經濟衝擊、治理制度二處著眼,期能掌握利害關係者立場、理解規範制度架構,作為未來再生能源發展政策之決策依據。此研究最終期望藉由研究生態環境與社會制度的互動關係,創建能整合社會生態系統的光電場治理模式。

  1. 以觀測為基底的生態系統研究

就資料管理的角度而言,此研究有關生態系統的資料是針對特定區域進行監測的成果,以創建新資料為主,並無運用既有資料。新資料的產生途徑又可分為三大面向:田野調查自動儀器監測、以及實驗室分析。以下將從植物、動物、微氣候此三面向分別做討論,並介紹各資料蒐集與處理的方式。

在植物方面,木本植物為東華大學自然資源與環境學系教授孫義方主要的關注對象,他以邊緣效應(edge effects)★註三★為研究假設的基礎,探查在光電場設置期間木本植物發生了哪些變化。第一期開發案的生豐電廠位址的前身為人造林區域,森林遭砍伐後帶來的物理條件(如溫度、濕度、光照、風速等)變化,會影響留存的林區與其他作物的生長、繁殖、死亡率,最終造成環境中的碳變化。研究團隊進行植物調查與種子網設置蒐集資料:前者以六個月頻率調查植物樣帶內的木本植物死亡率,而後者則是兩週蒐集一次植物的落葉與花、果實等繁殖體(圖一)。此外還架設了溫溼度紀錄器,捕捉光電場邊緣與周遭人造林中的氣溫與濕度變化,建構整個研究計畫的基礎生態資料。

 

★註三★邊緣效應是指生物種群因應棲地交界變化而形成不同特徵的結果。不同物種對於棲地區域的傾向不同,若是傾向生活於棲地核心區域者被稱為內部物種(interior species);若是偏好邊緣地區的則被稱為邊緣物種(edge species)。

草本植物則由東華大學自然資源與環境學系教授陳毓昀負責,她從草本植物出發,評估地景變化對於授粉服務的影響。授粉服務程度主要受到蜜源、傳粉者拜訪率,以及微氣候條件的三者作用。在此研究中,陳毓昀以油菜花作為一種「探針」植物,將它放置在光電場周邊各區,並以完善的後設資料(metadata)記錄花朵各式特性,觀察人工授粉與自然授粉兩組的結果,作為植物授粉效率是否受地景變化影響的證明。

植物資料的蒐集處理:

資料蒐集回來後,團隊成員以雙輸入再比對方式,將紙本紀錄謄打為數位試算表,藉由關聯式資料庫保存資料,同時掃描紙本紀錄以保存。除了資料本身,資料產製的相關脈絡也是協助理解資料內涵的重要依據,故計畫團隊運用Morpho★註四★軟體建立對應的後設資料,確立表格的內容與其欄位定義。最後,資料與後設資料皆會被上傳到各子計畫的雲端空間以確實保存。


★註四★ Morpho:由美國生物複雜性知識網路(knowledge network for biocomplexity, KNB)為長期生態研究網(LTER Network)所設計的軟體,能編輯生態後設資料語言(Ecological Metadata Language, EML),目前有多國語言版本可供免費使用。更多Morpho資訊請見KNB網站:https://knb.ecoinformatics.org/tools/morpho

圖一   種子網與木本植物編號。 (圖片來源:研究資料管理推進室)

 

在生態系統的動物面向,東華大學自然資源與環境學系副教授許育誠與博士後研究員楊淳凱,分別針對鳥類與兩棲爬蟲類進行調查,監測土地利用型態變化的影響。動物調查皆使用自動照相機捕捉物種的出沒狀態。比較特別的是,因為兩棲爬蟲無法被紅外線監測照相機偵測,自動相機調整為縮時進行記錄。此外,為增加物種被清楚拍攝的機會,考量兩棲爬蟲類碰到牆面便沿著移動之特性,也在距光電場不同距離之位置架設擋板(圖二)。除了拍照外更搭配人力走動調查,搜查兩棲爬蟲類的物種分布。而在鳥類研究上,還採用排程錄音機,以每小時錄製五分鐘的頻率蒐集鳥鳴。

 

動物資料的蒐集處理:

除將拍攝到的物種與該張照片進行編碼之外,也以時間區段方式編號,將同一物種出現的起迄照片再特別標示出來。而研究中使用的機器設備相關資訊(如架設座標、廠牌、型號等),也被視為不可或缺的後設資料,連同資料一起存放於研究室外接硬碟並予以備份。

 

圖二   於樣區內所設置的十公尺擋板。(圖片來源:研究資料管理推進室)
 

最後,微氣候是理解生態系統研究不可或缺的一環。東華大學自然資源與環境學系教授張世杰透過監測環境狀態(如氣溫、相對溼度)、能量通量(如長短波輻射、光合作用有效輻射量)與物質通量(如二氧化碳、水、甲烷濃度)的變化,了解光電場周遭的環境狀態。研究中產生的資料可依取樣的頻度高低進行區分:高頻度資料是指取樣頻率一秒十筆以上的資料,如測量二氧化碳、水、甲烷通量等,此時,儀器也提供了多樣的後設資料以便人員的理解與利用;至於低頻度資料如雨量、土壤溫度、含水量等雖筆數較少,但須另以描述性文字記錄,以利後續使用

微氣候資料的蒐集處理:

不論是高頻或低頻資料,皆須以更大的時間尺度進行平均計算處理,以供後續解析與使用。同樣地,除了研究資料之外,儀器設備的資訊(如感應度、型號規格等)與操作過程的照片截圖等皆會存檔入研究室外接硬碟,並利用遠端備份。

 

圖三   測量多種環境參數與溫室氣體通量儀器用的鐵塔。

(圖片來源:研究資料管理推進室)

  1. 以治理為願景的社會系統研究

聚焦於社會經濟與治理層面的社會系統研究,是由東華大學自然資源與環境學系教授李俊鴻與戴興盛主導。這部分的研究使用了公開資料庫中的人口統計、農業生產、能源發電、圖資服務等既有資料,作為研究樣區的背景值。李俊鴻藉由訪談權益關係人與專家學者、向在地居民發放問卷等方式,蒐集光電場設置對於居民生活與其經濟受衝擊的資料;而戴興盛則從分析文獻、舉辦工作坊等途徑,探查中央與地方法規等不同層級間的治理制度,以建立與凝聚權益關係人的共識,展開社會溝通的行動。

社會系統資料的蒐集處理:

社會系統研究所產生的資料以文字、影像與問卷為主。因應資料可能涉及相關人員的個人資料,資料的去識別化處理是關鍵且必要的工作項目。

多樣態研究在資料品質與保存的挑戰

CIRES團隊計畫所產製的研究資料橫跨了生態與社會系統,由於資料類型與樣態多元且複雜,後設資料便須借用多種標準以確保內容的一致與完整。以此研究而言,於生態系統研究中,採用常見的EML作為標準,以增加資料與國內外生態學群資料管理系統的互通性;而以問卷和訪談記錄為主的社會系統研究,則採用DDI(data documentation initiative),以此確立相關後設資料內容的欄位

同時,如何妥善管理與保存研究資料,是研究得以發揮永續效益的關鍵。CIRES團隊預計於計畫結束後,將部分具永久保存價值的資料上傳至中研院的研究資料寄存所,並於計畫結束一年後供大眾自由取用。對此,同為生態研究者的研究資料寄存所合作夥伴王豫煌博士也與CIRES團隊交流經驗,從策略面的資料管理與公開再利用原則,到偏技術端的儲存庫操作介面,一同探索符合CIRES團隊需求的取向與方法

舉例來說,王豫煌從其觀察公共工程生態檢核資料開放的經驗指出,資料管理其實是資料開放的基礎,而資料品質則反映了所進行工作的品質。王豫煌指出,儘管各公務機關被要求向大眾公開其資料,然而在未有相關配套政策下,資料的對應格式、內容,以及相關後設資料的清點與描述無法被確實執行,導致最終公開的資料品質低落,成為「垃圾資料」。王豫煌表示,妥善的研究資料管理規劃,將能避免未來資料發生品質低落的問題。對此,CIRES團隊可從建立資料管理方案開始,預先展開對資料產製、保存、分享等面向的思考,為往後的良好的資料管理奠定基礎

研究資料寄存所的維運團隊並提醒,儘管研究資料寄存所目前為鼓勵研究人員分享資料,在現階段對所寄存資料的內容格式及後設資料採寬鬆要求,但未來在資料集檢索結果的呈現上,將會依資料集品質的高低進行排序。此外,並非所有的研究資料都適合直接公開,如何適度的開放資料、挑選合適的授權條例,是使用研究資料寄存所時須特別留意之處。研究資料寄存所團隊也表示,為方便資料集目錄的產製與介接使用,研究資料寄存所預設所有資料集的後設資料皆採CC0(公眾領域貢獻宣告),不主張著作權,因此當有不便與他方分享的內容時,如社會系統研究中的權益關係者背景資訊,資料集的後設資料須額外進行去識別化處理

 

圖四 CIRES團隊與研究資料寄存所團隊的交流會。(圖片來源:研究資料管理推進室)

  1. 結語

結合社會與生態系統的整合性研究,是近期臺灣學術界的焦點之一。國科會自然科學及永續研究發展處自2021年,逐漸發展長期社會生態系統研究(Long-Term Socio-Ecological Research, LTSER)★註五★,而CIRES團隊研究的重點便是觀察社會生態系統變化。藉由長期監測生態系統的變化、加入社會治理的角度,期待成就紮實的科研成果,同時也讓研究融入社會關懷與溝通,希望能降低土地利用型態變化對於當地的衝擊

★註五★在臺灣具代表性的社會生態系統地域,以核心設施的概念設置長期觀測站,希望藉由基礎核心設施的建置與監測資料的累積與共享,提供堅實的科學資料以面對不同變遷挑戰,將科研投資效益最大化。更多資訊請見LTSER網站:https://sites.google.com/view/ltser-taiwan/

綜合而言,CIRES團隊始於對社會生態系統關懷的整合計畫,目前諸多研究工作正逐步進行中,而研究資料及其後設資料的蒐集、處理與保存,將是重要的一環。CIRES團隊正一步步前進、修正與發展出屬於團隊自身的研究資料管理方式與文化,進一步推展在臺灣的社會生態系統研究

  1. ★延伸閱讀

孫義方等(2023)。2023-01-12 生態及永續科學跨領域研究中心(CIRES)x 研究資料寄存所(depositar)交流會投影片。 https://pid.depositar.io/ark:37281/k5v7d5f9c