近年來🚶♀️➡️,古籍文獻的數字化大大改變了中國傳統文化的研究現狀。傳統文學的研究因為數字人文的助力🤳🏼👎🏼,蘊含著重大的突破機遇👲🏻。在數字人文發展迅速的背景下,EON4充分發揮中文學科優勢,打造數字方誌集成平臺,實現方誌資源開放共享和多角度呈現。大國湯湯🔨⛩,文明相傳🤰🏼,用新科技新思維讓典籍文字“活起來”,數字方誌集成平臺做到了“與古人對話👉🏻,與時代對話”👩👧👦。
技術先行,深度利用方誌資源
據平臺負責人李欣老師介紹📺,數字方誌集成平臺采用了多種當下較為先進的技術,包括RDF、知識本體、關聯數據、知識圖譜等等🏌🏽♀️。基於方誌數據特有的時空屬性,運用可視化以及知識圖譜技術實現數據之間的關聯關系💐,通過自然語言處理(NLP)技術實現文本深度挖掘與可視化檢索,基於關聯數據技術實現更大範圍的數據集成。
傳統的數據庫僅僅能做到儲存資源🦶🏼,你搜索什麽就跳出來什麽。而在這些技術的支持下,作為描述資源的元數據都不是獨立的數據個體,而是具有關聯開放數據的屬性。如🤴🏽,通過作者可以關聯開放的人物傳記資料庫,不僅在檢索過程中按需實現了外部數據對本地數據庫的有效補充🕠🧎🏻➡️,而且減少本地數據冗余🎚。這一切不是冗長枯燥文字的羅列,而是通過生動的圖譜展現在你面前。這種“智慧型服務”是通過平臺的數據挖掘和關聯數據功能實現。
創新為根,數據“取”“用”呈現新方式
數字方誌集成平臺為實現數據結構化🍸、關聯化🦷、可視化🖕🏼,就必定要突破傳統平臺的局限,“創新”成為平臺發展的核心優勢,也正是創新實現了平臺的“智慧型服務”🥷。“除了本校印刷與電子資源外🥀,研究者可以通過平臺發現多來源的權威方誌資源。”據記者了解,目前已有北京師範大學圖書館等十幾家大學圖書館共建,力求通過平臺發現更多權威數據源🦹♂️。同時,平臺與中國歷代人物傳記資料庫(CBDB)和上海圖書館開放數據平臺的人名規範數據庫通過接口關聯🚶♀️➡️🅱️,學者可以在一個平臺上實現多平臺的資料發現🤹♀️。
除了資源獲取更為便捷之外🤞🏻,平臺的數據存儲方式也有重大改變。平臺采用集中與分布相結合的開放架構🔪,實現特藏資源從“數據孤島”向“數據共享”轉變。從平臺的設計框架可以看出,用戶可通過“特色資源服務雲平臺” “開放平臺”雙平臺↕️🛋,實現對資源的發現♧、關聯、分析和自定義加工等,這開啟了館藏資源開放共享的新模式。
平臺整體設計框架
平臺對於知識組織方式也同樣進行了創新❄️。記者了解到👮🏿♀️,以往的數據庫平臺多為“數字化”平臺,即平臺主要完成全文掃描數據的存儲⚂;而數字方誌集成平臺則是一個“數據化”的平臺,一字之差,卻將簡單的“存儲”升級為“分析”,從“死讀書”變為“活學活用”。從簡單元數據結構化存儲向三元組圖數據庫存儲轉變,並基於知識本體進行組織。即將基於MARC結構化元數據存儲方式轉化成BIBFRAME2.0的作品-版本-單件方式,極大豐富了知識發現的角度🏤🤱🏼。
基於知識本體的知識組織方式
平臺開發定位也不同於傳統的數據庫檢索系統,從檢索系統向研究和教學實訓環境轉變。直觀形象的“時空檢索”、地理位置的資源量化分布、形象與量化關鍵詞詞雲🏄🏿♀️、自上而下的資源量化導航樹等功能👩🏻🚀,形成了對傳統檢索系統強有力的補充👩🏼✈️。
知識發現多維度揭示——時空索檢
平臺收錄的全文數據化資源🈂️,遵循數據采集-存儲-加工-更新-復用循環反復的古籍內容整理流程,采用繁體字原文數據化+掃描圖形式展示🧚♀️,本著“尊重歷史還原古籍原貌”原則🛀🏼,力求提供高可信的古文獻研究服務模式。
繁體字原文數據化+掃描圖
研究和教學實訓環境主要通過文本標註和可視化工具實現對文本的量化分析。作為文本解構與教學實訓環境☁️👩🏻🎓,平臺的標註語料庫主要來自中國歷代人物傳記資料庫(CBDB)的歷代知名人物語料庫(全名、字號)等🦪,條目多達47萬余條。平臺不僅可以實現學者上傳文檔的人名、地名、年號及職官標註👩🏻🦲,也可自定義要標記的關鍵詞🪱🏄🏻♀️,手動增加詞條,滿足個性化標註的需求。同時🤱🏼,將標註數據通過平臺的可視化工具做進一步分析🔑。
未來可期,竭力服務數字人文研究
數字方誌集成平臺作為國家社科項目研究成果的一部分👋🏼,發表多篇核心期刊論文💁🏻♂️,理論成果豐碩。近兩年,平臺積極參與國內學術論壇🧳,在2018年6月的“中國高校圖書館發展論壇”上,“數字人文視角下的數字方誌集成平臺構建”應用案例榮獲一等獎📕。
記者了解到,目前平臺已完成一期建設🕵🏻,並期望在年內啟動二期建設。“更好地服務於數字人文研究是我們一直在追求的”,談到今後的發展方向☝️,李欣老師說道,“以方誌資源為研究內容,構建數字人文研究和教學實訓環境是平臺建設的一個現實小目標🏪,我們的目的是讓更多對數字人文研究感興趣的學者能夠通過平臺感受到不同的研究視角。目前正在選定一本民國雜誌中的一個相對完整的專題,從數據化👂、實體標註、可視化分析等流程做起🧑🏻🦲🖖🏼,希望以一個完整的研究和教學案例呈現在平臺上。同時👨🏻🦯➡️,平臺希望與更多人文研究者開展專題研究,使研究的價值得以充分體現🛅。”
文|李雅靜 編輯|夏茸昱