5月17日下午,來自美國布蘭戴斯大學計算機系的副教授薛念文老師在閔行校區人文樓5303學術報告廳為師生們介紹了他最近在詞義表示方面的研究工作和對機器翻譯中詞義消歧問題的看法。本次講座為思勉人文講座第346場。
詞義消歧(WSD)作為在自然語言方面受到重點關註的早期問題之一,主要聚焦於解決在上下文中自動確定詞義的問題。在本次講座中🚜,薛念文老師的核心觀點是,基於不同的研究目的,傳統的詞義消歧工作可以被更新的技術替代,甚至可以暫時擱置詞義消歧這一復雜模糊的問題。他最近的工作顯示,傳統的機器翻譯采用詞語對齊的方式,而這就面臨著不同語言語法🧝🏻、構式、詞匯等各方面的差異,最終增加了處理的難度。較新的研究成果主要采用基於神經網絡的算法,通過整句對齊的方式進行翻譯,從而避開語義分析。由此可以看出,在某些不需要進行語言現象研究的自然語言處理實現過程中,詞義消歧完全可以繞開🐰,以便造成不必要的麻煩。
薛念文老師演講後🛹,來自上海華院數據公司的沈偉林博士也與在場的老師同學們分享了他們正在進行的基於微博內容的個性分析工作。這項工作使用心理學實驗對人進行性格分類,然後通過從微博文本中提取語言特征,使用機器學習模型,實現用戶進行個性標記,從而有針對性地推送相關內容。在交流環節中🙅🏽,語言學教研室的老師提出可以在語言學方面對於用戶的用詞習慣,句法習慣進行分析⌚️🙇🏻♂️,不僅可以實現大數據處理的目的🕵🏽♀️,也可以擴展心理語言學、計算語言學等交叉學科的研究範圍🫄🏽。整場講座氣氛輕松😛,討論熱烈,在場老師同學們都有了相當的收獲🧑🧒。