楊樹清文本的字彙共現網路分析

文/陳慶瀚(中央大學資訊工程系教授)

多年前我曾提議用小世界理論(六度分離)來研究楊樹清的記憶模式,後來我設計了一個「字彙共現網路分析」程式來分析文學文本的"六度分離"程度及其語言學意涵。

小世界理論(small world theory)是1998年由Watts和Strogatz兩位數學家在知名的Nature期刊所發表[2],隨即引起不同領域研究者的重視並形成一股研究風潮。根據小世界理論,真實世界中各種複雜網路,包括社會人際網路、網際網路、大腦神經網路、企業組織或國家經濟網路、交通網路等等,都具有一種共同的結構,稱之為「小世界」(small world)。

此一理論可以說明60年代一位美國的社會心理學家Stanley Milgram實驗〔11〕發現:每個人與世界上其他任何一個人,都可以透過一個不超過六個人的社會人際關係(social acquaintances)產生關聯。此即著名的六度分離(six degrees of separation)法則。小世界理論可以解釋,為何在兩個陌生人(網路中任意兩個節點)之間,總會發現一條短的人際關係鍊(short chains of acquaintances linking)。

在小世界網路中,我們使用群聚性(clustering)來測量網路中任意節點與其鄰近節點彼此連結的程度。另外我們使用平均最短路徑(average shortest path)來測量網路中任意兩個節點之間平均需要經過多少中介節點的相連。

人類語言所使用的字彙並非隨機出現在句子中,而會根據主題和句法結構呈現某種規則性,這種規則性可以使用字彙共現網路(word co-occurrence network)[1]來表示。字彙共現網路用以說明字彙間的互動和關連性,更具體的說,字彙種類、出現頻率、任一字與其它字的間距等都可以透過字彙網路來呈現。而同ㄧ主題若使用不同語言書寫,則會因字彙結構和句法的差異而呈現迥異的字彙共現網路。

由字彙共現所形成的網路極其複雜,但並非隨機的,而是具有所謂的小世界(small world)特性[1]。但其小世界特性在不同語言會出現相同與相異的現象,相同的部份反應出人類語言之共通性,而相異的部份則代表個別語言的差異。

應用字彙共現網路來分析楊樹清的口說和書寫文本分析,或許可以揭開楊樹清對文壇人事物特殊的記憶和理解模式,並藉此深入了解一個報導文學作家文本的共同結構及其與其他作家的差異性。

原本我想自己來做這項研究,但延宕多年始終未能啟動。如果有碩士班研究生對此課題和技術有興趣者,我很樂意指導他進行這項研究工作。

You Might Also Like

Leave a Reply