2007年4月7日 星期六

查詢字意的關聯

WordNetWord Association Thesaurus是查詢字意關聯的線上免費網站,也可以下載站上的dataset。前者似乎是用推論的方式去定義,後者對學生做限時測驗,要他們在極短的時間下回答第一個聯想到的字。

這種工具也許可以在寫作時拿來當替換詞使用,也可以當人工query suggestion或query expansion使用。像用Google搜尋時,如果keyword輸入一點錯字,比方”restaurent”,Google會輸出

您是不是要查: restaurant

這是query suggestion;搜尋結果最下面另有一排訊息,則是query expansion:

相關搜尋:
herbs restaurant hong kong restaurant restaurant menu chinese restaurant macau restaurant
japanese restaurant jj restaurant maxim restaurant aqua restaurant eden restaurant

之前在查PmWiki的fold plugin時有用WordNet達到人工query suggestion的功效,詳見這篇。Word Association Thesaurus有趣的地方是兩種模式:

  • Stimulus:輸入一個詞 Q,輸出可能被想到詞 A,given Q, find all A, where Q -> A。
  • Response :given A, find all Q, where Q -> A。

我分別查了camel,Stimulus的結果裡有hump、desert,Response則是straw。另外查了traffic,前後的結果分別是jam、congestion,看來世界各地的交通都不太好啊。

補註

  1. straw -> camel的原因八成是這句諺語:

    “The straw that broke the camel’s back”

  2. Thinkmap Visual Thesaurus:裝Java才能用,好像很強的樣子。del.icio.us裡可以查到不少相關工具,有機會再玩看看。

沒有留言:

張貼留言