2010-11-01 67 views
2

我有一個LAMP設置,其中mysql數據庫實質上是一個產品目錄。由於數據庫隨着新產品的添加而頻繁變化,因此手動維護關鍵字列表和熱門詞組很麻煩。需要保持關鍵字/短語列表是雙重的:(1)谷歌AdWords和其他營銷舉措,(2)在我的網站上的鏈接結構。來自mysql數據庫的關鍵字/短語密度

我一直在使用Zend Lucene端口作爲我網站上所有搜索的主幹。是否有可能使用Lucene確定關鍵字密度和/或短語密度?另一個搜索引擎呢?

爲了進一步明確我在找什麼,比方說我有一個筆記本電腦的目錄。我可能會有各種型號的戴爾Inspiron,戴爾Latitude,Macbook,Gateway,聯想和宏基筆記本電腦。對於關鍵字密度報告,我希望看到「筆記本電腦」和「筆記本」這兩個詞很受歡迎,也許還有「戴爾Inspiron」或「戴爾Inspiron筆記本電腦」或「聯想筆記本電腦」。

任何人都可以推薦一些開始?我很喜歡搜索整個搜索模塊世界,比如Lucene,Sphinx,Solr等,因爲它已經在索引數據,但我不知道我是否會走錯路。

謝謝!

回答

2

Lucene能夠給你一個(關鍵字,頻率)對列表。見this questionthis blog post

+0

謝謝,我注意到這篇文章是指純Lucene(java),並且我正在使用與Zend捆綁在一起的Lucene端口。所以希望我可以在PHP中使用本地方式完成所有任務,否則我可能需要擦掉java的蜘蛛網。 – dustin999 2010-11-02 00:01:09

+0

似乎你可以在PHP中執行此操作:在此頁面中搜索termDocs():http://framework.zend.com/manual/en/zend.search.lucene.best-practice.html – 2010-11-02 06:59:36

+0

我最終寫了我的自己的腳本來確定關鍵字密度,用python並不太難。我會繼續並接受這是正確的答案... – dustin999 2011-08-08 18:33:03