希望這是有道理的。我有一個PHP腳本,磁盤,分析RSS源,並將數據插入MySql,它工作正常。我將RSS項目的各個部分變爲變量以使它們更易於使用,因此獲取rss源文件並不是問題。PHP和RSS - 基於描述創建「分數」
但是,我的目標是能夠過濾故事,並只導入特定的故事。我想盡可能地自動化這些,對於誤報/消極因素有一些限制,因爲他們會在以後手動驗證。
我想要做的是爲每個單詞設置關鍵字和「權重」列表。因此,當分析新的RSS項目時,腳本將根據說明字段中單詞的權重創建「分數」。
例如:
stackoverflow = 10
very = 7
helpful = 8
因此,「計算器非常有幫助」會得到一個分數的25
,也有「計算器總是非常樂於助人」仍然會得到一個得分25,因爲「是'和'always'不是帶有賦予權重的關鍵字。
和「隨機在這裏」會得到0分,因爲沒有關鍵字。
然後我可以玩關鍵字權重和分數來找出篩選rss提要的最佳設置。
大部分我都能弄清楚。我只需要知道解析項目描述的方法,併爲指定的關鍵字分配權重以創建「分數」。
執行此操作:http://www.ibm.com/developerworks/cn/library/wa-bayes1/ – Incognito