2015-10-20 62 views
-1

我的目標是編寫一些SQL代碼或使用SAS查詢生成器,它將對數字變量執行模糊邏輯搜索。整數變量的SQL/SAS模糊邏輯

作爲一個例子;下面的圖片有兩個變量。第一個變量是幾個不同變量的串聯。使用第一個變量作爲子集我想用模糊邏輯來確定變量2中突出顯示的數字。整個數據集將有數百萬行數據,而變量1中的子集數量將達到數萬。

我也考慮創建一個新的變量,其中包括變量兩個&之一,並對該新變量進行模糊邏輯搜索。這種方法可能會產生不必要的匹配,但我的偏好是第一種方法。

Data snip

我真的不知道從哪裏開始就這一個。目前我所能做的就是識別對字符變量(例如SPEDIS和SOUNDEX)執行模糊邏輯搜索的函數,而不是數字變量。

有誰知道一個函數將執行一個整數變量的模糊邏輯搜索?你有樣品代碼嗎?

我是SAS/SQL新手,但學習速度很快。 :)

在此先感謝

保羅

(後響應編輯以下面的評論)

+0

什麼是你的模糊邏輯的例子? – Reeza

+0

Reeza,謝謝你的提問。沒有什麼可以將財務數據列表複雜到小數點後兩位。例如:1001,34&2341.78&4432.78&7896.90等等。 – Paul

+0

如果您包含一些典型的預期輸入和輸出以及您嘗試過的任何內容以達到預期結果,則您的問題會更清楚。 – user667489

回答

0

我想羅布把你在正確的軌道上。將數字轉換爲文本,然後您可以在proc sql中使用COMPGEDCOMPLEV函數進行笛卡爾連接,以比較具有相同ID的值對併爲每對提供相似性分數。然後,您可以決定什麼是分數截止點,以便將某些事物視爲匹配。