0
我有以下FNAMES
表(它包含約58K的記錄)拆分表格蜂巢
+------+-------------+
| ID | NICKNAMES |
+------+-------------+
| 1 | Avile |
| 2 | Dudi |
| 3 | Moshiko |
| 4 | Avi |
| 5 | DAVE |
....
我想通過所有包含相同的第一萊特的記錄拆表,像這樣:
+------+-------------+
| ID | NICKNAMES |
+------+-------------+
| 1 | Avile |
| 4 | Avi |
| 2 | Dudi |
| 5 | DAVE |
| 3 | Moshiko |
....
爲每個分割我想找到用最少的Jaro–Winkler distance
記錄。這意味着每個以'a'開頭的字母都會找到最相似的記錄。 我必須在下面的代碼中更改什麼?
select FNAMES.* , MIN(Jaro–Winkler(FNAMES.NICKNAMES, FNAMES.NICKNAMES))
from FNAMES
LEFT OUTER JOIN FNAMES
ON(true)
WHERE Jaro–Winkler (FNAMES.NICKNAMES, FNAMES.NICKNAMES) <= 4
GROUP BY FNAMES.NICKNAMES
感謝嘟嘟!你能否特別爲f1.nicknames
Avi
**(1)**假設您有一個單列「x」和兩行「A」和「B」的表格。 't1.x <> t2.x'會重新將'A --- B'和'B --- A'重新調回。 't1.x