我有一個數據庫,其中包含來自以28種語言發佈的讚美詩的讚美詩的標題。當我在標題中輸入時,我研究了哪種Unicode字符在每種語言中都是最正確的(例如,湯加聲門停止應該是U + 02BB,即使它看起來像一個撇號;而且,在羅馬尼亞語中,U + 021A(ţ)比U + 0163(ţ)等更正確)。在MySQL表中生成唯一字符列表
現在我正在研究一個類似的項目,我想回去「分解」我的研究,收集所有標題以單一語言並輸出標題中使用的所有唯一字符的列表。
有沒有辦法用MySQL和/或Python做到這一點?我正在考慮在每個角色之間分割一個字符串,命令所有角色,並將它們組合在一起。我的網站是Python,但它都是非常基本的編碼(我還沒有太高級)。
編輯:這是我的代碼到底是如何橫空出世,由於這些反應,並且效果很好!
hymnstitleslist = lookup('''
SELECT HyName FROM Hymns
WHERE HymnbookID = "'''+hbid+'''"
''')
import string
from collections import Counter
some_text = ""
for x in range(0, len(hymnstitleslist)):
some_text = some_text+hymnstitleslist[x]['HyName']
letters = []
for i in some_text:
letters.append(i)
letter_count = Counter(letters)
for letter,count in letter_count.iteritems():
print "{}: {}".format(letter,count)
你能解釋一下第二段?不知何故,我得到的是,在一個專欄中,您將使用一種語言保存標題,而在另一欄中您想保存獨特的字符? – 2013-03-06 06:25:07
@RahulJha,我需要一些代碼,這些代碼將會列出標題列表,並給出這些標題中唯一字符的列表。 – 2013-03-06 07:07:11