在python中區分字符串

如果第一個字符串中的字母也包含在第二個字符串中，我希望能夠返回True。例如，only_uses_letters_from("boffo","foobar")應返回True。以下是我迄今爲止：在python中區分字符串

def only_uses_letters_from(x, y): 
    """returns true if the first string only contains characters that are also in the second string 

    str, str -> str""" 
    for letter in x: 
     if x in y: 
      return True 
    else: 
     return False

來源

2015-02-09 holaprofesor

應該是'海峽，海峽 - > bool' BTW ... – 2015-02-09 01:11:01

您可以使用set.issubset用來檢查是否在每一個元素是B：

a, b = "boffo", "foobar" 
print(set(a).issubset(b)) 
True

所以在你的函數：

def only_uses_letters_from(x, y): 
    return set(x).issubset(y)

或者使用all，檢查x中的每個字母是inb：

def only_uses_letters_from(x, y): 
    return all(letter in y for letter in x)

如果我們在x中找到一個不在y中的字母，並且返回False，如果所有字母都在y中，則所有將短路，則它將返回True。

如果您在使用集可以是一個快速的方式大量數據，以檢查是否從一個迭代的任何元素是另一個：

def only_uses_letters_from(x, y): 
     st = set(y) # O(1) lookups 
     return all(letter in st for letter in x)

來源

2015-02-09 00:17:13

林在蟒蛇很新的，我感謝您抽出寶貴的時間來解釋這對我來說，它實際上是有意義的 – holaprofesor 2015-02-09 00:23:12

@JaredBanton，沒有概率。真的沒有太多。要成爲另一個集合的子集，你的所有元素必須位於另一個集合中。使用'all'基本上就是說所有/每個元素必須在另一個迭代中。這兩種方法都很好，特別是在處理查找速度非常快時，因此創建它的成本可以通過更大的數據抵消，並且可以使代碼更加高效。 – 2015-02-09 00:28:45

最後一種方法不一定是快速的：如果'x'很大並且不包含來自'y'的任何字母，那麼它非常緩慢，因爲它在整個字符串「x」中線性地變化。我建議首先，簡單明瞭的解決方案*除非*速度是問題*並且*典型參數可以更快處理。 – EOL 2015-02-12 03:22:32

這裏的方法是檢查，對每一個字符x，它也在y。如果有一個字符這是不是這種情況，那麼答案是False：

def only_uses_letters_from(x, y): 
    for c in x: 
     if c not in y: 
      return False 
    return True

來源

2015-02-09 00:18:04

太棒了，它的工作！謝謝 – holaprofesor 2015-02-09 00:23:42

這個解決方案手動執行'all（）'是用來做什麼的（參見Padraic的解決方案）。具體來說，這意味着使用這種解決方案會錯過更短，更清晰的做同樣事情的方式（更有效率，可能最重要的是）。 – EOL 2015-02-09 03:42:10

@EOL是的，但這個答案有助於瞭解爲什麼最初的代碼不起作用。我不認爲每個SO回答都是用stdlib調用替換代碼。 – 2015-02-10 10:04:03

你的代碼邏輯有問題，如果第一個字母是字符串中，它將返回true的時候了。下面的代碼將工作：

def foo(x, y): 
    for letter in x: 
     if letter not in y: 
      return False 
    return True 

print foo("booffo", "foobar")

來源

2015-02-09 00:54:50

您正在手動編寫Python「all（）」的功能。 – EOL 2015-02-09 03:43:49

-1

Python的方式：

def only_uses_letters_from(str1, str2): 
    return all(letter in str2 for letter in str1)

這傳達了你的邏輯，並使其可讀。

不要使用set（）優化大字符串！

有一些建議，當字符串很大時，用set（）來預處理一個字符串以優化搜索。這是錯誤的。在集合中搜索更快，但創建集合本身比只搜索字符串要慢很多。

使用timeit表明，從字符串創建一個包含1.000.000個字母的集合在我的機器上花費了大約50毫秒，而運行原始函數的時間不到1毫秒。

python -m timeit -n 1000 -s setup='str2 = "".join("abc" for i in xrange(1000000))' 'set(str2)'

來源

2015-02-09 03:07:15

如果'str1'包含很多字母，並且它們都不在長字符串'str2'中，那麼計時結果可能會給出相反的結果，因爲在這種情況下，如果沒有設置，Python必須遍歷每一百萬個字符在判斷'str1'中的每個字符未被找到之前，'str2'。所以，我相信你的關於不使用'set（）'的說法只適用於某些情況。 – EOL 2015-02-09 03:46:15

在python中區分字符串

回答

相關問題