我有一個數據框(df),其中變量Area代表區域代碼。我需要找到隨後X 在下面的示例Z-> X被重複兩次,這意味着計數爲2 Area
Z
A
B
Z
X
A
B
Z
X
我曾嘗試以下找到真/假 對於z OCCURENCES的數量 df.Area.str.contains(r'Z|X')
我相信這是錯誤的方法,因爲它沒有給我想要的結果。任何其他方式做到這一點?
我使用quanteda進行基於字典的方法進行定量文本分析。我正在與Lowe的Yoshikoder建立我自己的字典。我可以將我的Yoshikoder字典應用到quanteda(見下文) - 但是,該函數僅佔字典的第一級。我需要查看每個類別的所有值,包括所有子類別(至少4個級別)。我怎樣才能做到這一點? # load my Yoshikoder dictionary with multiple lev