1
我有兩個dataframes是其中如下:搜索在多個文件中多次subtrings的指標
df1 : contains one variable ['search_term'] and 100000 rows
這些詞/詞組我想在我的文件中搜索
df2: contains parsed file contents in a column called file_text
此數據框中有20000行,並且有兩列['file_name','file_text']
我需要的是file_text中每個搜索項外觀的索引。
我找不出一個有效的方法來執行此搜索。
我使用str.find()函數與GROUPBY一起,但它採取0.25秒左右每FILE_TEXT搜索項(其中長成爲真正具有20K文件* 100K的搜索字詞)
任何想法就如何以快速有效的方式做到這一點將是救生員!
將您的問題縮短爲具有輸入和預期輸出的代表性示例。基本上,看看如何提供[mcve]。 –
如果您有工作代碼,並且想要改進它,那麼您可以在這裏獲得更好的機會:https://codereview.stackexchange.com/ – Toto
'dataframe'是什麼意思?我從來沒有聽說過這樣的事情。 – darksky