2017-09-25 63 views
0

我有幾百個列表,下面我提供了幾個這些列表的例子。在我的排序功能中顯示最佳結果

我有功能,根據其內容排序列表相比,ref列表。

ABCC = ['TRIM', '[email protected]', 'DOCK', 'SVEP', 'S100', 'EPH', 'KLH', 'ANXA3', 'NAB1', 'CELF2', 'EDNRB', 'PLAGL1', 'IL6ST', 'S100A8', 'CKLF', 'TIPARP', 'CDH3', 'MAP3K8', 'LYST', 'LEPR', 'FHL2', 'ARL4C', 'IL1RN', 'ESR1', 'CD93', 'ATP2B4', 'KAT2B', 'ELOVL5', 'SCD', 'SPTBN1', 'AKAP13', 'LDLR', 'ADRB2', 'LTBP4', 'TGM2', 'TIMP3', 'RAN', 'LAMA3', 'ASPH', 'ID4', 'STX11', 'CNN2', 'EGR1'] 

ACC = ['GULP', 'PREP', 'FHL', 'METTL7A', 'TRIM13', 'YPEL5', 'PTEN', 'FAM190B', 'GSN', 'UBL3', 'PTGER3', 'COBLL1', 'EPB41L3', 'KLF4', 'BCL2L2', 'CYLD', 'SLK', 'ENSA', 'SKAP2', 'NR3C2', 'MAF', 'NDEL1', 'EZR', 'PCDH9', 'KIAA0494', 'CITED2', 'MGEA5', 'RUFY3', 'ALDH3A2', 'N4BP2L2', 'EPS15', 'TSPAN5', 'SNRPN', 'SSBP2', 'ELOVL5', 'C5orf4', 'FOXN3', 'ABCA5', 'SEC62', 'PELI1', 'MYCBP2', 'USP15', 'TACC1', 'SHMT1', 'RNF103', 'CDC14B', 'SYNE1', 'NDN', 'PHKB', 'EIF1', 'TROVE2', 'MBD4', 'GAB1'] 

BEC75 = ['LMNA', 'NHP', 'IDS', 'ATP', 'ENSA', 'TBCB', 'NDUFA13', 'TOLLIP', 'PLEKHB2', 'MBOAT7', 'C16orf13', 'PGAM1', 'MIF', 'ACTR1A', 'OAZ1', 'GNAS', 'ARF1', 'MAPKAPK3', 'LCMT1', 'ATP6V1D', 'FLOT1', 'PRR13', 'COX5B', 'PGP', 'CYB561', 'CNIH4', 'COX6B1', 'NDUFB2', 'PFDN2', 'GPR172A', 'RTN4', 'GAPDH', 'MAPK13', 'FKBP8', 'PTGER3', 'BSCL2', 'TUBG1', 'FAM162A', 'GDI1', 'SPTLC2', 'YWHAZ', 'BCAP31', 'OSBPL1A', 'ATP6AP1', 'CALM1', 'PEX16', 'MYCBP2'] 

ARN = ['NCAM1', 'SLC11A2', 'RPL35A', 'PDLIM5', 'RPL31', 'NFIB', 'GYG2', 'IGHG1', 'NAAA'] 

lists = ([("ABCC", ABCC), ("ACC", ACC), ("BEC1", BEC1), ("ARN", ARN)]) 

def sort_by_matches(ref, lists): 
    reference = set(ref) 
    lists = sorted([[len(reference.intersection(set(l))), name, l] for name, l in lists], key=lambda x: (x[0], -len(x[2])), reverse=True) 
    for matches, name, a_list in lists: 
     if matches > 1: 
      print("Matches {} in {}".format(matches, name)) 

我該如何修改此功能,以便它只顯示前5個結果?

sort_by_matches(ref,lists) 
sort_by_matches(ACC,lists) 
+1

你如何調用該函數? –

+0

你能解釋你的功能在做什麼嗎?可能有更好的方法來做到這一點。 –

+0

該功能根據其內容相似性對數百個列表進行排序。引用列表和任何給定列表之間的相同字符串的數量越多,匹配百分比越高。 – Nguyen

回答

0

第一,你的函數沒有return所以只打印出的東西實際上不返回任何東西

變化printreturn

def sort_by_matches(ref, lists): 
    reference = set(ref) 
    lists = your_sorted_list 
    return lists 

sort_by_matches(ref,lists)[:5]如果是列表,則會打印前五項。

如果使用/學習大熊貓不介意,這是一個軟件包進行數據分析,它有一個更好的方式來顯示數據幀與df.head(n)這顯示前n項

+0

'sort_by_matches(ACC,列表):5]' '類型錯誤:「NoneType」對象未subscriptable' – Nguyen

+0

你通過外部具有支架包住列表轉換爲元組,這是不必要的,因爲內部已經元組 – chrisckwong821

+0

抱歉我不明白。 – Nguyen