2010-04-13 64 views

回答

139

os.listdir()比使用glob.glob略高效。爲了測試,如果文件名是一個普通的文件(而不是目錄或其他實體),使用os.path.isfile()

import os, os.path 

# simple version for working with CWD 
print len([name for name in os.listdir('.') if os.path.isfile(name)]) 

# path joining version for other paths 
DIR = '/tmp' 
print len([name for name in os.listdir(DIR) if os.path.isfile(os.path.join(DIR, name))]) 
+8

如果你不在cwd上,記得在'os.path.filename(name)'裏面添加'folder_path'。 http://stackoverflow.com/questions/17893542/why-do-os-path-isfile-return-false – 2014-04-10 14:54:16

+0

這不包括嵌套文件夾內的文件。 – codersofthedark 2015-04-23 09:33:21

+2

對於嵌套在目錄中的文件進行遞歸計數,使用os.walk()解決方案可能會更好。 – 2015-12-23 21:23:23

5

這使用os.listdir並適用於任何目錄:

import os 
directory = 'mydirpath' 

number_of_files = len([item for item in os.listdir(directory) if os.path.isfile(os.path.join(directory, item))]) 

這可以被簡化發電機和發得快一點有:

import os 
isfile = os.path.isfile 
join = os.path.join 

directory = 'mydirpath' 
number_of_files = sum(1 for item in os.listdir(directory) if isfile(join(directory, item))) 
3
def count_em(valid_path): 
    x = 0 
    for root, dirs, files in os.walk(valid_path): 
     for f in files: 
      x = x+1 
print "There are", x, "files in this directory." 
return x 

從抽放工藝this post

+2

1.'files'是一個列表。 2. OP沒有尋找遞歸計數 – SilentGhost 2010-04-13 18:56:21

3
import os 

def count_files(in_directory): 
    joiner= (in_directory + os.path.sep).__add__ 
    return sum(
     os.path.isfile(filename) 
     for filename 
     in map(joiner, os.listdir(in_directory)) 
    ) 

>>> count_files("/usr/lib") 
1797 
>>> len(os.listdir("/usr/lib")) 
2049 
48
import os 

path, dirs, files = os.walk("/usr/lib").next() 
file_count = len(files) 
+3

在Python 3中,[使用'path,dirs,files = os.walk(「/ usr/lib」).__ next __()'改爲](https://stackoverflow.com/問題/ 1073396/IS-發電機下可見的 - 蟒蛇-3-0)。 – alex 2017-08-27 18:33:56

+2

或者對於跨版本的compat'next(os.walk(「/ usr/lib」))' – 2017-12-22 15:26:42

2

盧克的代碼重新格式化。

import os 

print len(os.walk('/usr/lib').next()[2]) 
10
def directory(path,extension): 
    list_dir = [] 
    list_dir = os.listdir(path) 
    count = 0 
    for file in list_dir: 
    if file.endswith(extension): # eg: '.txt' 
     count += 1 
    return count 
20

這是的fnmatch,這非常好使:

import fnmatch 

print len(fnmatch.filter(os.listdir(dirpath), '*.txt')) 

更多細節:http://docs.python.org/2/library/fnmatch.html

+2

如果你知道你所使用的模式,這會快得多(大約一半的時間用我的一個包含10,000個文件的目錄進行測試)尋找,而不是用'os.path.isfile()'作爲接受的答案來測試每個文件。也比'glob.glob()'快得多。 – CivFan 2016-04-27 15:54:57

8
import os 
print len(os.listdir(os.getcwd())) 
+2

有時這可能很有用,但它也包括計數中的子目錄 – 2016-07-25 21:22:03

0
import os 

total_con=os.listdir('<directory path>') 

files=[] 

for f_n in total_con: 
    if os.path.isfile(f_n): 
    files.append(f_n) 


print len(files) 
+0

OP詢問**文件的數目**,這也列出目錄。 – Korem 2014-09-29 06:19:58

+0

@Korem感謝您的評論 – 2014-09-29 06:31:38

0

如果您要使用的標準外殼操作系統,你可以更快得到結果一種使用純pythonic方式。

爲Windows

例子:

import os 
import subprocess 

def get_num_files(path): 
    cmd = 'DIR \"%s\" /A-D /B /S | FIND /C /V ""' % path 
    return int(subprocess.check_output(cmd, shell=True)) 
+1

但它不會像便攜式。 – 2015-04-08 13:48:10

0

我發現了另一個答案,可能是爲接受的答案是正確的。

for root, dirs, files in os.walk(input_path):  
for name in files: 
    if os.path.splitext(name)[1] == '.TXT' or os.path.splitext(name)[1] == '.txt': 
     datafiles.append(os.path.join(root,name)) 


print len(files) 
23

對於所有類型的文件,子目錄包括:

import os 

list = os.listdir(dir) # dir is your directory path 
number_files = len(list) 
print number_files 

只有文件(避免子目錄):

import os 

onlyfiles = next(os.walk(dir))[2] #dir is your directory path as string 
print len(onlyfiles) 
+0

@GuillermoPereira現在有效,謝謝。 – nguyenhoai890 2017-01-17 13:53:43

1

下面是一個簡單的一行命令我發現有用:

print int(os.popen("ls | wc -l").read()) 
0

我用glob.iglob類似目錄結構

data 
└───train 
│ └───subfolder1 
│ | │ file111.png 
│ | │ file112.png 
│ | │ ... 
│ | 
│ └───subfolder2 
│  │ file121.png 
│  │ file122.png 
│  │ ... 
└───test 
    │ file221.png 
    │ file222.png 

以下選項返回圖4(正如所料,即兩個不計子文件夾本身

  • len(list(glob.iglob("data/train/*/*.png", recursive=True)))
  • sum(1 for i in glob.iglob("data/train/*/*.png"))
0

我這樣做,這回該文件夾中(Attack_Data文件數量)...這工作正常。

import os 
def fcount(path): 
    #Counts the number of files in a directory 
    count = 0 
    for f in os.listdir(path): 
     if os.path.isfile(os.path.join(path, f)): 
      count += 1 

    return count 
path = r"C:\Users\EE EKORO\Desktop\Attack_Data" #Read files in folder 
print (fcount(path)) 
+0

編輯你的答案,因爲它不可讀! – abhiarora 2017-01-11 15:36:25

3

我很驚訝,沒有人提到os.scandir

def count_files(dir): 
    return len([1 for x in list(os.scandir(dir)) if x.is_file()]) 
+0

與Python 3.6很好地合作! – 2018-02-13 10:04:15

2

如果你想數目錄中的所有文件 - 包括子目錄中的文件,最Python的方式是:

import os 

file_count = sum(len(files) for _, _, files in os.walk(r'C:\Dropbox')) 
print(file_count) 

我們使用比明確添加文件計數更快的總和(計時未決)

+1

嗨,我試圖理解這個代碼(代碼完美),我知道我們可以在'for'循環中使用'_'。我也知道'os.walk'。但是不清楚'sum'函數中的下劃線是怎麼回事,請您詳細說明一下。謝謝! – Ejaz 2018-01-02 13:22:51

+0

Unsderscore只是一個變量名@Ejaz,當我們忽略變量的時候會使用這個變量 - 這就是我們在這裏所做的 - 我們稱之爲walk,並且只計算每個目錄中的文件數量,忽略根目錄和目錄遍歷返回值 – 2018-01-03 18:58:44

相關問題