2009-01-24 49 views
2

當前技術的所有語音到文本算法是否都是實時運行的?我不是指坐在帶麥克風的電腦上的人,而是輸入預先錄製的音頻文件。是否所有的語音到文本算法都是實時運行的?

即,如果您有30分鐘的錄音,總是需要30分鐘才能錄製?

那裏有不同的方法嗎?

回答

1

沒有理由爲什麼語音識別必須與音頻長度一樣長。但是,由於所需的計算,我認爲你不會得到比實時算法快得多的速度。有關更多詳細信息,請參見維基百科文章的this section(雖然它確實給出了體面的性能概述,但它似乎沒有給出任何時間)。

2

沒有什麼能夠阻止算法運行得比實時更快。 Naturally Speaking 10 Professional軟件程序提供了一個「從文件轉錄」選項,用於轉換遠離電腦的錄音,其運行速度與其運行的電腦可以達到的速度相同。

我認爲批處理實現存在於信號智能領域,但這樣的程序自然不會被普通民衆所接受。

相關問題