是否所有的語音到文本算法都是實時運行的？

當前技術的所有語音到文本算法是否都是實時運行的？我不是指坐在帶麥克風的電腦上的人，而是輸入預先錄製的音頻文件。是否所有的語音到文本算法都是實時運行的？

即，如果您有30分鐘的錄音，總是需要30分鐘才能錄製？

那裏有不同的方法嗎？

2009-01-24 xyz

沒有理由爲什麼語音識別必須與音頻長度一樣長。但是，由於所需的計算，我認爲你不會得到比實時算法快得多的速度。有關更多詳細信息，請參見維基百科文章的this section（雖然它確實給出了體面的性能概述，但它似乎沒有給出任何時間）。

2009-01-24 16:51:20 Noldorin

沒有什麼能夠阻止算法運行得比實時更快。 Naturally Speaking 10 Professional軟件程序提供了一個「從文件轉錄」選項，用於轉換遠離電腦的錄音，其運行速度與其運行的電腦可以達到的速度相同。

我認爲批處理實現存在於信號智能領域，但這樣的程序自然不會被普通民衆所接受。

2009-01-24 16:56:50 ShuggyCoUk

回答