speech

    1熱度

    1回答

    我有一個語音文件,我試圖到300赫茲增加頻率的正弦這個語音樣本,用下面的代碼: % Add sine wave to speech signal clear all; close all; load spf2.mat; % sound(speech) pxx= pwelch(speech); plot(pxx); xlim([0 500]); F0 = 300; %hz Fs =

    0熱度

    1回答

    我正在尋找一個應用程序(Windows,Linux或IOS)使用谷歌雲語音。我還沒有成功獲得一些運行的Python腳本(使用API​​和我自己的json密鑰生成)

    2熱度

    1回答

    我目前正在進行語音處理項目,並對西班牙語(aire)中的單詞的時間波形提出了一個快速問題。 我想強調的是含有音素人工智能波形的部分。使用Audacity,我能夠在音標出現的時間點標記位置,並想知道如何才能改變波形的這一部分的顏色。 我被告知在MatLab中使用hold on函數,但我不確定應該傳入哪些參數或者是否有更簡單的方法來完成此操作。 感謝

    0熱度

    1回答

    我測試谷歌語音API,第一: 我嘗試例如作爲谷歌演示,獲得成功。 { "config": { "encoding":"FLAC", "sample_rate": 16000, "language_code": "en-US" }, "audio": { "uri":"gs://cloud-sam

    -1熱度

    1回答

    我正試圖讓語音在我的Mac上迅速處理文本。我發現了一些文章,但它們都是針對iOS的。我試圖遵循這一之一: http://www.appcoda.com/siri-speech-framework/ 到目前爲止,這是我在遊樂場代碼: //: Playground - noun: a place where people can play import Cocoa import Playgrou

    1熱度

    1回答

    我寫代碼CodeGo.net,我用它「System.Speech.Synthesis」庫,但其默認只有英文所以我可以改變它爲法語或其他語言? 我的這部分代碼: class Program { static void Main(string[] args) { using (SpeechSynthesizer synth = new SpeechSynthesize

    1熱度

    1回答

    我正在試圖爲語音信號(.wav)添加一個噪聲文件(.wav)文件。 [b fs]=audioread('AzBio_01-01_S60.wav'); [babble fs1]=audioread('cafeteria_babble.wav'); 的問題是,這兩個文件具有不同的採樣率(FS = 22050,FS1 = 44100)。 當我添加它們會扭曲另一個信號,因爲採樣率不同。我如何解決這個

    0熱度

    1回答

    我有一個人類語音的音頻文件。音頻的長度約爲1分鐘。我想找到音頻中說出的單詞或短語的時間戳。 是否有任何現有的庫可以完成任務?

    1熱度

    1回答

    我目前正試圖複製一篇論文的作品,在論文中他們使用MFCC功能訓練cnn,而不需要在最後執行DCT。它基本上是濾波器組的能量的對數。 我知道kaldi可以使用make_mfcc.sh腳本來計算MFCC功能。但是,如果不能在最後執行DCT來改變腳本以計算MFCC,如果不是的話,是否還有其他工具可以做到這一點? 採取傅立葉變換的信號(的窗口化摘錄)的:如下 的MFCC通常衍生。 使用三角形重疊窗口將以上

    7熱度

    1回答

    我有一個SQL數據庫應用程序,我想結合了語音搜索功能。我已經知道如何搜索數據庫,但我不知道如何從數據庫中的表中創建語法。這是我的代碼到目前爲止。 Dim WithEvents reco As New Recognition.SpeechRecognitionEngine Private Sub Form1_Load(ByVal sender As System.Object, ByVal e