naivebayes

    1熱度

    1回答

    我正在使用omnicat-bayes來分析文檔(文本分類)。有了這個寶石,我可以創建類別,並用文檔「提供」這些類別。目前這些類別有足夠的文件,以便能夠「足夠好地」識別應放置在哪個類別中的新文檔。 現在在我的文檔控制器下創建操作是幾個步驟。 創建一個新的貝葉斯實例 創建將用於 以預文件訓練類別 的類別其實培訓的類別 (所有的那些步驟在run_all函數下) 的創建操作: def create @d

    -1熱度

    1回答

    我想問一下,我有10個有聲參數的列,以及在此刻記錄兩個樂器的兩列之後。 我有10列聲音參數的數據後,我需要預測使用哪一臺儀器。 我知道數據預處理等,但我想仔細檢查我是否選擇了正確的分類。對於我提供的例子,適用於NaïveBayes或線性迴歸還是SVN?我只是混淆了哪一個更適合這個特殊的例子。

    0熱度

    2回答

    我有一大批標註爲pos和neg的文字,用於對文本進行分類。我使用TextBlob(根據this tutorial)對文本進行分類。雖然它運行得很好,但對於大型訓練集(例如8k字)可能非常緩慢。 我想嘗試使用scikit-learn這樣做,但我不確定從哪裏開始。上述教程在scikit-learn中看起來如何?我也希望訓練集包含某些單詞的權重。有些應該保證特定文本被歸類爲「正面」,而另一些則保證歸類爲

    0熱度

    1回答

    我想了解我是否可以以及是否有效使用SGD培訓您的MNB模型。我的應用程序是文本分類。在sklearn我發現沒有MNB可用,並且默認情況下它是SVM,但是NB是線性模型,不是嗎? 所以,如果我的可能性參數(拉普拉斯平滑)可估計爲 我能更新我的SGD參數和最小化成本函數? 請讓我知道如果SGD在這裏無關緊要。提前致謝。 更新: 所以我得到了答案,並希望我明白了,MNB的參數由給定輸入文本中的詞occu

    0熱度

    2回答

    首先,我是新的python和nlp /機器學習。 現在我有以下代碼: vectorizer = CountVectorizer( input="content", decode_error="ignore", strip_accents=None, stop_words = stopwords.words('english'), tokenizer=

    0熱度

    2回答

    我目前使用樸素貝葉斯來分類一堆文本。我有多個類別。現在我只輸出後驗概率和類別,但我想要做的是根據後驗概率對類別進行排序,並使用第二,第三類別作爲「備份」類別。 下面是一個例子: df = pandas.DataFrame({ 'text' : pandas.Categorical(["I have wings","Metal wings","Feathers","Airport"]), 'true

    0熱度

    1回答

    嗨我想分類數據集使用naivebayesclassifier.For爲此我想使用外部數據集,我已經從google.this數據集下載包含兩個文件夾的正面評論和負面評論。每個文件夾包含1000個.txt文件。如何在Python代碼中將該文件導入爲一個訓練數據集。我是機器學習的新手,所以我對此沒有多少想法。請幫助我。

    0熱度

    1回答

    我是分析領域的新成員。也許這個問題對你來說很愚蠢。我正在使用R進行審查分類。我必須將評論分爲50個不同的類別。我手動爲模型的培訓目的標記數據。我有點困惑如何標記審查? 我在這裏做的是, 首先我將單個評論轉換成句子,然後給這些句子一個特定的類別。我在這裏做什麼? 或者我必須給類別標記的審查而不打破句子?如果審查屬於多於一個類別,那麼該怎麼辦?

    3熱度

    2回答

    我有一個數據集,時間戳作爲格式之一,格式爲09/07/2016 23:58。 我試圖在這個數據上應用樸素貝葉斯,而且我正面臨着下面的錯誤。請讓我知道如何在我的模型 ValueError異常使用此數據:無效的文字浮法():2016年12月6日23:59

    1熱度

    1回答

    我有兩個numpy數組獲取x和y從x有6個維度並且y(目標變量)具有一個維度的sframe開始。 x =np.array([[ 0 , 0 , 0, 24 ,0, 34], [ 0 , 0 , 0, 22 ,0, 34], ...]) y = np.array([[0], [0], [0], [1], [1], ...]) 我正在使用scikit-learn應用樸素貝葉斯分類器。當我嘗試以適