naivebayes

1熱度

1回答

我正在使用omnicat-bayes來分析文檔（文本分類）。有了這個寶石，我可以創建類別，並用文檔「提供」這些類別。目前這些類別有足夠的文件，以便能夠「足夠好地」識別應放置在哪個類別中的新文檔。現在在我的文檔控制器下創建操作是幾個步驟。創建一個新的貝葉斯實例創建將用於以預文件訓練類別的類別其實培訓的類別（所有的那些步驟在run_all函數下）的創建操作： def create @d

-1熱度

1回答

Weka，使用哪個分類器，用於兩個分類和10個數字屬性

我想問一下，我有10個有聲參數的列，以及在此刻記錄兩個樂器的兩列之後。我有10列聲音參數的數據後，我需要預測使用哪一臺儀器。我知道數據預處理等，但我想仔細檢查我是否選擇了正確的分類。對於我提供的例子，適用於NaïveBayes或線性迴歸還是SVN？我只是混淆了哪一個更適合這個特殊的例子。

0熱度

2回答

scikit-learn：使用自定義標籤對文本進行分類

我有一大批標註爲pos和neg的文字，用於對文本進行分類。我使用TextBlob（根據this tutorial）對文本進行分類。雖然它運行得很好，但對於大型訓練集（例如8k字）可能非常緩慢。我想嘗試使用scikit-learn這樣做，但我不確定從哪裏開始。上述教程在scikit-learn中看起來如何？我也希望訓練集包含某些單詞的權重。有些應該保證特定文本被歸類爲「正面」，而另一些則保證歸類爲

0熱度

1回答

我可以使用SGD與Multinomial樸素貝葉斯？

我想了解我是否可以以及是否有效使用SGD培訓您的MNB模型。我的應用程序是文本分類。在sklearn我發現沒有MNB可用，並且默認情況下它是SVM，但是NB是線性模型，不是嗎？所以，如果我的可能性參數（拉普拉斯平滑）可估計爲我能更新我的SGD參數和最小化成本函數？請讓我知道如果SGD在這裏無關緊要。提前致謝。更新：所以我得到了答案，並希望我明白了，MNB的參數由給定輸入文本中的詞occu

0熱度

2回答

蟒蛇sklearn使用不僅僅是計數功能的幼稚bayes學習

首先，我是新的python和nlp /機器學習。現在我有以下代碼： vectorizer = CountVectorizer( input="content", decode_error="ignore", strip_accents=None, stop_words = stopwords.words('english'), tokenizer=

0熱度

2回答

使用具有NLTK的樸素貝葉斯將文本字符串分類爲多個類

我目前使用樸素貝葉斯來分類一堆文本。我有多個類別。現在我只輸出後驗概率和類別，但我想要做的是根據後驗概率對類別進行排序，並使用第二，第三類別作爲「備份」類別。下面是一個例子： df = pandas.DataFrame({ 'text' : pandas.Categorical(["I have wings","Metal wings","Feathers","Airport"]), 'true

0熱度

1回答

python中的機器學習外部數據集學習

嗨我想分類數據集使用naivebayesclassifier.For爲此我想使用外部數據集，我已經從google.this數據集下載包含兩個文件夾的正面評論和負面評論。每個文件夾包含1000個.txt文件。如何在Python代碼中將該文件導入爲一個訓練數據集。我是機器學習的新手，所以我對此沒有多少想法。請幫助我。

0熱度

1回答

應該爲訓練集標記句子還是整個評論？

我是分析領域的新成員。也許這個問題對你來說很愚蠢。我正在使用R進行審查分類。我必須將評論分爲50個不同的類別。我手動爲模型的培訓目的標記數據。我有點困惑如何標記審查？我在這裏做的是，首先我將單個評論轉換成句子，然後給這些句子一個特定的類別。我在這裏做什麼？或者我必須給類別標記的審查而不打破句子？如果審查屬於多於一個類別，那麼該怎麼辦？

3熱度

2回答

如何在Python中構建樸素貝葉斯模型中使用時間戳數據

我有一個數據集，時間戳作爲格式之一，格式爲09/07/2016 23:58。我試圖在這個數據上應用樸素貝葉斯，而且我正面臨着下面的錯誤。請讓我知道如何在我的模型 ValueError異常使用此數據：無效的文字浮法（）：2016年12月6日23:59

1熱度

1回答

Bernoulli樸素貝葉斯錯誤：ValueError：未知的標籤類型:(陣列（[0，0，0，...，0，0，0]，dtype =對象））

我有兩個numpy數組獲取x和y從x有6個維度並且y（目標變量）具有一個維度的sframe開始。 x =np.array([[ 0 , 0 , 0, 24 ,0, 34], [ 0 , 0 , 0, 22 ,0, 34], ...]) y = np.array([[0], [0], [0], [1], [1], ...]) 我正在使用scikit-learn應用樸素貝葉斯分類器。當我嘗試以適