2011-04-06 70 views
1

我正在開發一個分佈式系統,其中計劃使用神經網絡進行銷售預測。設計用於銷售預測的神經網絡

該系統的一個小的描述:該系統結合了諸如藥房,病人(電子健康記錄)和醫生模塊等模塊的工作流程。

問題是:我有很多關於醫藥銷售的信息,我在設計神經網絡時有點困惑。

我目前的設計: 輸入(根據可以從數據庫中取得的數據):

  1. 日期:的中藥銷售給客戶(YYYY/MM/DD格式)的日期。
  2. 患者年齡分類:與患者的年齡分類相對應的值例如:(1 - > 12:小孩,13 - > 30:年輕......)
  3. 患者性別。
  4. Medicine ID:與藥物相對應的值。
  5. 疾病ID:與產生處方的醫生髮現的疾病相對應的值。
  6. 醫藥單位成本:與購買藥品成本相對應的價值。
  7. 醫藥單位出售量:與銷售藥品成本相對應的價值。
  8. 藥房地址ID:與藥房地址對應的值。
  9. 季節ID:與銷售藥物季節(夏季,冬季等)相對應的值。

輸出:

  1. 數量:對應於將要出售的藥物的量的值。
  2. 利潤:與銷售上一個數量的利潤額相對應的值。

問題是:我不確定這個設計是否有意義,有什麼更好的建議?

和我應該使用什麼類型的網絡來實現這個設計..我打算使用多層循環網絡......這是一個不錯的選擇或有更好的模型?

注:我打算使用c#與「AForge.NET框架」實現網絡。

希望這個描述是清晰和簡單的,併爲我的可憐的語言感到遺憾。

回答

1

我懷疑日期(絕對值)是否會給模型增加任何值。如果你有很多年的數據,它可能會產生一些意義,但是可以採取一些措施,例如,哪一天是四分之一,是週末還是一個工作日,或者是否在重大節假日等的n天內要強大得多。

我不知道你的直接領域,所以我對網絡拓撲沒有任何意見。如果你查閱一些論文,可能會有一些評論文章與你的研究領域有關,討論趨勢是什麼。

+0

謝謝...日期的好主意...再次感謝 – mhdbny 2011-04-06 19:21:59

1

這似乎缺少一些信息。

爲了預測未來,您需要一個基線。例如,在給定的處方中,有人可能會補充它的可能性有多大?這種可能性是否與任何其他指標(年齡組,性別,銷售日期)有關?

同樣季節只對患者的位置有影響,可能只對某些類型的藥物(我在想冷/過敏/流感)。此外,爲了提供任何真正的季節性準確性,您必須爲該季節引入數據,例如過敏原水平等。

接下來,藥物和利潤預期成本僅與實際藥物和沒有必要預測銷售可能性。

3

ID和類別對實際投入的選擇很差,因爲它們不是連續的,而且它們的相對量級意義不大。哪些ID最適合爲不同的類別創建單獨的網絡,但是,鑑於您在此處定義了大量ID和類別,這意味着您擁有大量單獨的網絡,需要大量訓練數據,因爲它會被大量稀釋。二元分類(如性別)可能有效,但是具有多個分類的任何分類都不會產生良好的結果。

對神經網絡要非常小心,因爲如果網絡足夠大,可以創建一些似乎給出預測的東西,但在訓練集之外這確實沒有意義。確保你有一個不參與培訓的大型驗證集。

+0

關於ID ...在我的預測中..我想預測將要出售的藥物的數量...可以在其他表示? ...謝謝 – mhdbny 2011-04-06 19:27:34

+0

@mhdbny,我不確定我是否理解你的問題。神經網絡一旦被訓練,基本上只是一個複雜的數學函數,所以你想要餵它的數量是有數量意義的數量。類別(如藥物的「id」)沒有內在的數字含義,因此沒有理由相信您可以使用您的網絡創建的任何關聯都具有預測效力。您經常可以通過足夠的訓練和足夠大的網絡「強制」一個關聯,但是您真正創建的是訓練數據的任意映射。 – 2011-04-06 20:40:25