2012-03-07 103 views
0

我有數據集概率優化

d<-data.frame(id=1:100, pr.a=runif(100,min=0, max=0.40)) 
d$pr.b=d$pr.a+runif(100,min=0, max=0.1)) 
d$pr.c=d$pr.b+runif(100,min=0, max=0.1) 

pr.a < pr.b < pr.c是一個二項式試驗的試驗A成功的概率,B,C對個人(ID的)

另外

cost.a<-80; cost.b=200; cost.c=600; 

試驗A,B,C可在每個受試者被執行多次。例如,如果IDx的pr.a = 0.2,那麼如果我進行這個測試2次,我認爲成功概率爲1-pbinom(0,2,0.2) = 0.36,代價爲2*cost.a = 160

對於每個模態A,B ,C,在所有ID中,我想找到給定目標成功率所需成本的分佈(可以說target=0.9

起初我想看看成本的分佈,如果只有一個測試類型(僅A或僅C)應用於每個主題(儘管它可以在同一主題上多次執行)。

此外,我想找到如果組合的類型可以最小化目標成功率的成本。

這在我看來是一個優化問題。我沒有經驗優化。請有任何想法嗎?

回答

1

我想你可以將其描述爲優化問題,但只是一個非常簡單的問題。您只是試圖最大化每單位成本的概率。爲了計算這個,只需成本將概率:

d$pr.a/cost.a # The probability per unit cost for A 
d$pr.b/cost.b 
d$pr.c/cost.c 

選擇每個ID的最大,你會得到每個ID「最好」的測試。要計算給定概率的預期成本,只需將target除以probability並乘以cost即可。

target=0.9 
(target/d$pr.ca) * cost