2013-05-07 64 views
0

我試圖用程序R中的多項式函數擬合點數據,並想知道哪個順序最適合。我使用非線性迴歸模型nls(function, data, start),功能是y~a*(x+c)^b計算R中的nls()的問題

我想要做的是計算山谷填充礦牀的橫截面積。出於這個原因,我需要模擬底層谷底的樣子。我已經有線性場景,現在想嘗試一些多項式場景。

我的數據集表示谷輪廓,看起來像這樣(與x_combsl是距離和y_combsl高程):

x_combsl y_combsl  
1 0.0000000 120.9095 
2 0.9904867 120.5066 
3 1.9809735 120.0947 
4 2.9714602 119.6811 
5 3.9619470 119.2492 
6 4.9524337 118.8483 
7 5.9429204 118.4866 
8 6.9334072 118.1120 
9 7.9238939 117.7750 
10 8.9143806 117.2833 
11 9.9048674 116.7698 
12 10.8953541 116.2841 
13 11.8858409 115.8285 
14 12.8763276 115.2949 
15 13.8668143 114.6750 
16 14.8573011 114.1301 
17 15.8477878 113.6537 
18 16.8382746 113.2016 
19 17.8287613 112.8163 
20 18.8192480 112.4945 
21 19.8097348 112.0304 
22 20.8002215 111.2370 
23 21.7907082 110.7463 
24 22.7811950 110.2954 
25 23.7716817 109.6715 
26 24.7621685 109.1829 
27 44.5719032 109.0435 
28 45.5623900 109.4721 
29 46.5528767 110.0491 
30 47.5433634 110.4394 
31 48.5338502 110.6832 
32 49.5243369 111.0763 
33 50.5148237 111.8376 
34 51.5053104 112.6162 
35 52.4957971 113.2467 
36 53.4862839 113.8065 
37 54.4767706 114.4694 
38 55.4672573 114.9547 
39 56.4577441 115.4724 
40 57.4482308 116.0013 
41 58.4387176 116.4606 
42 59.4292043 117.0797 
43 60.4196910 117.7074 
44 61.4101778 118.2127  
45 62.4006645 118.7544 
46 63.3911512 119.3134 
47 64.3816380 119.9159 
48 65.3721247 120.5462 
49 66.3626115 121.0418 
50 67.3530982 121.5350 
51 68.3435849 122.0184 
52 69.3340717 122.5490 
53 70.3245584 123.1162 
54 71.3150452 123.6437 

當我嘗試生成模型,我得到了以下錯誤消息:

data<-data.frame(x_combsl, y_combsl) 

fit_nls<-nls(y_combsl~a*(x_combsl + c)^b, data=data, start=list(a=1, b=2, c=35)) 
Error in numericDeriv(form[[3]], names(ind), env) : 
    Missing value or an Infinity produced when evaluating the model 

任何想法可能會導致問題?多項式的峯值很可能在c = 35左右,所以起始參數似乎不會引起問題。可能是點的線性對齊?我用更少的數據點[24:31]嘗試過,但我得到了相同的錯誤信息。

我對R編程不是很有經驗,所以具體的答案會很棒。

+0

你或許應該給出的參數範圍來估算(參見'lower'和''中描述nls'參數upper'?)。你也可能有更好的結果轉換和擬合'log(y)= log(a)+ b log(x + c)'。 – Gregor 2013-05-07 18:26:36

+0

繪製您的數據後,我認爲您的模型不適合數據。你可以嘗試使用Levenberg-Marquardt算法(minpack.lm包中的'nlsLM'),這個算法通常比Gauss-Newton收斂得更好,但是我懷疑你會非常適合。 PS:閱讀「dput」以瞭解如何以更好的方式共享您的數據。 – Roland 2013-05-07 18:56:30

回答

1

的幾點:

  • 的曲線是大致對稱的大致35,從而起始c應等於-35,不35。
  • 給定對稱性b應該是偶數,2,4,6,...。
  • 該模型需要靈活地向上和向下移動,所以添加一個參數爲
  • 與最後一點我們有兩個線性參數,所以使用algorithm="plinear",以避免必須拿出他們的起始值。此外,我們正在修復b,所以我們現在只有c給出了一個初始值,並且我們已經確定我們將使用-35。

因此嘗試以下,並用b,或許還加上運行= 2,B = 6,以及:

nls(y_combsl ~ cbind(1, (x_combsl + c)^4), data, alg = "plinear", start = list(c = -35)) 

courese我們真的現在已經下降到一個多項式,所以我們可能會在模式更改爲全多項式和使用lm

lm(y_combsl ~ poly(x_combsl, 4), data)