sampling

1熱度

2回答

一個給定概率分佈假設的概率分佈如下： x座標表示小時，y座標裝置，用於每個小時的概率。問題是如何生成一組1000個隨機數據，遵循概率分佈？

0熱度

1回答

我聽說與word2vec一起使用的術語「負採樣」和「子採樣」很多。在我試圖搞砸word2vec之前，我試圖回到引用單詞嵌入的論文，並從頭開始。本文線索已經落在這裏我： https://gul.gu.se/public/pp/public_courses/course77642/published/1497871737091/resourceId/37659332/content/Uploaded

0熱度

1回答

更新：用本地最大值可視化信號

我有一個信號，我想在我的信號中添加一個高原（展平），以便找到當地的最大值。我在這裏提供了一個例子，使我的問題更易於理解，因爲我的真實數據的大小是1x1666520，所以我無法在此處上傳整個文件。我想要做什麼，我期待： •我想讓我的信號平坦，我們會發現在信號局部最大值。 •我想將窗口應用於信號，以便在一定範圍內可視化展平的效果，並且更深入，更清晰地顯示我的信號。我也想控制窗口的大小和寬度。這裏

-1熱度

2回答

生成樣本分佈和中位數

如何計算位數在R和創建直方圖與正態分佈畝= 16和sigma = 4

-1熱度

1回答

分層抽樣大小因R中的組而異R

我對R相當新鮮。現在，當樣本大小基於組更改時，我停止了分層抽樣。的數據看起來像這樣：和樣品大小而變化根據不同的基團或階層：我用分層抽樣，但不能圖取出樣本量。 Result <- stratified(Population, c("Loc", "Format"), Population$SampleSize), replace = FALSE, keep.row

2熱度

1回答

升頻每小時數據到5個數據在熊貓

，我有以下數據： MTU (CET) Day-ahead Price [EUR/MWh] 0 09.10.2017 00:00 - 09.10.2017 01:00 43.13 1 09.10.2017 01:00 - 09.10.2017 02:00 34.80 2 09.10.2017 02:00 - 09.10.2017 03:00 33.3

4熱度

1回答

二維numpy數組的加權隨機採樣

我有一個2d numpy數組Z，我想隨機選擇一個索引Z，其中索引被選擇的機會與該索引處的Z值成正比。現在，我做了以下內容： yar = list(np.ndenumerate(Z)) x,y = yar[np.random.choice(len(yar), p=Z.ravel()/Z.sum())][0] 哪個做這項工作，但感覺醜陋的（並且是極其緩慢之外）。有沒有更好的辦法？

0熱度

1回答

隨機分配不同的值，以作爲R

使用不同的概率行具有這樣的數據幀： ID var 1 NA 2 NA 3 NA 4 NA ... 我需要隨機地分配20個％的行var值是A，和30％的行爲B，和50％的行是C. 有沒有一些有效的方法來解決這個問題？

1熱度

1回答

如何近似未知數量的第x百分位數

最近遇到了關於如何找到給定數字流的第x百分位數的問題。如果數據流相對較小（可以存儲到內存中，排序並且可以找到第x個值），我對此有基本的瞭解，但是我想知道如果數字流相當公平，百分比是如何近似的數量衆多，數量未知。

2熱度

1回答

合併後R中的分層隨機抽樣

假設我們有一個包含總體的原始數據集，並且我們有一個合併數據集，該數據集包含與另一個數據集合並後的總體（因此較少的觀察值）。 library(tidyverse) set.seed(0) population_data <- data.frame(ID = c(1:100), industry = sample(1:10, 100, replace = T),