montecarlo

    1熱度

    2回答

    根據我的理解,MCTS中播出或模擬階段的目標是獲得一個結果,並獎勵或懲罰從反向傳播過程中的根路徑上的節點。 (請糾正我,如果我錯了) 我的問題是,如果我可以使用領域知識啓發式來獲得這個結果,而不是實際模擬遊戲到最後。 我問的原因是我正在做類似於尋路的事情,目標是找到目標狀態(節點)的路徑,這意味着模擬遊戲到最後對我來說是非常困難的。

    -3熱度

    2回答

    我正在嘗試使用多個進程來編寫Pi計算的模擬。 我有一個函數,產生從1到-1, 隨機雙x,y數字,當我試圖計算是否x^2 + y^2 < = 1, 但結果是一個巨大的數字,並且它總是大於1 icpi.cpp更大(主文件): #include <mpi.h> #include <iostream> #include "main_header.h" #include "dynamic.h" us

    1熱度

    1回答

    嗨我試圖解決一個球員有$ 10的問題。一個硬幣被翻轉,如果玩家正確地稱它爲$ 1,如果他不正確,他將失去$ 1。他在達到20美元之前會達到0美元的機率是多少?遊戲持續時間平均多久?在25次翻轉後,他平均有多少錢?我應該使用蒙特卡洛方法中的R爲這個代碼,但我是一個初學者,不能完全確定在這裏start--就是我的想法 game <- function() { x=10 ## $10 y=0 ##

    -1熱度

    1回答

    我正在與蒙特卡羅積分問題在R.掙扎 Y = X^2個+ COS(X);對於x = [0,2] 我應該使用HitMiss < - 函數(T,S,方法= 「哈爾頓」)來解決這個問題。 T是S中每個樣本大小運行的路徑數。 S是樣本點數 函數應該返回T * | S |矩陣,| S |是長度S. 請幫我解決這個問題,並給我一些線索。 真的很感激!

    1熱度

    1回答

    我必須在R中創建蒙特卡洛模擬。我模擬連續滾動一對骰子100次。我應該看到何時總共發生七次的第一次滾動。當第一個總數爲7的滾動滾動時,我想存儲這個數字,然後找到平均值。我將運行模擬10萬次,然後使用平均值來查看擲骰子總共需要多長時間才能完成7次。我無法存儲此值。這裏是一些peuedocode: set.seed(101) trials<-4 ## will later change to 100,

    1熱度

    1回答

    我想在QuTiP中運行一些代碼,但是當我與parfor並行運行一個函數時出現錯誤。 results= parfor(func2, range(len(delta))) 錯誤: AssertionError Traceback (most recent call last) <ipython-input-206-6c2ffcb32b4f> in <module>() ----> 1

    3熱度

    3回答

    比方說,我有5個線程必須爲並行蒙特卡羅方法程序組合總計1,000,000函數調用。我爲這5個線程中的每一個分配了1,000,000/5函數調用。然而,經過多次測試(一些測試迭代次數高達1萬億次)後,我意識到有些線程的完成速度比其他線程快得多。因此,我想動態分配工作量到這些線程中的每一個。我的第一個方法涉及一個AtomicLong變量,它被設置爲初始值,例如,10億。每個函數調用後,我就減1 Ato

    3熱度

    1回答

    我正在研究一個程序,該程序基於隨機生成的表示座標的x,y座標的浮點數來計算pi。每個x,y座標由2的冪次提升並存儲在兩個獨立的數組中。座標在0,1間隔的圖上均勻分佈。 該程序添加x,y座標,如果它們小於1,則這些點位於直徑爲1的圓內,如下圖所示。 然後所用式I, π≈4瓦特/Ñ 制定出PI。其中,w是圓內的點數,n是陣列內x或y座標的數量。 當我將n設置爲10,000,000(數組大小)時,它會生

    3熱度

    2回答

    我有一個幾乎純粹的數學計算程序。問題是這些計算中的一部分是在蒙特卡羅生成的值上運行的。 好像我有兩個設計方案: 要麼我所有的計算功能,採取包含預先生成的蒙特卡洛鏈附加參數。這讓我可以在任何地方保持純粹的功能,但是由於存在調用其他函數的函數,因此會在代碼庫中添加很多線路噪聲。 另一種選擇是使所有的計算功能單點。這似乎是不幸的,因爲一些函數甚至沒有使用那些隨機值,他們只是調用一個函數來調用一個需要隨機

    3熱度

    3回答

    我需要通過評估總和 =(1 /(+ 1))Σ1 /(1-2)^(1/2)來估計pi的值,其中是均勻分佈的隨機數。 import math import random def Pi(N,x): S = (1/(N+1))*(1/(1-x**2)**(0.5)) return S def function(N,a,b): x = random.uniform(a