bootstrap置信區(qū)間:
假設(shè)總體的分布F未知,但有一個(gè)容量為n的來自分布F的數(shù)據(jù)樣本,自這一樣本按有放回抽樣的方法抽取一個(gè)容量為n的樣本,這種樣本稱為bootstrap樣本。相繼地、獨(dú)立地自原始樣本中抽取很多個(gè)bootstrap樣本,利用這些樣本對(duì)總體F進(jìn)行統(tǒng)計(jì)推斷,這種方法稱為非參數(shù)bootstrap方法,又稱自助法。
使用bootstrap方法可以求得變量(參數(shù))的置信區(qū)間,稱作bootstrap置信區(qū)間。
bootstrap置信區(qū)間:
使用Python計(jì)算bootstrap置信區(qū)間:
這里以一維數(shù)據(jù)為例,取樣本均值作為樣本估計(jì)量。代碼如下:
import numpy as np def average(data): return sum(data) / len(data) def bootstrap(data, B, c, func): """ 計(jì)算bootstrap置信區(qū)間 :param data: array 保存樣本數(shù)據(jù) :param B: 抽樣次數(shù) 通常B>=1000 :param c: 置信水平 :param func: 樣本估計(jì)量 :return: bootstrap置信區(qū)間上下限 """ array = np.array(data) n = len(array) sample_result_arr = [] for i in range(B): index_arr = np.random.randint(0, n, size=n) data_sample = array[index_arr] sample_result = func(data_sample) sample_result_arr.append(sample_result) a = 1 - c k1 = int(B * a / 2) k2 = int(B * (1 - a / 2)) auc_sample_arr_sorted = sorted(sample_result_arr) lower = auc_sample_arr_sorted[k1] higher = auc_sample_arr_sorted[k2] return lower, higher if __name__ == '__main__': result = bootstrap(np.random.randint(0, 50, 50), 1000, 0.95, average) print(result)
輸出:
(20.48, 28.32)
推薦:bootstrap入門教程
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。TEL:177 7030 7066 E-MAIL:11247931@qq.com