1樓:宣哥專屬系列
如果從容量為n的有限總體抽樣,若每次抽取容量為n的樣本,那麼一共可以得到n取n的組合個樣本(所有可能的樣本個數)。抽樣所得到的每一個樣本可以計算一個平均數,全部可能的樣本都被抽取後可以得到許多平均數。如果將抽樣所得到的所有可能的樣本平均數集合起來便構成一個新的總體,平均數就成為這個新總體的變數。
由平均數構成的新總體的分佈,稱為平均數的抽樣分佈。隨機樣本的任何一種統計數都可以是一個變數,這種變數的分佈稱為統計數的抽樣分佈。
簡述三大抽樣分佈與引數檢驗之間的關係 50
2樓:組編天下
1.總體:總體(population)是根據研究目的確定的同質的觀察單位的全體,更確切的說,是同質的所有觀察單位某種觀察值(變數值)的集合。
總體可分為有限總體和無限總體。總體中的所有單位都能夠標識者為有限總體,反之為無限總體。
樣本:從總體中隨機抽取部分觀察單位,其測量結果的集合稱為樣本(sample)。樣本應具有代表性。所謂有代表性的樣本,是指用隨機抽樣方法獲得的樣本。
2.隨機抽樣:隨機抽樣(random sampling)是指按照隨機化的原則(總體中每一個觀察單位都有同等的機會被選入到樣本中),從總體中抽取部分觀察單位的過程。
隨機抽樣是樣本具有代表性的保證。
3.變異:在自然狀態下,個體間測量結果的差異稱為變異(variation)。
變異是生物醫學研究領域普遍存在的現象。嚴格的說,在自然狀態下,任何兩個患者或研究群體間都存在差異,其表現為各種生理測量值的參差不齊。
4.計量資料:對每個觀察單位用定量的方法測定某項指標量的大小,所得的資料稱為計量資料(measurement data)。
計量資料亦稱定量資料、測量資料。.其變數值是定量的,表現為數值大小,一般有度量衡單位。如某一患者的身高(cm)、體重(kg)、紅細胞計數(1012/l)、脈搏(次/分)、血壓(kpa)等
計數資料:將觀察單位按某種屬性或類別分組,所得的觀察單位數稱為計數資料(count data)。計數資料亦稱定性資料或分類資料。
其觀察值是定性的,表現為互不相容的類別或屬性。如調查某地某時的男、女性人口數;**一批患者,其**效果為有效、無效的人數;調查一批少數民族居民的a、b、ab、o 四種血型的人數等。
等級資料:將觀察單位按測量結果的某種屬性的不同程度分組,所得各組的觀察單位數,稱為等級資料(ordinal data)。等級資料又稱有序變數。
如患者的**結果可分為**、好轉、有效、無效或死亡,各種結果既是分類結果,又有順序和等級差別,但這種差別卻不能準確測量;一批腎病患者尿蛋白含量的測定結果分為 +、++、+++等。
等級資料與計數資料不同:屬性分組有程度差別,各組按大小順序排列。
等級資料與計量資料不同:每個觀察單位未確切定量,故亦稱為半計量資料。
5.概率:概率(probability)又稱機率,是度量某一隨機事件a發生可能性大小的一個數值,記為p(a),p(a)越大,說明a事件發生的可能性越大。0﹤p(a)﹤1。
頻率:在相同的條件下,獨立重複做n 次試驗,事件a 出現了m 次,則比值m/n 稱為隨機事件a 在n 次試驗中出現的頻率(freqency)。當試驗重複很多次時p(a)= m/n。
6. 隨機誤差:隨機誤差(random error)又稱偶然誤差,是指排除了系統誤差後尚存的差。
它受多種因素的影響,使觀察值不按方向性和系統性而隨機的變化。誤差變數一般服從正態分佈。隨機誤差可以通過統計處理來估計。
抽樣誤差(sampling error )是指樣本統計量與總體引數的差別。在總體確定的情況下,總體引數是固定的常數,統計量是在總體引數附近波動的隨機變數。
7.系統誤差:系統誤差(systematic error)是指由於儀器未校正、測量者感官的某種偏差、醫生掌握療效標準偏高或偏低等原因,使觀察值不是分散在真值的兩側,而是有方向性、系統性或週期性地偏離真值。系統誤差可以通過實驗設計和完善技術措施來消除或使之減少。
8.隨機變數:隨機變數(random variable)是指取指不能事先確定的觀察結果。隨機量的具體內容雖然是各式各樣的,但共同的特點是不能用一個常數來表示,而且,理論上講,每個變數的取值服從特定的概率分佈。
9.引數:引數(paramater)是指總體的統計指標,如總體均數、總體率等。總體引數是固定的常數。
多數情況下,總體引數是不易知道的,但可通過隨機抽樣抽取有代表性的樣本,用算得的樣本統計量估計未知的總體引數。
10.統計量:統計量(statistic)是指樣本的統計指標,如樣本均數、樣本率等。樣本統計量可用來估計總體引數。總體引數是固定的常數,統計量是在總體引數附近波動的隨機變數。
11.頻數表(frequency table)用來表示一批資料各觀察值或在不同取值區間的出現的頻繁程度(頻數)。對於離散資料,每一個觀察值即對應一個頻數,如某醫院某年度一日內死亡0,1,2…個病人的天數。
對於散佈區間很大的離散資料和連續型資料,資料散佈區間由若干組段組成,每個組段對應一個頻數。
12.算術均數(arithmetic mean)描述一組資料在數量上的平均水平。總體均數用μ表示,樣本均數用x 表示。
13.幾何均數(geometric mean)用以描述對數正態分佈或資料呈倍數變化資料的水平。記為g。
14.中位數(median)md將一組觀察值由小到大排列,n 為奇數時取位次居中的變數值;為偶數時,取位次居中的兩個變數的平均值。反映一批觀察值在位次上的平均水平。
15.極差(range)亦稱全距,即最大值與最小值之差,用於資料的粗略分析,其計算簡便但穩定性較差。
16.百分位數(percentile)是將n 個觀察值從小到大依次排列,再把它們的位次依次轉化為百分位。百分位數的另一個重要用途是確定醫學參考值範圍。
17.四分位數間距(inter-quartile range)是由第3 四分位數和第1 四分位數相減計算而得,常與中位數一起使用,描述偏態分佈資料的分佈特徵,較極差穩定。
18.方差(variance):方差表示一組資料的平均離散情況,由離均差的平方和除以樣本個數得到。
19.標準差(standard deviation)是方差的正平方根,使用的量綱與原量綱相同,適用於近似正態分佈的資料,大樣本、小樣本均可,最為常用。
20.變異係數(coefficient of variation)用於觀察指標單位不同或均數相差較大時兩組資料變異程度的比較。用cv 表示。計算:標準差/均數*100%
21.統計推斷:通過樣本指標來說明總體特徵,這種從樣本獲取有關總體資訊的過程稱為統計推斷(statistical inference)。
22.抽樣誤差:由個體變異產生的,抽樣造成的樣本統計量與總體引數的差異,稱為抽樣誤差(sampling error)。
23.標準誤及x s :通常將樣本統計量的標準差稱為標準誤。
許多樣本均數的標準差x s稱為均數的標準誤(standard error of mean,sem ),它反映了樣本均數間的離散程度,也反映了樣本均數與總體均數的差異,說明均數抽樣誤差的大小。
24.可信區間:按預先給定的概率確定的包含未知總體引數的可能範圍。
該範圍稱為總體引數的可信區間(confidence interval,ci)。它的確切含義是:可信區間包含總體引數的可能性是1- α ,而不是總體引數落在該範圍的可能性為1-α 。
25.引數估計:指用樣本指標值(統計量)估計總體指標值(引數)。引數估計有兩種方法:點估計和區間估計。
26.假設檢驗中p 的含義:指從h0 規定的總體隨機抽得等於及大於(或等於及小於)現有樣本獲得的檢驗統計量值的概率。
27.i 型和ii 型錯誤:i 型錯誤(type i error ),指拒絕了實際上成立的h0,這類「棄真」的錯誤稱為i 型錯誤,其概率大小用α表示;ii 型錯誤(type ii error),指接受了實際上不成立的h0,這類「存偽」的誤稱為ii 型錯誤,其概率大小用β表示。
28.檢驗效能:1- β稱為檢驗效能(power of test),它是指當兩總體確有差別,按規定的檢驗水準a 所能發現該差異的能力。
29.檢驗水準:是預先規定的,當假設檢驗結果拒絕h0,接受h1,下「有差別」的結論時犯錯誤的概率稱為檢驗水準(level of a test),記為α 。
30..率(rate)又稱頻率指標,說明一定時期內某現象發生的頻率或強度。計算公式為:
發生某現象的觀察單位數/可能發生某現象的觀察單位總數*100%,表示方式有:百分率(%)、千分率(‰)等。
31.構成比(proportion)又稱構成指標,說明某一事物內部各組成部分所佔的比重或分佈。計算公式為:
某一組成部分的觀察單位數/同一事物各組成部分的觀察單位總數*100%,表示方式有:百分數等。
32.比(ratio)又稱相對比,是a、b 兩個有關指標之比,說明a 是b 的若干倍或百分之幾。計算公式為:a/b ,表示方式有:倍數或分數等。
33.非引數統計:針對某些資料的總體分佈難以用某種函式式來表達,或者資料的總體分佈的函式式是未知的,只知道總體分佈是連續型的或離散型的,用於解決這類問題的一種不依賴總體分佈的具體形式的統計分析方法。
由於這類方法不受總體引數的限制,故稱非引數統計法(non-parametric statistics),或稱為不拘分佈(distribution-free statistics)的統計分析方法,又稱為無分佈型式假定(assumption free statistics)的統計分析方法。
34.引數統計:通常要求樣本來自總體分佈型是已知的(如正態分佈),在這種假設的基礎上,對總體引數(如總體均數)進行估計和檢驗,稱為引數統計(parametric statistics)
35.秩次:變數值按照從小到大順序所編的秩序號稱為秩次(rank)。
36.秩和:各組秩次的合計稱為秩和(rank sum),是非引數檢驗的基本統計量。
37.直線迴歸(linear regression)建立一個描述應變數依自變數變化而變化的直線方程,並要求各點與該直線縱向距離的平方和為最小。直線迴歸是迴歸分析中最基本、最簡單的一種,故又稱簡單迴歸(****** regression)。
38.迴歸係數(regression coefficient )即直線的斜率(slope),在直線迴歸方程中用b 表示,b 的統計意義為x每增(減)一個單位時,y平均改變b 個單位。
39.相關係數r:用以描述兩個隨機變數之間線性相關關係的密切程度與相關方向的統計指標。
樣本分佈和抽樣分佈的區別是什麼,總體分佈,抽樣分佈,樣本分佈的區別和聯絡
一 性質不同 1 樣本分佈 總體是指考察的物件的全體,個體是總體中的每一個考察的物件,樣本是總體中所抽取的一部分個體,而樣本容量則是指樣本中個體的數目。樣本分佈是用來估計總體分佈的。2 抽樣分佈也稱統計量分佈 隨機變數函式分佈,是指樣本估計量的分佈。二 統計學概念不同 1 樣本分佈 總體中抽取的所要...
方差齊性檢驗,可用的抽樣分佈形態是t分佈
方差齊性檢驗意義在於反映了一組資料與其平均值的偏離程度。方差齊性檢驗是方差分析的重要前提,是方差可加性原則應用的一個條件。方差齊性檢驗是對兩樣本方差是否相同進行的檢驗。方差齊性檢驗和兩樣本平均數的差異性檢驗在假設檢驗的基本思想上是沒有什麼差異性的。只是所選擇的抽樣分佈不一樣。方差齊性檢驗所選擇的抽樣...
簡述洋流的概念及其分類,世界洋流分佈的特點
1 洋流的概念和分類 1 概念 海洋中的水.常年比較穩定地沿著一定方向做大規模的流動.叫做洋流.2 分類 洋流有不同的分類標準.因而有不同的型別.如下表所示 按成因分類 按與流經海區水溫比較分類 風海流 暖流 比流經海區水溫高的洋流 密度流 補償流 水平補償流 寒流 比流經海區水溫低的洋流 上升補償...