統計學上為什麼P值大於0 05我們可認為該組資料是符合正態分

2021-05-25 15:21:07 字數 6420 閱讀 2391

1樓:匿名使用者

是的。大於0.05表示無差異,小於0.05表示有差異。大於0.05表明與正態分佈無差異,故符合正態分佈。

由於「小概率事件」和假設檢驗的基本思想 「小概率事件」通常指發生的概率小於5%的事件,認為在一次試驗中該事件是幾乎不可能發生的。

由此可見x落在(μ-3σ,μ+3σ)以外的概率小於千分之三,在實際問題中常認為相應的事件是不會發生的,基本上可以把區間(μ-3σ,μ+3σ)看作是隨機變數x實際可能的取值區間,這稱之為正態分佈的「3σ」原則。

集中性:正態曲線的高峰位於正**,即均數所在的位置。

對稱性:正態曲線以均數為中心,左右對稱,曲線兩端永遠不與橫軸相交。

均勻變動性:正態曲線由均數所在處開始,分別向左右兩側逐漸均勻下降。

曲線與橫軸間的面積總等於1,相當於概率密度函式的函式從正無窮到負無窮積分的概率為1。即頻率的總和為100%。

2樓:匿名使用者

簡單講一般可以這樣理解:統計學裡在差異性的比較中,大於0.05表示無差異,小於0.05表示有差異。大於0.05表明與正態分佈無差異,故符合正態分佈。

p值不代表顯著不顯著,只是代表我們下錯誤結論的機率。

3樓:千影水妖

不知道。。。等高人指點下。。學習ing

這spss對一組資料進行正態性檢驗,得到這個圖,怎麼分析它是否服從正態分佈?

4樓:

一般是以0.05作為界限,這是比較通用的規則。你的資料並不嚴格服從正態分佈,因專為shapiro-wilks test的p值為0.

017。考慮屬到shapiro-wilks test有較高的檢驗效能(相對於其他的正態性檢驗,如kolmogorov-**irnov test等),且p值僅為0.017,而kolmogorov-**irnov test的p值為0.

168,因此你的資料也沒有嚴重背離正態分佈。如果你的後續目的是進行t檢驗或方差分析等,由於這些方法對資料背離正態分佈並不敏感,你仍然可以使用,而不必理會正態分佈的問題。

5樓:匿名使用者

你的樣本很小,看sw值即可

我替別人做這類的資料分析蠻多的

6樓:南開生態

任何bai軟體對任何分佈的檢

du驗都是預設0假設,包zhi

括正態分佈。一般以dao概率0.05為界,如果所版計權算出的概率p(即軟體中的sig.

)小於0.05就否定0假設、接受備擇假設,即不符合正態分佈;如果所計算出的概率p大於0.05就接受0假設,即符合正態分佈。

統計學中的p值應該怎麼計算

7樓:河傳楊穎

p值的計算公式是

=2[1-φ(z0)] 當被測假設h1為 p不等於p0時;

=1-φ(z0)  當被測假設h1為 p大於p0時;

=φ(z0)   當被測假設h1為 p小於p0時;

總之,p值越小,表明結果越顯著。但是檢驗的結果究竟是「顯著的」、「中度顯著的」還是「高度顯著的」需要根據p值的大小和實際問題來解決。

擴充套件資料

統計學中迴歸分析的主要內容為:

1、從一組資料出發,確定某些變數之間的定量關係式,即建立數學模型並估計其中的未知引數。估計引數的常用方法是最小二乘法。

2、對這些關係式的可信程度進行檢驗。

3、在許多自變數共同影響著一個因變數的關係中,判斷哪個(或哪些)自變數的影響是顯著的,哪些自變數的影響是不顯著的,將影響顯著的自變數加入模型中,而剔除影響不顯著的變數,通常用逐步迴歸、向前迴歸和向後迴歸等方法。

4、利用所求的關係式對某一生產過程進行**或控制。迴歸分析的應用是非常廣泛的,統計軟體包使各種迴歸方法計算十分方便。

8樓:牽陽焱樑桃

統計學意義(p值)zt

結果的統計學意義是結果真實程度(能夠代表總體)的一種估計方法。專業上,p值為結果可信程度的一個遞減指標,p值越大,我們越不能認為樣本中變數的關聯是總體中各變數關聯的可靠指標。p值是將觀察結果認為有效即具有總體代表性的犯錯概率。

如p=0.05提示樣本中變數關聯有5%的可能是由於偶然性造成的。即假設總體中任意變數間均無關聯,我們重複類似實驗,會發現約20個實驗中有一個實驗,我們所研究的變數關聯將等於或強於我們的實驗結果。

(這並不是說如果變數間存在關聯,我們可得到5%或95%次數的相同結果,當總體中的變數存在關聯,重複研究和發現關聯的可能性與設計的統計學效力有關。)在許多研究領域,0.05的p值通常被認為是可接受錯誤的邊界水平。

在最後結論中判斷什麼樣的顯著性水平具有統計學意義,不可避免地帶有武斷性。換句話說,認為結果無效而被拒絕接受的水平的選擇具有武斷性。實踐中,最後的決定通常依賴於資料集比較和分析過程中結果是先驗性還是僅僅為均數之間的兩兩》比較,依賴於總體資料集裡結論一致的支援性證據的數量,依賴於以往該研究領域的慣例。

通常,許多的科學領域中產生p值的結果≤0.05被認為是統計學意義的邊界線,但是這顯著性水平還包含了相當高的犯錯可能性。結果0.

05≥p>0.01被認為是具有統計學意義,而0.01≥p≥0.

001被認為具有高度統計學意義。但要注意這種分類僅僅是研究基礎上非正規的判斷常規。

所有的檢驗統計都是正態分佈的嗎並不完全如此,但大多數檢驗都直接或間接與之有關,可以從正態分佈中推匯出來,如t檢驗、f檢驗或卡方檢驗。這些檢驗一般都要求:所分析變數在總體中呈正態分佈,即滿足所謂的正態假設。

許多觀察變數的確是呈正態分佈的,這也是正態分佈是現實世界的基本特徵的原因。當人們用在正態分佈基礎上建立的檢驗分析非正態分佈變數的資料時問題就產生了,(參閱非引數和方差分析的正態性檢驗)。這種條件下有兩種方法:

一是用替代的非引數檢驗(即無分佈性檢驗),但這種方法不方便,因為從它所提供的結論形式看,這種方法統計效率低下、不靈活。另一種方法是:當確定樣本量足夠大的情況下,通常還是可以使用基於正態分佈前提下的檢驗。

後一種方法是基於一個相當重要的原則產生的,該原則對正態方程基礎上的總體檢驗有極其重要的作用。即,隨著樣本量的增加,樣本分佈形狀趨於正態,即使所研究的變數分佈並不呈正態。

統計學 p值=0 代表什麼意思? 10

9樓:匿名使用者

統計學意義(p值)zt

結果的統計學意義是結果真實程度(能夠代表總體)的一種估計方法。專業上,p值為結果可信程度的一個遞減指標,p值越大,我們越不能認為樣本中變數的關聯是總體中各變數關聯的可靠指標。p值是將觀察結果認為有效即具有總體代表性的犯錯概率。

如p=0.05提示樣本中變數關聯有5%的可能是由於偶然性造成的。即假設總體中任意變數間均無關聯,我們重複類似實驗,會發現約20個實驗中有一個實驗,我們所研究的變數關聯將等於或強於我們的實驗結果。

(這並不是說如果變數間存在關聯,我們可得到5%或95%次數的相同結果,當總體中的變數存在關聯,重複研究和發現關聯的可能性與設計的統計學效力有關。)在許多研究領域,0.05的p值通常被認為是可接受錯誤的邊界水平。

在最後結論中判斷什麼樣的顯著性水平具有統計學意義,不可避免地帶有武斷性。換句話說,認為結果無效而被拒絕接受的水平的選擇具有武斷性。實踐中,最後的決定通常依賴於資料集比較和分析過程中結果是先驗性還是僅僅為均數之間的兩兩》比較,依賴於總體資料集裡結論一致的支援性證據的數量,依賴於以往該研究領域的慣例。

通常,許多的科學領域中產生p值的結果≤0.05被認為是統計學意義的邊界線,但是這顯著性水平還包含了相當高的犯錯可能性。結果0.

05≥p>0.01被認為是具有統計學意義,而0.01≥p≥0.

001被認為具有高度統計學意義。但要注意這種分類僅僅是研究基礎上非正規的判斷常規。

所有的檢驗統計都是正態分佈的嗎並不完全如此,但大多數檢驗都直接或間接與之有關,可以從正態分佈中推匯出來,如t檢驗、f檢驗或卡方檢驗。這些檢驗一般都要求:所分析變數在總體中呈正態分佈,即滿足所謂的正態假設。

許多觀察變數的確是呈正態分佈的,這也是正態分佈是現實世界的基本特徵的原因。當人們用在正態分佈基礎上建立的檢驗分析非正態分佈變數的資料時問題就產生了,(參閱非引數和方差分析的正態性檢驗)。這種條件下有兩種方法:

一是用替代的非引數檢驗(即無分佈性檢驗),但這種方法不方便,因為從它所提供的結論形式看,這種方法統計效率低下、不靈活。另一種方法是:當確定樣本量足夠大的情況下,通常還是可以使用基於正態分佈前提下的檢驗。

後一種方法是基於一個相當重要的原則產生的,該原則對正態方程基礎上的總體檢驗有極其重要的作用。即,隨著樣本量的增加,樣本分佈形狀趨於正態,即使所研究的變數分佈並不呈正態

10樓:匿名使用者

p值是描述隨機事件發生可能性的大小。等於0表示在這個關係中,沒有可能是隨機事件導致解釋變數與被解釋變數之間的聯絡

求問統計學裡的p值是什麼含義?請用通俗易懂的語言解釋,謝謝!

11樓:語言學新兵

你需要的可能是一個故事。

從前,你有個朋友,他每月開一輛小貨車去市場裡採購東西,然後再把所有這些東西轉賣出去。月復一月,年復一年。

但是,因為市場**變動,每一個月他賣東西得到的毛爺爺數目並不一樣,差不多有個5000塊錢左右吧。你呢能看到他每個月的收入統計。

時間長了,有一次,無聊的你準備戲耍一下這個無辜的小夥伴,你偷偷在他的小貨車上裝了一小瓶尿。既然他肯定會在集市上賣掉所有東西,那麼這一小瓶尿他一定也會賣出去,只不過這瓶尿的**可能也就是零吧。

這一次他賺了5400塊,這可比以往的平均數5000塊錢還多。那問題就來了:為什麼這個月他賺的比平常多呢?

有兩種情況:其一,你那瓶尿很值錢,他自然會多賺;其二,你那瓶尿根本不值錢,他多賺了只是因為這個月市場上**不錯。

那到底是哪種情況呢?這個問題的實質是,你那瓶尿到底值不值錢。如果這瓶尿根本不值錢,那他賣東西和以前賣東西的情況沒什麼兩樣,只不過是市場**影響而已。

於是,你翻了他以前賣東西的紀錄,算了算所有他的個人月收入超過5400塊的概率,大概是0.1。也就是說在你這瓶尿沒有任何價值的情況下,只靠市場**,他只有0.

1的概率賣到5400塊。

所以你得出的結論是,你的那瓶尿有價值,你這個結論的p值就是0.1。

===================

故事講完了,來分析一下。

為什麼要用p值?換句話說,為什麼要做推斷統計?我想,p值到底是啥並不重要,我知道你做研究時多半隻是負責看看p到底有沒有比0.05小的。而這個問題,才是我最想告訴你的。

推斷統計,之所以要「推斷」,是因為我們沒有辦法正面驗證某種情況。在這個故事中,你以前沒幹過偷偷把一瓶尿放在車上的事兒,他以前也沒賣過你的尿,所以儘管你有的是他的銷售資料,但那些舊賬本沒辦法正面告訴你你的尿到底值不值錢。

這就是「沒辦法正面驗證」,在這樣的情況下,你就沒辦法了麼?非也,我們可以換個角度考慮這個問題,假設「你那瓶尿毫無價值」是成立的,他賣了這瓶尿跟沒賣時候沒什麼兩樣,那這一次和以往自然也沒什麼兩樣。既然這次賣東西和以往一樣,那舊賬本中的記錄就能幫到你了。

你可以算算舊賬本,他在沒賣過你那瓶尿的情況下,賺到5400塊及以上的可能性(概率),這個概率就是「你那瓶尿毫無價值」的概率,這裡也就是0.1.

這樣,「你那瓶尿有價值」的概率,當然就是這個假設的相反情況,也就是0.9,這也是你的假設成立的可能性。

那這個p值到底顯著與否呢?那得看市場**。這裡市場**是隨機的,所以「顯著」與否簡單點就是在說你那瓶尿能不能跑贏市場。

業內經常以兩個標準差作為衡量「顯著」的標準。絕大多數情況下,作為隨機變數的市場**服從正態分佈。而正態分佈中,超過兩個標準差的概率是0.

05,這也就是為什麼大家要拿0.05作為「公認」的顯著性水平尺度了。

統計推斷,核心就是反證法。你那瓶尿沒價值的可能性越小,反而越能證明你那瓶尿有價值。

「在原假設成立的情況下抽到的統計量與原假設之間的距離至少等於樣本計算值與原假設之間的距離」

這是你的書上寫的定義,但是很明顯,你把結尾最重要的「的概率」三個字漏掉了。正常情況下,這個定義應該是

「在原假設成立的情況下抽到的統計量與原假設之間的距離至少等於樣本計算值與原假設之間的距離的概率」

不信你可以再看看你的書。

但是,怎麼可以容忍這麼***的定義?我們來用這個故事做個轉換吧:

「在原假設成立的情況下」 -> 在你那瓶尿不值錢情況下

「抽到的統計量與原假設之間的距離」 -> 他舊賬本里的銷售記錄

「至少等於」 -> 大於或等於

"樣本計算值與原假設之間的距離" -> 他這一次的銷售記錄(5400塊)

「的概率」 -> 的概率

連起來讀讀,p值的定義就變成:

「在你那瓶尿不值錢的情況下,他舊賬本里的銷售記錄大於或等於他這一次的銷售記錄(5400塊錢)(這個事件發生)的概率。」

這一次,好懂了點嗎?

最後要說明,說得通俗易懂是要承擔風險的,因為通俗很可能意味著不嚴謹,易懂很可能意味著不周全。以上有很多有失嚴謹之處,希望題主還要多多看書哇。

最後的最後,為什麼我要用「一瓶尿」這樣一個非常粗俗**的故事?因為所謂的p value,不就是用來證明你的pee value的麼?

個人觀點,僅供參考!

統計P值是什麼,怎麼算,統計學中的P值應該怎麼計算

p值就是概率,一般的話小於0.05就行,意思就是你所估計出來的值只有5 的可能是落在置信區間之外的,也就是說這個值越小越靠譜,一般統計學上取0.05為界,大於拒絕,小於接受 p值即為拒絕域的面積或概率。p值的計算公式是 2 1 z0 當被測假設h1為 p不等於p0時 1 z0 當被測假設h1為 p大...

統計學的P值中的P是什麼含義

不是。p值 p value 就是當原假設為真時所得到的樣本觀察結果或更極端結果出現的概率。如果p值很小,說明原假設情況的發生的概率很小,而如果出現了,根據小概率原理,我們就有理由拒絕原假設,p值越小,我們拒絕原假設的理由越充分。總之,p值越小,表明結果越顯著。但是檢驗的結果究竟是 顯著的 中度顯著的...

統計學中t值p值是什麼意思?怎麼計算

1 t指的是t檢驗,亦稱student t檢驗 student s t test 主要用於樣本含量較小 n 30 總體標準 差 未知的正態分佈資料。計算 t的檢驗是雙側檢驗,只要t值的絕對值大於臨界值就是不拒絕原假設。2 p值 p value 就是當原假設為真時所得到的樣本觀察結果或更極端結果出現的...