Statistical indicators

國內外統計指標簡介

#R square
根據多數相關文獻,為了評估並比較各國不同之規範的收縮預測結果,多使用確定係數作為一公平、客觀的指標。其定義如下所示:
其中:
n = 資料點總數
 = 第i個資料點之觀測值
 = 第i個資料點之預測值
 = 預測值之平均
愈靠近1 時,表示預測結果相當準確,而當 愈趨近0時,表示預測結果不佳。
#Bazant and Baweja
此統計指標由Bažant提出,主要特色為針對潛變、收縮的量測特性進行改善, 將每個實驗時間點依對數時間區間分割成0至9.9天、10至99.9天、100至1000天等以此類推,並將每個資料點賦予一權重 。 由於收縮實驗之量測習慣多為前期頻繁地量測,後期則大量減少量測頻率。 此類似對數時間的量測方式造成前期與後期資料點數量相差甚大,因此,透過計算 (經過權重調整後的資料點之變異係數)可以針對不同資料點數量的時間區間賦予權重, 當 愈接近0%時,預測值與觀測值為完全相關。公式定義如下所示:
 =
其中:
n = 在第j個資料組中之資料點數
 = 一個資料組中所有資料點之權重總合
 = 在對數時間區間k中的資料點數
 = 一個資料組中之對數時間區間數
N = 資料組數
 = 在第j個資料組中的第i個資料點之觀測值
 = 在第j個資料組中的第i個資料點之預測值
 = 在第j個資料組中的第i個資料點之權重
 = 第j個資料組之變異係數
 = 整體之變異係數
此統計指標可看出試驗值與預測值經權重後的偏差程度,突顯中、長期對於整筆資料的重要性,較符合用於混凝土之收縮預測,但由於最後結果為各區間權重後之變異係數平方相加再開根號,雖經權重修正,但仍可能被殘差相對較大之少數資料組控制。
#CEB statistical indicators
此統計指標由Müller&Hilsdorf 所提出,將實驗時間點分割成0至10天、11至100天、101至365天、366至730天、731至1095天、與1095天以上等六個資料組區間。此統計有以下三個指標:
變異係數 為:
其中:
 = 第i個資料組中之資料點數
n = 資料組數
 = 在第j個資料組中的第i個資料點之觀測值
 = 第i個資料組之觀測值平均值
 = 在第j個資料組中的第i個資料點之預測值
 = 第i個資料組之變異係數
 = 變異係數
變異係數 主要作用為評估預測值與觀測值間之偏差量,當其等於0%時,預測值與觀測值為完全相關。
此變異數有幾個問題,其一為當第i個資料組中只有少數的資料點數時,對變異數會產生顯著的影響;反之,如果資料點數很多時,對變異數的影響幅度則會下降, 其結果導致資料點數相對較少的資料組會影響整體的變異數。
其二為當資料點數過於集中在前期而後期點數稀少時,會造成前期的 很小而給予其很大的權重 ,造成整體的變異會由前期的資料點數影響而忽略了後期的重要性,但是對於收縮和潛變的數據分析中,其終值才是最為重要的。

均方誤差 為:
其中:
 = 在第j個資料組中的第i個資料點之預測值
 = 在第j個資料組中的第i個資料點之觀測值
 = 第i個資料組中之資料點數
n = 資料組數
 = 
均方誤差 主要作用為評估預測值與觀測值之誤差佔觀測值之比例大小。當其等於0%時,預測值與觀測值為完全相關。
然而,權重 會受到 而有顯著的影響,例如在微小的收縮變異下會導致其被過度強調,而有較大的收縮變異時則會被低估,同樣導致短時間的收縮潛變會決定整體的分析而非最為重要的終值。

平均差 為:
其中:
= 在第j個資料組中的第i個資料點之預測值
= 在第j個資料組中的第i個資料點之觀測值
= 第i個資料組中之資料點數
n = 資料組數
平均差 主要作用為評估所有資料點預測值為高估或低估之趨勢。當其等於1.0時,預測值與觀測值為完全相關。
此平均差僅能看出預測值之整體趨勢為低估或者高估,無法得知資料點發散程度或著分布情形。
#Gardner
其將所有實驗時間點分割成3至9.9天、10至31.5天、31.6至99天、100至315天、316至999天、1000至3159天、與3160天以上等七個資料組區間。 透過計算各資料組的方均根,並除以組數求得方均根的平均,再除以觀測值的平均即可得 。當 =0%時,預測值與觀測值為完全相關。公式與定義如下:
其中:
n = 一個資料組中之資料點數
N = 資料組數
= 在第j個資料組中的第i個資料點之觀測值
= 在第j個資料組中的第i個資料點之預測值
= 第j個資料組中觀測值之平均值
= 各組資料方均根之平均值
= 第j個資料組中之方均根
= 一個資料組中所有資料點之權重總合
可看出試驗值與預測值的偏差程度,且係將各資料組之方均根與平均先進行平均後相除,不使用變異係數平方合開根號的方式,較無受少數相對誤差較大資料組影響的問題。