過程
proc means 選項列表; |
by 變量名稱(分組變量); |
class 變量名稱(分組變量); |
freq變量名稱(數(shù)值變量,用以表示相應(yīng)記錄出現(xiàn)的頻數(shù)) |
var 變量名稱(待分析的數(shù)值變量); |
run; |
Proc means 語句后的選項主要用來指定所要計算的統(tǒng)計量,默認(rèn)情況下,Means過程會給出頻數(shù)、均數(shù)、標(biāo)準(zhǔn)差、最大值和最小值等,其余統(tǒng)計量的計算均需要在選項中指定。class語句所指定的分組變量用來進(jìn)行分組,而by語句所指定的分組變量是用來將數(shù)據(jù)分為若干個更小的樣本,以便SAS分別在各小樣本內(nèi)進(jìn)行各自獨立的處理。freq語句和weight語句分別引導(dǎo)代表記錄出現(xiàn)頻數(shù)和權(quán)重系數(shù)的數(shù)值變量。var語句引導(dǎo)所要進(jìn)行分析的所有變量的列表,SAS將對var語句所引導(dǎo)的所有變量分別進(jìn)行描述性統(tǒng)計分析。
summary
proc summary 選項列表; |
by 變量名稱(分組變量); |
class 變量名稱(分組變量); |
freq變量名稱(數(shù)值變量,用以表示相應(yīng)記錄出現(xiàn)的頻數(shù)) |
output
|
var 變量名稱(待分析的數(shù)值變量); |
run; |
summary過程的格式和means過程可以說是完全相同的,各條語句和選項的含義也是相同的,包括在means過程中未列出的output語句也可以應(yīng)用于means過程,只是此語句在summary過程應(yīng)用較多(這樣才能將分析結(jié)果顯示出來),所以才將其列入一般格式中。output語句用來對分析結(jié)果輸出為數(shù)據(jù)文件進(jìn)行控制,其后的選項可有可無,若無則SAS按照默認(rèn)方式進(jìn)行?!皁ut=數(shù)據(jù)集名”用來定義輸出數(shù)據(jù)文件的文件名稱,文件名的格式和數(shù)據(jù)步中數(shù)據(jù)文件名相同?!敖y(tǒng)計量關(guān)鍵字=自定義變量名”用來自定義輸出數(shù)據(jù)文件中各種統(tǒng)計量的變量名稱,前者是系統(tǒng)定義的(和proc語句后選項中的統(tǒng)計量關(guān)鍵字完全相同),必須正確無誤,后者可自行定義。默認(rèn)狀態(tài)下輸出統(tǒng)計量只有頻數(shù)、均數(shù)、標(biāo)準(zhǔn)差、最大值和最小值,在默認(rèn)狀態(tài)不能滿足需要時這一選項則是必需的。
univariate
proc univariate 選項列表; |
by 變量名稱(分組變量); |
class 變量名稱(分組變量); |
freq變量名稱(數(shù)值變量,用以表示相應(yīng)記錄出現(xiàn)的頻數(shù)) |
weight變量名稱(數(shù)值變量,用以表示相應(yīng)記錄的權(quán)重系數(shù)) |
histogram 變量名稱/選項列表 |
var 變量名稱(待分析的數(shù)值變量); |
run; |
univariate過程和以上兩個過程的格式非常相似,相同的語句和選項其含義也相同,所不同的是某些統(tǒng)計量只能在univariate過程中計算(如眾數(shù)),以及univariate過程中所具有的繪圖功能。histogram語句即用來指示SAS對其后所指定的變量繪制直方圖,其后的選項用來指示SAS添加不同類型的擬合圖形(如正態(tài)分布的分布密度曲線)。
tabulate
proc tabulate 選項列表; |
by 變量名稱(分組變量); |
class 變量名稱(分組變量); |
freq變量名稱(數(shù)值變量,用以表示相應(yīng)記錄出現(xiàn)的頻數(shù)) |
<<頁變量表達(dá)式>,<行變量表達(dá)式>,<列變量表達(dá)式>> |
var 變量名稱(待分析的數(shù)值變量,統(tǒng)計量列入相應(yīng)的表單元格); |
run; |
tabulate過程和上述幾個過程的格式也基本相似,相同的語句和選項也代表相同的含義。最大的不同也是tabulate過程中最為重要的是table語句,他用來定義表格的具體格式以及表格中所要包括的統(tǒng)計量。
gchart
proc gchart 選項列表; |
圖形關(guān)鍵詞 變量名稱/選項列表 |
run; |
此過程格式簡單,復(fù)雜的地方在于圖形關(guān)鍵字(每個圖形關(guān)鍵字對應(yīng)一種圖形類型)所引導(dǎo)的語句,這里是控制圖形類型及圖形要素的地方,涉及到眾多的關(guān)鍵字和選項。gchart過程可以使用的圖形關(guān)鍵字及其所繪制的圖形類型見下表(表2.1)。
表2.1 gchart過程可以使用的圖形關(guān)鍵字及其所繪制的圖形類型
圖形關(guān)鍵字 |
繪制的圖形類型 |
圖形關(guān)鍵字 |
繪制的圖形類型 |
block |
方塊圖 |
pie |
圓圖 |
hbar |
水平的條形圖 |
pie3d |
三維圓圖 |
hbar3d |
水平的三維條形圖 |
donut |
環(huán)形圖 |
vbar |
豎立的條形圖 |
star |
星形圖 |
vbar3d |
豎立的三維條形圖 |
圖形關(guān)鍵字后的變量名用以指定進(jìn)行圖形描述時的分組變量,可以是數(shù)值型的(此時以各組的組中值為分組的標(biāo)志),也可以是字符型的。其后的選項比較重要的有:
(1)type=統(tǒng)計量關(guān)鍵字,表示以圖形對變量(sumvar所指定的變量)的哪一種統(tǒng)計量進(jìn)行描述,比如頻數(shù)(freq)、均數(shù)(mean)、總計(sum)、頻數(shù)百分比(pctn)等;
(2)subgroup=變量名(分組變量),指定要進(jìn)行分組(各組段內(nèi)再分組)的變量;
(3)sumvar=變量名(數(shù)值變量),指定要進(jìn)行統(tǒng)計計算的變量,也就是“type=統(tǒng)計量關(guān)鍵字”選項中統(tǒng) 計量的計算所依據(jù)的變量。其它的選項較少用到或系統(tǒng)默認(rèn)值即可基本滿足要求,這里還是少啰嗦,以后用到再說。
gplot
proc gplot 選項列表; |
bubble 散點圖表達(dá)式 |
bubble2 散點圖表達(dá)式 |
plot散點圖表達(dá)式 |
plot2散點圖表達(dá)式 |
run; |
從gplot過程的一般格式中我們就可看出,此過程只能繪制兩種類型的圖形,bubble語句指示SAS繪制泡狀散點圖,plot語句指示SAS繪制點狀散點圖。bubble2語句和plot2語句指示SAS在同一區(qū)域內(nèi)(bubble2和bubble在同一區(qū)域,plot2和plot在同一區(qū)域)繪制第二個圖形,兩者的橫坐標(biāo)相同(同一變量),縱坐標(biāo)分別位于左右兩側(cè)(可以是同一變量,也可以是兩個不同的變量)。
散點圖表達(dá)式的一般形式為:
(1)bubble和bubble2語句:縱坐標(biāo)變量名*橫坐標(biāo)變量名=泡尺寸變量名(變量值以泡的大小表示),三者均應(yīng)為數(shù)值變量;
(2)plot和plot2語句:縱坐標(biāo)變量名*橫坐標(biāo)變量名<=n/分類變量名>,此處等號及其后的部分可以省略,此時SAS以默認(rèn)的散點類型繪制散點圖;若等號后為n(n為正整數(shù),是散點類型的編號),SAS則以指定的編號對應(yīng)的散點類型繪制散點圖;若等號后為分類變量名(可為字符型或數(shù)值型,為數(shù)值型時作為離散型變量處理,每一個值將被當(dāng)作一個類別),此變量的具體值(或與每個具體值對應(yīng)的圖形)將被作為散點用來繪制散點圖。
chart過程和plot過程的一般格式及各選項使用方法分別與gchart過程和gplot過程是基本相同的,不同之處僅在于后兩者中涉及到有關(guān)三維和圖形元素(顏色等)的語句和選項在前兩者中是無效的。例如vbar3d語句在chart過程中無效,bubble語句在plot過程中無效。其余的語句和選項使用方法完全相同,所以在掌握了gchart過程和gplot過程后,chart過程和plot過程你會不學(xué)自通。
描述性統(tǒng)計指標(biāo)的計算可以用四個不同的過程來實現(xiàn),它們分別是means過程、summary過程、univariate過程以及tabulate過程。它們在功能范圍和具體的操作方法上存在一定的差別,下面我們大概了解一下它們的異同點。
相同點:
他們均可計算出均數(shù)、標(biāo)準(zhǔn)差、方差、標(biāo)準(zhǔn)誤、總和、加權(quán)值的總和、最大值、最小值、全距、校正的和未校正的離差平方和、變異系數(shù)、樣本分布位置的t檢驗統(tǒng)計量、遺漏數(shù)據(jù)和有效數(shù)據(jù)個數(shù)等,均可應(yīng)用by語句將樣本分割為若干個更小的樣本,以便分別進(jìn)行分析。不同點:
(1)means過程、summary過程、univariate過程可以計算樣本的偏度(skewness)和峰度(kurtosis),而tabulate過程不計算這些統(tǒng)計量;
(2)univariate過程可以計算出樣本的眾數(shù)(mode),其它三個過程不計算眾數(shù);
(3)summary過程執(zhí)行后不會自動給出分析的結(jié)果,須引用output語句和print過程來顯示分析結(jié)果,而其它三個過程則會自動顯示分析的結(jié)果;
(4)univariate過程具有統(tǒng)計制圖的功能,其它三個過程則沒有;
(5)tabulate過程不產(chǎn)生輸出資料文件(存儲各種輸出數(shù)據(jù)的文件),其它三個均產(chǎn)生輸出資料文件。
以上是它們的主要異同點,其它更為具體的異同點需要在實際應(yīng)用中去體會。掌握了各種過程的異同點,就可以根據(jù)具體需要選擇最佳的過程進(jìn)行工作。
統(tǒng)計制圖的過程均可以實現(xiàn)對樣本分布特征的圖形表示,一般情況下可以使用的有chart過程、plot過程、gchart過程和gplot過程。大家有沒有發(fā)現(xiàn)前兩個和后兩個只有一個字母‘g’(代表graph)的差別,其實它們之間(只差一個字母g的過程之間)的統(tǒng)計描述功能是相同的,區(qū)別僅在于繪制出的圖形的復(fù)雜和美觀程度。
chart過程和plot過程繪制的圖形類似于我們用文本字符堆積起來的圖形,只能概括地反映出資料分布的大體形狀,實際上這兩個過程繪制的圖形并不能稱之為圖形,因為他根本就沒有涉及一般意義上圖形的任何一種元素(如顏色、分辨率等)。
而gchart過程和gplot過程給出的是真正意義上的圖形,可以用很多的語句和選項來控制圖形的各方面的性質(zhì)和特征。
chart和gchart與plot和gplot的區(qū)別則體現(xiàn)在不同的作圖功能,前兩個過程可以繪制出的圖形主要有條形圖(包括橫條和豎條)、圓圖、環(huán)形圖和星形圖等,后兩個過程通常用一個記錄中的兩個變量值表示點的坐標(biāo)來繪制圖形,如散點圖和線圖等。
主要包括平均指標(biāo)和變異指標(biāo)的計算、資料分布形態(tài)(或特征)的圖形表現(xiàn)等。
工程名稱,工程地點,參建單位,開工、竣工時間,工程施工質(zhì)量情況、資料完善情況等。
根據(jù)你圖紙內(nèi)容進(jìn)行描述。
SAS中可計算的描述性統(tǒng)計量多達(dá)二十余種,大部分可在以上介紹的前四個過程中計算,個別統(tǒng)計量在某些過程中不能計算,大家需要注意,要不然系統(tǒng)顯示錯誤信息時還不知道是怎么回事。
我經(jīng)常遇到這種情況,系統(tǒng)提示錯誤(此類提示信息顯示在log窗口中)時總是摸不著頭腦,費半天勁才能搞明白。沒辦法,摸著石頭過河嘛!不過這樣也并非一無是處,最起碼可以積累很多使用經(jīng)驗。
下表(表2.2)列出SAS中可以計算的所有描述性統(tǒng)計量關(guān)鍵字及其含義,供大家使用時參考。
表2.2 SAS中可以計算的描述性統(tǒng)計量關(guān)鍵字及其含義
關(guān)鍵字 |
所代表的含義 |
n |
有效數(shù)據(jù)記錄數(shù) |
nmiss |
缺失數(shù)據(jù)記錄數(shù) |
mean |
均數(shù) |
std |
標(biāo)準(zhǔn)差 |
stderr |
標(biāo)準(zhǔn)誤 |
var |
方差 |
median |
中位數(shù) |
mode |
眾數(shù) |
cv |
變異系數(shù) |
max |
最大值 |
min |
最小值 |
range |
全距 |
sum |
總計 |
sumwgt |
加權(quán)值總計 |
css |
校正的離均差平方和 |
uss |
未校正的離均差平方和 |
clm |
可信限(上下界值) |
lclm |
可信限下側(cè)界值 |
uclm |
可信限上側(cè)界值 |
skew(skewness) |
偏度 |
kurt(kurtosis) |
峰度 |
t |
分布位置假設(shè)檢驗之t統(tǒng)計量 |
probt |
上述t統(tǒng)計量對應(yīng)的概率值 |
q1 |
第一四分位數(shù) |
q3 |
第三四分位數(shù) |
qrange |
四分位數(shù)間距 |
p1 |
第一百分位數(shù) |
p5 |
第五百分位數(shù) |
p10 |
第十百分位數(shù) |
p90 |
第九十百分位數(shù) |
p95 |
第九十五百分位數(shù) |
p99 |
第九十九百分位數(shù) |
格式:pdf
大?。?span id="hxdxvr7" class="single-tag-height">353KB
頁數(shù): 28頁
評分: 4.5
附件 2:畢業(yè)論文的有關(guān)要求 一、畢業(yè)論文的格式要求 (一)畢業(yè)論文打印的用紙要求 本科學(xué)生畢業(yè)論文采用 A4 型打印紙或復(fù)印紙打印。 (二)畢業(yè)論文的排版要求 1.頁面設(shè)置 本科學(xué)生畢業(yè)論文要求縱向打印,頁邊距的要求為:上、下各 2.5 cm,左右 各 2.0 cm,裝訂線( T):0.5 cm,裝訂線位置( T):左,其余設(shè)置采取系統(tǒng)默認(rèn) 設(shè)置。 2.排式與用字 (1)文字圖形一律從左至右橫寫橫排; (2)文字一律通欄編輯;(3)字跡 必須清楚整齊,忌用異體字、復(fù)合字及一切不規(guī)范的簡化字。除非必要,不使用 繁體字。 3.段落設(shè)置 在“格式”選項中的“段落”設(shè)置窗口中,取消“如果定義了文檔網(wǎng)格,則 與網(wǎng)格對齊( W)”選項,采用單倍行距。其余設(shè)置采取系統(tǒng)默認(rèn)設(shè)置。 4.頁眉、頁腳設(shè)置 本科學(xué)生畢業(yè)論文的頁眉使用啟功題“安陽師范學(xué)院”標(biāo)志,居中放置。 本科學(xué)生畢業(yè)論文的頁腳需要設(shè)置頁碼,頁
格式:pdf
大小:353KB
頁數(shù): 20頁
評分: 4.8
×××××有限公司×××設(shè)備采購 投標(biāo)文件 (第 標(biāo)段) 招標(biāo)編號:××××× 貨物名稱: 項目名稱: ______________________________________ 投標(biāo)單位名稱: (蓋公章) 法定代表人或授權(quán)代理人: (簽字或蓋章) 日 期: 年 月 日 一、投標(biāo)函 投 標(biāo) 函 致:_________________________________________ 根據(jù)貴方 _________________________(招標(biāo)編號: _________)的招標(biāo)文件,遵照 《中華人民共和國招標(biāo)投標(biāo)法》等有關(guān)規(guī)定,在研究招標(biāo)文件及有關(guān)文件后,我方法定 代表人(或正式授權(quán)的下述簽字人) (姓名和職務(wù)) 代表投標(biāo)人 (投標(biāo)人的名 稱) ,提交投標(biāo)文件正本壹份,副本 份。 (1)按招標(biāo)文件規(guī)定提供交付貨物及服務(wù)的投標(biāo)報價為: 大寫: ____________________
統(tǒng)計的重要工作之一就是對資料進(jìn)行統(tǒng)計描述。對偏態(tài)分布的統(tǒng)計資料進(jìn)行集中趨勢統(tǒng)計描述的常用指標(biāo)是()。
A、算術(shù)平均數(shù)
B、幾何平均數(shù)
C、中位數(shù)
D、加權(quán)平均數(shù)
【正確答案】C
【答案解析】本題考查的是統(tǒng)計描述與統(tǒng)計推斷。集中趨勢的描述指標(biāo)有3個:算術(shù)平均數(shù)、幾何平均數(shù)和百分位數(shù)。中位數(shù)是一個特定的百分位數(shù)即P50,用M表示。把一組觀察值按從小到大的次序排列,位置居于最中央的那個數(shù)就是中位數(shù)。實踐中常用于偏態(tài)分布資料和分布兩端無確定值的資料。參見教材P223。
下列統(tǒng)計描述的分析方法中,屬于計數(shù)資料類分析方法的是()。
A、相對比
B、百分位數(shù)
C、標(biāo)準(zhǔn)差
D、算術(shù)平均數(shù)
【正確答案】A
【答案解析】本題考查的是統(tǒng)計描述與統(tǒng)計推斷。計數(shù)資料類分析通常采用比(相對比)、構(gòu)成比、率。參見教材P224。
某地區(qū)開展了職工職業(yè)病統(tǒng)計和調(diào)查,取得大量數(shù)據(jù)。對這些數(shù)據(jù)進(jìn)行統(tǒng)計分析時,統(tǒng)計的主要工作應(yīng)包括()兩項內(nèi)容。
A、統(tǒng)計描述和統(tǒng)計推斷
B、統(tǒng)計抽樣和統(tǒng)計分析
C、統(tǒng)計抽樣和統(tǒng)計推斷
D、統(tǒng)計抽樣和參數(shù)估計
【正確答案】A
【答案解析】本題考查的是統(tǒng)計描述和統(tǒng)計推斷。職工職業(yè)病統(tǒng)計和調(diào)查應(yīng)包括統(tǒng)計描述和統(tǒng)計推斷兩項內(nèi)容。參見教材P222。