數(shù)據(jù)挖掘本質(zhì)上作為一類數(shù)據(jù)分析方法,和統(tǒng)計(jì)學(xué)有著共同的目標(biāo):發(fā)現(xiàn)數(shù)據(jù)中的結(jié)構(gòu)川。因而,基于數(shù)據(jù)挖掘的視角,對抽樣調(diào)查數(shù)據(jù)采用一些數(shù)據(jù)挖掘的方法進(jìn)行分析,是可行的。然而,將數(shù)據(jù)挖掘方法應(yīng)用于抽樣調(diào)查數(shù)據(jù),有一個問題通常無法回避,那就是樣本數(shù)據(jù)所對應(yīng)的權(quán)數(shù)如何處理。
一般而言,數(shù)據(jù)挖掘問題常常針對總體數(shù)據(jù),例如關(guān)于一個公司的所有職工數(shù)據(jù),銀行信用卡中心數(shù)據(jù)庫的所有客戶數(shù)據(jù),一家大型超市一個季度以來的所有顧客購買記錄等。在這種情形下,每一條記錄都是總體數(shù)據(jù)中的一個單元,得到的觀察值可以直接計(jì)算總體參數(shù),無需進(jìn)行統(tǒng)計(jì)推斷。
但數(shù)據(jù)挖掘方法也越來越多地應(yīng)用于抽樣調(diào)查數(shù)據(jù)。與總體數(shù)據(jù)不同的是,抽樣調(diào)查當(dāng)中,每個樣本單元的觀測值都是有權(quán)數(shù)的,權(quán)數(shù)表示的是每個樣本單元代表了總體中一定數(shù)目的單元,所以整個樣本就“代表”了整個總體。樣本單元的權(quán)數(shù)取決于抽樣設(shè)計(jì)。
因此,謝佳斌等提出采用放回的、與樣本單元權(quán)數(shù)大小成比例的再抽樣方法,簡稱PewwR再抽樣,來實(shí)現(xiàn)“事后‘自加權(quán)設(shè)計(jì)。實(shí)現(xiàn)“事后”自加權(quán)設(shè)計(jì)后的子樣本可忽略掉樣本權(quán)數(shù),直接采用常規(guī)的圖示方法和數(shù)據(jù)挖掘算法進(jìn)行分析。隨后,基于2007中國公民科學(xué)家質(zhì)調(diào)查貴州省數(shù)據(jù),通過模擬分析討論了PPWWR再抽樣子樣本的樣本且問題,發(fā)現(xiàn)max( n,5% N)(n為樣本大小,N為總體單元的個數(shù))是一個比較合適的樣本量。這一結(jié)論可能為其他大型復(fù)雜抽樣調(diào)查數(shù)據(jù)的數(shù)據(jù)挖掘?qū)嵤﹩栴}提供借鑒。
在分層抽樣中,采用分層比例抽樣可以提高樣本的代表性,及對總體數(shù)量指標(biāo)的估計(jì)值的確定,避免出現(xiàn)簡單隨機(jī)抽樣中的集中于某些特性或遺漏掉某些特性。
它是根據(jù)某些特定的特征,將總體分為同質(zhì)、不相互重疊的若干層,再從各層中獨(dú)立抽取樣本,是一種不等概率抽樣。分層抽樣利用輔助信息分層,各層內(nèi)應(yīng)該同質(zhì),各層間差異盡可能大。這樣的分層抽樣能夠提高樣本的代表性、總體估計(jì)值的精度和抽樣方案的效率,抽樣的操作、管理比較方便。但是抽樣框較復(fù)雜,費(fèi)用較高,誤差分析也較為復(fù)雜。此法適用于母體復(fù)雜、個體之間差異較大、數(shù)量較多的情況。
比例抽樣是指不考慮試樣變異性的大小,都按統(tǒng)一的比例進(jìn)行抽樣。
首先,你應(yīng)該明確:抽樣檢測法和樣方法都是種群密度的調(diào)查方法。它們之間的不同在于:調(diào)查對象的不同,調(diào)查方法也不同。調(diào)查植物和活動能力弱的動物的種群密度時要用樣方法;微生物要用抽樣檢測法。而活動能力強(qiáng)的動...
先要把圖紙看明白。先從建筑圖紙看,平面圖、立面圖、剖面圖,然后在看結(jié)構(gòu)圖,根據(jù)結(jié)構(gòu)圖,在鋼筋算量軟件計(jì)算鋼筋。
抽樣又稱取樣。從欲研究的全部樣品中抽取一部分樣品單位。其基本要求是要保證所抽取的樣品單位對全部樣品具有充分的代表性。抽樣的目的是從被抽取樣品單位的分析、研究結(jié)果來估計(jì)和推斷全部樣品特性,是科學(xué)實(shí)驗(yàn)、質(zhì)量檢驗(yàn)、社會調(diào)查普遍采用的一種經(jīng)濟(jì)有效的工作和研究方法。
一般抽樣的過程如下:
1、界定總體
界定總體就是在具體抽樣前,首先對從總抽取樣本的總體范圍與界限作明確的界定。
2、制定抽樣框
這一步驟的任務(wù)就是依據(jù)已經(jīng)明確界定的總體范圍,收集總體中全部抽樣單位的名單,并通過對名單進(jìn)行統(tǒng)一編號來建立起供抽樣使用的抽樣框。
3、決定抽樣方案
4、實(shí)際抽取樣本
實(shí)際抽取樣本的工作就是在上述幾個步驟的基礎(chǔ)上,嚴(yán)格按照所選定的抽樣方案,從抽樣框中選取一個個抽樣樣單位,構(gòu)成樣本。
5、評估樣本質(zhì)量
所謂樣本評估,就是對樣本的質(zhì)量、代表性、偏差等等進(jìn)行初步的檢驗(yàn)和衡量,其目的是防止由于樣本的偏差過大而導(dǎo)致的失誤。
格式:pdf
大?。?span id="ct56pry" class="single-tag-height">51KB
頁數(shù): 2頁
評分: 4.4
筑神-建筑資料下載:http://www.zhushen.com.cn 通用圖集,規(guī)范,工程表格,施工組織設(shè)計(jì),CAD 圖塊,工程論文,建筑模型等全部免費(fèi)下載 釉面磚抽樣方案及抽樣方法 本標(biāo)準(zhǔn)適用于釉面磚的產(chǎn)品質(zhì)量檢驗(yàn)。 1 符號和代號 N:檢查批大小、批量; n:樣本大??; c:合格判定數(shù); p:批不合格品率 p0:合格批中允許出現(xiàn)不合格品率的上限,即 p≤p0 為合格批; p1:不合格批中規(guī)定的不合格品率的下限,即 p≥p0 為不合格批; D:批中不合格品總數(shù); W:每箱產(chǎn)品的檢查單位數(shù); n:各檢查項(xiàng)目所需的試樣總和。 2 抽樣檢驗(yàn)程序 2.1 確定質(zhì)量標(biāo)準(zhǔn) 規(guī)定檢查單位是合格品與不合格品的標(biāo)準(zhǔn)。 2.2 確定批量大小 以同一條件下生產(chǎn)的產(chǎn)品為一批。如果批量過大,也可分成若干小批。 2.3 確定檢查項(xiàng)目 確定應(yīng)
格式:pdf
大?。?span id="j3y1caa" class="single-tag-height">51KB
頁數(shù): 5頁
評分: 4.5
1 / 5 第八講 幾種抽樣方法 (1)隨機(jī)抽樣 新知 1:簡單隨機(jī)抽樣的概念 一般地,設(shè)一個總體含有 N個個體,從中逐個不放回地抽取 n 個個體作為樣本 (n≤N), 如果每次抽取時總體內(nèi)的各個個體被抽到的機(jī)會都相等,就把這種抽樣方法叫做簡 單隨機(jī)抽樣,這樣抽取的樣本,叫做簡單隨機(jī)樣本。 【說明】 簡單隨機(jī)抽樣必須具備下列特點(diǎn): (1) 簡單隨機(jī)抽樣要求被抽取的樣本的總體個數(shù) N是有限的。 (2) 簡單隨機(jī)樣本數(shù) n小于等于樣本總體的個數(shù) N。 (3) 簡單隨機(jī)樣本是從總體中逐個抽取的。 (4) 簡單隨機(jī)抽樣是一種不放回的抽樣。 (5) 簡單隨機(jī)抽樣的每個個體入樣的可能性均為 n/N。 新知 2:抽簽法和隨機(jī)數(shù)法 抽簽法的定義 : 一般地,抽簽法就是把總體中的 N個個體編號,把號碼寫在號簽上, 將號簽放在一個容器中,攪拌均勻后,每次從中抽取一個號簽,連續(xù)抽取 n 次,就 得到一個容量為
1.驗(yàn)收抽樣檢查
驗(yàn)收檢查是指需方(即第二方)對供方(即第一方)提供的檢查批進(jìn)行抽樣檢查,以判定該批是否符合規(guī)定的要求,并決定對該批是接收還是拒收。驗(yàn)收檢查也可以委托獨(dú)立于供需雙方的第三方進(jìn)行。
2.監(jiān)督抽樣檢查
監(jiān)督抽樣檢查類似于驗(yàn)收檢查對孤立批的抽樣,但由于質(zhì)檢機(jī)構(gòu)能力的限制,往往不可能采用計(jì)數(shù)標(biāo)準(zhǔn)型那樣的大樣本,而只能采用小樣本抽樣的方法。鑒于對檢查不合格的企業(yè)可能采取較嚴(yán)厲的處罰措施。因此,對受監(jiān)督方的保護(hù)必要時予以優(yōu)先考慮,即把供方風(fēng)險(xiǎn)控制為較小的數(shù)值,在此前提下只能放松對需方風(fēng)險(xiǎn)的控制。
01
抽樣調(diào)查概述
本章對抽樣技術(shù)的涵義、作用、產(chǎn)生歷史和實(shí)際應(yīng)用等作簡要介紹,為以后各章的學(xué)習(xí)奠定基礎(chǔ)。具體要求:①正確理解抽樣技術(shù)的科學(xué)涵義、基本分類和特點(diǎn),對抽樣調(diào)查的基本程序和作用有初步的認(rèn)識;②對抽樣技術(shù)產(chǎn)生與發(fā)展的歷史有一般的了解;③對抽樣技術(shù)的實(shí)際應(yīng)用有大致的認(rèn)識。
課時
1.1 什么是抽樣調(diào)查
1.2 抽樣技術(shù)的產(chǎn)生與發(fā)展
1.3 抽樣技術(shù)的應(yīng)用
02
抽樣調(diào)查基本概念
本章對抽樣技術(shù)的基本概念進(jìn)行闡述和介紹,為以后各章的學(xué)習(xí)奠定理論與方法基礎(chǔ)。具體要求:①掌握總體、單位、抽樣框、樣本等概念,理解它們之間的內(nèi)在關(guān)系,熟知常用的總體指標(biāo)和樣本指標(biāo);②系統(tǒng)了解估計(jì)量、抽樣分布、抽樣誤差、估計(jì)精度、置信區(qū)間等概念的內(nèi)涵和作用,能夠運(yùn)用它們進(jìn)行實(shí)際的抽樣估計(jì);③基本掌握和理解樣本設(shè)計(jì)的內(nèi)容、原則和效果衡量指標(biāo)。
課時
2.1 總體與樣本
2.2 估計(jì)量與抽樣分布
2.3 抽樣誤差與置信區(qū)間
2.4 樣本設(shè)計(jì)
03
簡單隨機(jī)抽樣
簡單隨機(jī)抽樣是抽樣中最基本、最成熟、也是最簡單的抽樣設(shè)計(jì)方式,是所有概率抽樣方法發(fā)展、比較的基礎(chǔ)。因此,掌握本章的內(nèi)容對于學(xué)好其他各章將起到基礎(chǔ)性的作用。具體要求:①通過學(xué)習(xí)熟練掌握簡單隨機(jī)抽樣的抽樣方式和樣本抽選方法;②熟知總體均值、總體總值和總體比例的簡單估計(jì);③掌握樣本量的確定;④了解子總體的估計(jì)。
課時
3.1 抽樣方式
3.2 總體均值與總體總值的簡單估計(jì)
3.3 總體比例的簡單估計(jì)
3.4 樣本量的確定
3.5 子總體估計(jì)
04
分層抽樣
本章主要對分層抽樣的方式、估計(jì)量及其性質(zhì)、樣本量的確定及分配、設(shè)計(jì)效果等進(jìn)行系統(tǒng)介紹。具體要求:①正確理解層與分層抽樣的涵義、特點(diǎn)及作用;②掌握分層抽樣的估計(jì)量及其性質(zhì);③掌握分層抽樣樣本量的確定方法;④了解分層抽樣的設(shè)計(jì)效果;⑤了解分層抽樣其他有關(guān)理論問題,包括層權(quán)偏差、最優(yōu)分配偏差、事后分層等。
課時
4.1 抽樣方式
4.2 簡單估計(jì)量及其性質(zhì)
4.3 樣本量的分配
4.4 樣本量的確定
4.5 分層抽樣設(shè)計(jì)效果分析
4.6 進(jìn)一步討論的問題
05
比率估計(jì)與回歸估計(jì)
本章討論了簡單隨機(jī)抽樣和分層隨機(jī)抽樣下比率估計(jì)量和回歸估計(jì)量的構(gòu)造及性質(zhì)。具體要求:①掌握總體比率、比率估計(jì)量及回歸估計(jì)量的概念。②了解比率估計(jì)量、回歸估計(jì)量的偏差、方差及方差的估計(jì)量。③掌握應(yīng)用比率估計(jì)量及回歸估計(jì)量的條件。
課時
5.1 問題的提出
5.2 比率估計(jì)
5.3 回歸估計(jì)
5.4 分層比率估計(jì)與分層回歸估計(jì)
06
不等概率抽樣
前面各章介紹的抽樣方法都是等概率抽樣,本章則對不等概率抽樣方法進(jìn)行介紹,具體要求:①熟練掌握不等概率抽樣的概念和分類,了解不等概率抽樣的應(yīng)用意義;②了解放回與不放回不等概率抽樣的各種估計(jì)量構(gòu)造及其方差估計(jì);③能夠在實(shí)際抽樣中運(yùn)用不等概率方法,尤其是PPS等常用的方法。
課時
6.1 問題的提出
6.2 放回不等概率抽樣
6.3 不放回不等概率抽樣
07
整群抽樣
本章給出整群抽樣的定義,討論了群大小相等和群大小不等的整群抽樣方法及與之匹配的估計(jì)量、估計(jì)量的方差及方差的估計(jì)量。具體要求:①掌握群大小相等情形對群進(jìn)行簡單隨機(jī)抽樣簡單估計(jì)量的無偏性、方差及方差的無偏估計(jì),了解群內(nèi)方差、群間方差概念及其對整群抽樣精度的影響,掌握群的劃分原則。②掌握群大小不等情形與簡單隨機(jī)抽樣相匹配的簡單估計(jì)量、比率估計(jì)量及與 抽樣相匹配的漢森-赫維茨估計(jì)量及其性質(zhì)。③掌握估計(jì)總體比例的整群抽樣方法及簡單估計(jì)量、比率估計(jì)量。
課時
7.1 抽樣方式
7.2 群大小相等的整群抽樣
7.3 群大小不等的整群抽樣
7.4 估計(jì)總體比例的整群抽樣
08
系統(tǒng)抽樣
本章將對系統(tǒng)抽樣這種具有簡便易行、樣本分布均勻、估計(jì)效率較高等多方面優(yōu)點(diǎn)的抽樣組織方式進(jìn)行介紹,以便在實(shí)踐中靈活加以應(yīng)用。具體要求:①正確理解系統(tǒng)抽樣的基本思想和方式;②掌握系統(tǒng)抽樣的估計(jì)量及其性質(zhì);③熟知系統(tǒng)抽樣估計(jì)量方差的樣本估計(jì)方式;④對系統(tǒng)抽樣的相關(guān)問題有所了解。
課時
8.1 抽樣方式
8.2 等概率系統(tǒng)抽樣的估計(jì)量及其方差
8.3 估計(jì)量方差的樣本估計(jì)
8.4 進(jìn)一步探討的問題
09
多階段抽樣
本章介紹多階段抽樣的方式、優(yōu)點(diǎn)和初級單位大小相等或不等時的兩階段抽樣的估計(jì)量及其性質(zhì),并對相關(guān)一些問題進(jìn)行討論。具體要求:①正確理解多階段抽樣的科學(xué)涵義,對多階段抽樣的性質(zhì)及優(yōu)點(diǎn)有初步的認(rèn)識;②掌握初級單位大小相等時兩階段抽樣的估計(jì)量及其性質(zhì)和初級單位大小不等時兩階段抽樣的估計(jì)量及其性質(zhì);③了解有關(guān)多階段抽樣的其它相關(guān)問題。
課時
9.1 抽樣方式
9.2 初級單位大小相等的兩階段抽樣
9.3 初級單位大小不等的兩階段抽樣
9.4 進(jìn)一步討論的問題
10
其它抽樣方法技術(shù)
本章主要對樣本輪換、雙重抽樣、隨機(jī)化裝置、交叉子樣本等抽樣技術(shù)原理、方法、特點(diǎn)及應(yīng)用條件進(jìn)行了較為全面的介紹。具體要求:①掌握本章所介紹的幾種抽樣技術(shù)的特點(diǎn)及應(yīng)用條件;②在抽樣實(shí)際工作中能夠正確運(yùn)用該種技術(shù),提高估計(jì)的精度與效果。
課時
10.1 樣本輪換
10.2 雙重抽樣
10.3 隨機(jī)化裝置
10.4 交叉子樣本
11
非抽樣誤差
本章對非抽樣誤差的構(gòu)成和各種非抽樣誤差的影響進(jìn)行分析。具體要求:①正確理解非抽樣誤差的涵義、來源和特點(diǎn);②對抽樣框誤差、無回答誤差和計(jì)量誤差的成因及其對抽樣的影響有比較系統(tǒng)的理解;③掌握控制非抽樣誤差的基本思想。
課時
11.1 非抽樣誤差構(gòu)成
11.2 抽樣框誤差分析
11.3 無回答誤差分析
11.4 計(jì)量誤差分析
在驗(yàn)收方案中,適用于連續(xù)的生產(chǎn)情況的一種抽樣方案。其特點(diǎn)是接收或拒收基于某批逐個產(chǎn)品的檢查;以及交替使用100%的檢驗(yàn)和抽樣檢驗(yàn),100%檢驗(yàn)的相對數(shù)量取決于對交付產(chǎn)品質(zhì)量的把握性。連續(xù)抽樣方案通常所表示的特點(diǎn)是:要求100%檢驗(yàn)的每一期間要延續(xù)到連續(xù)檢查規(guī)定數(shù)量(i)個被檢單元沒有發(fā)現(xiàn)不合格品時為止。對一個水平的連續(xù)抽樣方案,抽樣時采用一個抽樣比例。對多水平連續(xù)抽樣方案,要采用兩個或多個抽樣比例。某一時期的抽樣比例取決于該時期交驗(yàn)產(chǎn)品質(zhì)量的可靠性。