




已閱讀5頁,還剩49頁未讀, 繼續(xù)免費閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
第三部分數(shù)據(jù)管理 SPSS的主菜單Edit和Data能夠建立數(shù)據(jù)文件 進行數(shù)據(jù)編輯 具有很強的數(shù)據(jù)管理功能 主要包括 定義變量屬性 DefineVariableProperties 插入變量 InsertVariable 插入個案 InsertCase 個案排序 SortCases 合并數(shù)據(jù)文件 MergeFiles 拆分數(shù)據(jù)文件 SpliteFiles 匯總數(shù)據(jù) AggregateData 識別重復個案 IdentifyDuplicateCases 及加權(quán)個案 WeightCases 等 1 數(shù)據(jù)管理分為四部分 一 變量管理二 個案管理三 數(shù)據(jù)文件管理四 變量的變換和計算 2 一 變量管理 1 插入變量或刪除變量 建立數(shù)據(jù)集后 可在DataView或VaribleView中插入新變量 具體方法如下 方法1 在DataView中插入新變量將光標移至想要插入的位置單擊右鍵或Data菜單InsertVariable 即可在當前光標所在的變量前插入一個 VAR00001 的新變量 雙擊該變量名 即可自動切換到VaribleView中 可以對該變量名進行編輯 并且定義其屬性 3 方法2 在VaribleViewer下 將光標移至想要插入的位置單擊右鍵或Data菜單InsertVariable 即可在當前光標所在的變量前插入一個 VAR00001 的新變量 可以對該變量名進行編輯 并且定義其屬性 注意 插入或刪除個案類似 例3 1調(diào)入數(shù)據(jù)文件02 1 sav 2 定義變量屬性 DefineVariableProperties 定義變量屬性 DefineVariableProperties 可為用戶在建立變量 定性變量 定序變量 定距變量 的描述性變量標識過程中提供幫助 例3 2調(diào)入數(shù)據(jù)文件02 1 savData DefineVariableProperties 4 選中表示Unlabled 5 二 個案管理 1 插入個案 InsertCase 2 個案定位 GoToCase 3 個案排序 SortCase 4 識別重復個案 IdentifyDuplicateCases 5 選擇個案 SelectCase 6 個案加權(quán) WeightCases 6 1 插入個案 InsertCase 或刪除個案 例3 3在數(shù)據(jù)文件02 1 sav的第10個個案前插入一個名為 王蒙 1975年2月28日出生 體檢正常 的個案 將第5個個案刪除 操作 將光標移到第10個個案 選擇Edit InsertCase 即在第10個個案前插入一空行 也可右鍵快捷菜單操作 2 個案定位 GoToCase 使用GoToCase功能 可以方便 快捷的在大量數(shù)據(jù)中查找到指定的個案 以便對其進行編輯修改或在其前插入新個案 7 例3 4在數(shù)據(jù)文件cesd sav中 把第268個案的性別由 女 改為 男 選擇Edit GoToCase 在CaseNumber框中輸入268 OK 3 個案排序 SortCase SortCase能將數(shù)據(jù)文件中的數(shù)據(jù) 或字符 進行排序 排序的方法可以依據(jù)變量作為排序關鍵詞 遞增或遞減排序 大小順序或字典順序 操作如下 用鼠標選擇 DataSortCases 會彈出以下對話框 圖2 12 選中 考試成績 單擊中間的黑三角 把這個變量移至右面的矩形框中 這個過程也可以通過雙擊 考試成績 完成 再選擇排序方式 升序或降序 點擊 OK 就可以了 8 例3 5數(shù)據(jù)文件hong1 sav 試對體重從小到大排序 注意 排序變量可以為多個 具體步驟如下 1 選擇var1作為第一排序變量 2 按照var1降或升如選降排列 3 選擇var2作為第二排序變量 4 按照var1降或升如選升排列 5 單擊OK 新數(shù)據(jù)覆蓋原數(shù)據(jù) 9 4 識別重復個案 IdentifyDuplicateCases 用戶在進行大樣本量的調(diào)研工作中 可能重復訪問某個被訪對象或重復錄入某份試卷 造成數(shù)據(jù)文件中包含重復個案 引起偏倚 利用識別重復個案 IdentifyDuplicateCases 用戶可以對重復個案進行查找 并且進行剔除 操作 Data IdentifyDuplicateCases出現(xiàn)以下對話框 10 1 定義個案配對變量2 配對組中的排序變量 用戶可選擇1或多個變量作為排序依據(jù) 順序可選升或降 3 新建變量 原始個案指示器 1表示原始個案0表示匹配個案每組最后一個個案為原始個案每組第一個個案為原始個案根據(jù)個案指示器的數(shù)值進行過濾 自動劃出重復個案 11 4 對每組的匹配個案進行連續(xù)計數(shù) 創(chuàng)建一個順序號為0 n的數(shù)值變量 其中0表示不匹配 5 將匹配個案移至文件的最上方6 顯示新建變量的頻數(shù)表 例3 5在數(shù)據(jù)文件Identify sav中查找 id 重復的個案 并且進行剔除 12 5 選擇個案 SelectCase 在SPSS中 用戶可按一定準則選擇個案 然后進行統(tǒng)計分析 Analyze 或作圖 Graphs 可以通過定義變量值或范圍 日期 數(shù)學表達式 邏輯表達式或函數(shù)設定選擇個案的準則 例3 6 對數(shù)據(jù)文件hong1 sav 用3種準則選擇滿足指定條件的部分個案并且進行頻數(shù)分析 準則一 對數(shù)據(jù)文件hong1 sav中滿足條件2 01 x6 3 00的體重 x6 的嬰兒 對血紅蛋白x5進行頻數(shù)分析 操作 Data SelectCaseIfconditionissatisfied輸入2 01 x6andx6 3 00Output中選擇filteroutunselectedcases注意 生成一個新變量filter 滿足條件的個案一 1 表示 未選中的個案的序號用斜劃線化掉 13 準則二 在數(shù)據(jù)文件hong1 sav中 隨機抽取30 的個案 對血紅蛋白x5進行頻數(shù)分析 在進行頻數(shù)分析時 var為filter 沒有也可 和x5 操作 Data SelectCase Randomsampleofcases后出現(xiàn)以下對話框 在所在個案中近似比例抽樣 在前 個個案前精確抽取 個個案 注意 生成一個新變量filter 滿足條件的個案一 1 表示 在進行頻數(shù)分析時 var為filter 和x5 14 準則三 在數(shù)據(jù)文件hong1 sav中 選取第10 33例的嬰兒 對血紅蛋白x5進行頻數(shù)分析 操作 Data SelectCase Basedontimeorcaserange Observation 注意 不生成一個新變量 在進行頻數(shù)分析時 var為x5 對滿足條件的個案進行分析 15 6 個案加權(quán) WeightCases 個案加權(quán) WeightCases 可在統(tǒng)計分析中對個案給予不同的權(quán)重 權(quán)重變量中的數(shù)值表示數(shù)據(jù)文件中單個個案的觀察值 注意 當加權(quán)變量值為0 負值或缺失值的個案不參與分析 例3 7某地144名正常男子的紅細胞數(shù) 1012 L 的整理數(shù)據(jù)見下表 試進行頻數(shù)分布分析 16 建立數(shù)據(jù)文件weight sav 變量名為x 紅細胞數(shù) f 人數(shù) 2 對變量f進行加權(quán) 選擇Data Weightcases 完成個案加權(quán) 3 對變量x進行頻數(shù)分布分析 畫相應的直方圖 17 三 數(shù)據(jù)文件管理 1 數(shù)據(jù)的合并 統(tǒng)計分析的首要任務是將數(shù)據(jù)輸入到計算機中 在數(shù)據(jù)量較大時 經(jīng)常需要將一份大的數(shù)據(jù)文件分成幾個小部分 分別由幾個人輸入 然后將若干個小的數(shù)據(jù)文件合并成一個大的數(shù)據(jù)文件 數(shù)據(jù)文件的合并有兩種方式 縱向合并和橫向合并 縱向合并就是將一個SPSS數(shù)據(jù)文件的內(nèi)容追加到數(shù)據(jù)編輯窗口當前數(shù)據(jù)的后面 然后將合并后的數(shù)據(jù)重新顯示在數(shù)據(jù)編輯窗口中 通過該方法 可以將兩個或更多個數(shù)據(jù)文件合并在一起 1 縱向合并 18 縱向合并 操作 Date MergeFiles Addcases 例3 8將數(shù)據(jù)文件身高縱和 sav的個案追加到身高 sav中 1 打開數(shù)據(jù)文件身高 sav 2 Date MergeFiles Addcases出現(xiàn)如下對話框 3 利用AnexternalSPSSdatafile導入要追加的數(shù)據(jù)文件身高縱和 sav 4 匹配變量直接進入 對于未匹配變量 工作數(shù)據(jù)文件的變量用 標注 外部數(shù)據(jù)變量用 標注 可pair配對 19 注 選中Indicatecasesourceasvariable 合并后的數(shù)據(jù)文件會出現(xiàn)名為source01的變量 取值0和1 0代表個案來自工作數(shù)據(jù)文件 1代表個案來自外部數(shù)據(jù)文件 橫向合并 橫向連接 也就是變量值的合并 利用橫向合并可以將兩個或兩個以上的具有相同個案的數(shù)據(jù)文件連在一起 即將SPSS數(shù)據(jù)文件的內(nèi)容連接到當前數(shù)據(jù)編輯窗口的右邊 然后將合并后的數(shù)據(jù)文件顯示在數(shù)據(jù)編輯窗口中 橫向合并實質(zhì)是將兩個數(shù)據(jù)文件 按照個案對應進行左右對接 20 實現(xiàn)數(shù)據(jù)文件的橫向連接 必須有一個相同的公共變量 這個變量是兩個數(shù)據(jù)文件橫向?qū)B接的依據(jù) 同時將這一公共變量排序 注意 在合并的兩個數(shù)據(jù)文件中 數(shù)據(jù)含義不同的變量 變量名不應取相同的名稱 例3 9 將數(shù)據(jù)文件身高橫合和 sav的個案追加到身高 sav中 1 打開數(shù)據(jù)文件身高 sav 2 Date MergeFiles Addvariables出現(xiàn)如下對話框 3 利用AnexternalSPSSdatafile導入要追加的數(shù)據(jù)文件身高橫和 sav 4 匹配變量直接進入 工作數(shù)據(jù)文件的變量用 標注 外部數(shù)據(jù)變量用 標注 21 注 選中Indicatecasesourceasvariable 合并后的數(shù)據(jù)文件會出現(xiàn)名為source01的變量 取值0和1 0代表個案來自工作數(shù)據(jù)文件 1代表個案來自外部數(shù)據(jù)文件 22 數(shù)據(jù)文件的分組 split 數(shù)據(jù)文件的拆分是指將數(shù)據(jù)按某個或某幾個變量分成一些供統(tǒng)計分析的分組 在統(tǒng)計中 經(jīng)常需要先按某個變量進行分組 然后再求各個組的統(tǒng)計分析 例如 想分別了解男生和女生的成績情況 這時就需要按照性別變量 進行數(shù)據(jù)文件的分組 這種分組是系統(tǒng)內(nèi)定義的 在數(shù)據(jù)管理器中并不一定明確體現(xiàn) 故亦可稱之為分割 注意 用戶一旦設置了分組 那么此后的所有分析都將按這種分組進行 除非取消數(shù)據(jù)分組的命令 例3 10 將數(shù)據(jù)文件child sav按性別 年齡進行拆分 并對體重與身高進行描述性分析 1 打開數(shù)據(jù)文件child sav 2 Date SplitFile出現(xiàn)如下對話框 23 1 分析所有個案 不建立分組2 分組比較 各分組的結(jié)果放在一起進行比較 對于表格或圖表 每個分組變量所產(chǎn)生的表將放在一起顯示 3 分組安排輸出結(jié)果 所有程序產(chǎn)生的分組結(jié)果將獨立顯示 4 分組依據(jù) 本例使用性別 年齡 可多選 5 按分組變量排序6 文件已排序 24 數(shù)據(jù)的行列轉(zhuǎn)置 Transpose 行列轉(zhuǎn)置可將數(shù)據(jù)文件中的個案 行 轉(zhuǎn)換成變量 列 變量 列 轉(zhuǎn)換成個案 行 行列轉(zhuǎn)置可對新變量自動命名 并顯示新變量名列表 使用行列轉(zhuǎn)置可以自動產(chǎn)生一個包含原始變量名的字符串變量case 1b1 以便用戶了解各個個案對應的原變量名 注意 如果數(shù)據(jù)文件中含有變量值是唯一的變量 可利用其作為名稱變量Namevariable 該變量的值將用于生成轉(zhuǎn)置后數(shù)據(jù)文件的變量名 例3 11 對數(shù)據(jù)文件body1 sav進行行列轉(zhuǎn)置 1 打開數(shù)據(jù)文件body1 sav 2 Date Transpose出現(xiàn)如下對話框 25 也可以用此方法將數(shù)據(jù)再轉(zhuǎn)換回原來的排列方式 注意 行列轉(zhuǎn)置前 若對工作數(shù)據(jù)進行修改 請先保存數(shù)據(jù)文件 否則修改的信息會丟失 26 2020 1 15 27 數(shù)據(jù)分類匯總 AggregateData 用戶還可對數(shù)據(jù)編輯器中的數(shù)據(jù)按指定變量的數(shù)值進行歸類分組匯總 在SPSS中 實現(xiàn)數(shù)據(jù)文件的分類匯總需要3個步驟 首先 需要指定分類變量和匯總變量 然后 計算機根據(jù)分類變量的若干個不同取值將個案數(shù)據(jù)分成若干類 并對每類個案計算匯總變量的描述統(tǒng)計量 最后 將分類匯總計算結(jié)果保存到一個文件中 例3 12 對數(shù)據(jù)文件child sav按性別 年齡進行匯總數(shù)據(jù) 計算各組個案體重 身高 坐高 胸圍及頭圍的平均數(shù) 1 打開數(shù)據(jù)文件child sav 2 Date AggregateData出現(xiàn)如下對話框 28 1 分組變量列表 選一個或多個數(shù)值型或字符型變量作為分組變量 2 匯總變量列表 顯示在匯總文件中用匯總函數(shù)產(chǎn)生的新變量的名稱及表達式 匯總的原變量必須是數(shù)值型 分組匯總提供的函數(shù)形式主要有以下幾種 Mean 求該組的平均值Median 求該組所有觀察值的中值Sum 求該組所有觀察值的和Standarddeviation 求該組的標準差First 只保持該組的第一個數(shù)值Last 只保持該組的最后一個數(shù)值等等 29 常見匯總函數(shù) 30 31 Name lable選項可逐一為匯總變量定義變量名和標簽 Numberofcases選項會在新文件中創(chuàng)建一個變量用來計數(shù)每一組觀測值的數(shù)目 系統(tǒng)默認文件名為N BREAK 3 Save單選框 32 對于缺失值 可采取多種手段進行科學替代 這里的缺失值必須是系統(tǒng)或用戶指定的缺失值 缺失值的代替 例3 13 替代數(shù)據(jù)文件收入 sav中的缺失值 1 打開數(shù)據(jù)文件收入 sav 2 Transform ReplaceMissingValues出現(xiàn)如下對話框 33 3 在變量名列中選擇一個或多的存在缺失值的變量 使之添加到newvariables 這是系統(tǒng)自動產(chǎn)生用于替代缺失值的新變量 也可在name框處自己定義替代缺失值的新變量 Method共有以下幾種替代方式 Seriesmean Meanofnearbypoints Medianofnearbypoints Linearinterpolation 用缺失值相鄰兩點的中點值做替代 Lineartrendatpoint 用線性擬合方式確定替代值 注意變量在選中狀態(tài)時nameandmethod可用 4 確定替代方式 change ok 34 四 變量的變換和計算通過計算建立新變量 ComputeVariable 經(jīng)過調(diào)查研究所得到的原始數(shù)據(jù)非常重要 很多時候?qū)υ紨?shù)據(jù)可以進行重新計算 如 從年收入中可以計算出一個新變量 月收入 等 從而生成新的變量 例3 14 現(xiàn)有某班的5門功課期末考試成績 為了進一步的分析 需要先對數(shù)據(jù)進行整理 要求算出5門功課的總分 平均分 加權(quán)總分 語文 數(shù)學的權(quán)重為1 2 物理 化學的權(quán)重為1 生物的權(quán)重為0 7 35 1 打開數(shù)據(jù)文件test sav2 選擇 Transform 菜單的 ComputeVariable 項 彈出如圖所示的 ComputeVariable 計算變量 對話框 3 在該對話框中的 TargetVariable 目標變量 框中輸入符合變量命名規(guī)則的變量名 4 在數(shù)值表達式框中輸入表達式如圖示 5 打開標簽輸入變量標簽 ok 注意 函數(shù)的使用 36 例3 14 建立新變量 使得語文成績 80的為一組 60 語文成績 80的為一組 低于60的是一組 1 打開數(shù)據(jù)文件test sav2 選擇 Transform 菜單的 ComputeVariable 項 彈出如圖所示的 ComputeVariable 計算變量 對話框 3 在該對話框中的 TargetVariable 框中輸入變量名group 4 在數(shù)值表達式框中輸入 1 如圖示 5 打開標簽輸入變量標簽 語文分組 6 打開if 37 如圖操作 continue ok重復這一過程 對目標變量grounp分別定義60 語文成績 80的為一組 低于60的是一組的情況 38 產(chǎn)生計數(shù)變量 count Count過程用于標識某個值或某些值在某個變量的取值中是否出現(xiàn) 在統(tǒng)計分析中 有一項特定變量值計算功能 它可以計數(shù)在一個觀測值中滿足特定要求的那些變量值出現(xiàn)的次數(shù) 并將結(jié)果記錄在一個新變量中 例3 15 統(tǒng)計一下數(shù)據(jù)文件test 1 sav中每個個案語文 數(shù)學 物理 化學4門課成績有幾門80分以上 1 打開數(shù)據(jù)文件test 1 sav2 選擇Transform CountValuewithinCases彈出如下對話框 39 打開DefineValues對話框Continue ok 40 例 在某次調(diào)查中 有10個問題供調(diào)查者回答 回答正確為1 錯誤為0 請計算每個調(diào)查對象回答正確的題目數(shù) 數(shù)據(jù)文件為count sav 1 打開數(shù)據(jù)文件為count sav 2 選擇Transform CountValuewithinCases3 目標變量定義為 正確題數(shù) 4 數(shù)值變量列表 q1 q2 q105 definevalues value 1 add6 continues ok 41 變量重新賦值 變量重新賦值功能是指將數(shù)據(jù)文件中的原變量按照某種一一對應的關系生成新變量值 可以用這個新變量值替代原變量值 也可以生成一個新變量的過程 這種操作只適用于數(shù)值型變量 在 Transform 菜單中的有 RecodeIntoSameVariables 和 RecodeIntoDifferentVariables 兩種賦值方法供選擇 選擇命令 RecodeIntoSameVariables 時 系統(tǒng)將產(chǎn)生新變量值直接替代原變量值 執(zhí)行 RecodeIntoDifferentVariables 命令 系統(tǒng)將為產(chǎn)生的新變量值賦給一個新變量 例 要求在 Employeedata sav 文件中 將原變量educ中的值教育的年數(shù)重新賦值為新變量edulever 教育的等級 系統(tǒng)缺失值仍為缺失值 教育年數(shù)為8的轉(zhuǎn)化為第1等級 教育年數(shù)為12 15之間的轉(zhuǎn)化為第2等級 教育年數(shù)為16 19的轉(zhuǎn)化為第3等級 教育年數(shù)為19年以上的轉(zhuǎn)化為第4等級 42 具體操作如下 InputVariable OutputVariable 框 educOutputVariable Name eduleverLable 教育的等級單擊change按鈕單擊oldandnewvalues按鈕OldnewSysmis sysmis8 112thru15 216thru18 319thruhighest 4單擊continue按鈕 ok 43 44 注意 在上述兩種賦值情況下 用戶均可通過單擊 If 按鈕指定條件 來確定參與重新賦值的個案 與前面根據(jù)已存在的變量建立新變量方法不同的是 變量的重新賦值Recode不能進行運算 只能根據(jù)指定變量值作數(shù)值轉(zhuǎn)換 且這種轉(zhuǎn)換是單一數(shù)值的轉(zhuǎn)換 變量的自動賦值 AutomaticRecode 變量的自動賦值可以將字符型 數(shù)字型數(shù)值轉(zhuǎn)變成連續(xù)的整數(shù) 并將結(jié)果保存在一個新的變量中 其中字符型數(shù)據(jù)按照字母的順序排序 在SPSS中的的許多模塊中 分類編碼不連續(xù)會產(chǎn)生空白的統(tǒng)計格子 從而導致效能降低 增加內(nèi)存的需要 如 gender用二分類變量 用f表示女 用m表示男 這是字符型數(shù)據(jù) 當轉(zhuǎn)成1女2男時化為連續(xù)的數(shù)值型 例 將字符型變量 gender 自動重新賦值為數(shù)值型變量 新變量名 sex 45 具體操作步驟如下 1 打開數(shù)據(jù)文件Employeedata sav2 Transform AutomaticRecode3 varible newvarible gender4 newname sex單擊 addnewname 5 recodestartingfrom lowestvalue 從最小值開始 ok 46 注 由自動重新編碼產(chǎn)生的變量將保留變量的定義及值標識 對于無值標識的值 則將原值作為重新編碼值的標識 并產(chǎn)生一個新舊值及值標識的對應表 47 變量定義信息的查詢 在SPSS數(shù)據(jù)編輯窗口中的 VariableView 標簽中可以看到變量的定義信息 在其中還可以進行修改 在SPSS的 Utilities 菜單下的Varible命令中還提供了變量信息的查詢功能 在對話框左邊的變量列表中選擇某個變量 右邊的 variableinformation 框中就會顯示該變量的數(shù)據(jù)類型 變量標簽 缺失值規(guī)定 變量值標簽等信息 單擊 goto 按
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 不銹鋼欄桿安裝與社區(qū)安全防范系統(tǒng)合同
- 施工現(xiàn)場清理服務合同5篇
- 美術的英語課件
- 安全生產(chǎn)目標指什么
- 冬季安全心得體會300字
- 小學安全副校長述職報告
- 鋼鐵公司安全培訓心得體會
- 安全環(huán)保知識學習
- 四川省安全生產(chǎn)管理
- 醫(yī)院消防安全巡查記錄表范本
- 健康評估(第3版)課件6-2 泌尿系統(tǒng)常見癥狀評估
- 水資源論證管理制度
- 麻醉中的人文關懷
- 餐廚廢棄食用油脂管理制度
- 2025年云南省時事政治考試試卷帶解析附完整答案(考點梳理)
- 貴州省黔東南州2024-2025學年高二下冊期末教學質(zhì)量檢測數(shù)學試卷(附答案)
- 武漢大學2020年強基計劃物理試題(解析版)
- 2024年海原縣社區(qū)專職工作者招聘考試真題
- 人工智能在畜牧業(yè)中的應用研究-洞察闡釋
- 2025屆浙江省杭州濱江區(qū)六校聯(lián)考七年級英語第二學期期末質(zhì)量跟蹤監(jiān)視模擬試題含答案
- T/CACEM 39-2024交通企業(yè)標準化評價指南
評論
0/150
提交評論