spss數(shù)據(jù)的錄入與管理說課材料.ppt_第1頁
spss數(shù)據(jù)的錄入與管理說課材料.ppt_第2頁
spss數(shù)據(jù)的錄入與管理說課材料.ppt_第3頁
spss數(shù)據(jù)的錄入與管理說課材料.ppt_第4頁
spss數(shù)據(jù)的錄入與管理說課材料.ppt_第5頁
免費預(yù)覽已結(jié)束,剩余35頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

數(shù)據(jù)的錄入與管理 報告人 第二章數(shù)據(jù)錄入與數(shù)據(jù)獲取第三章變量級別的數(shù)據(jù)管理第四章文件級別的數(shù)據(jù)管理 第二章數(shù)據(jù)錄入與數(shù)據(jù)獲取 數(shù)據(jù)的直接錄入非電子化的原始數(shù)據(jù)資料 需要直接將調(diào)查問卷中的數(shù)據(jù)錄入進(jìn)SPSS軟件中 建立數(shù)據(jù)文件 外部數(shù)據(jù)的獲取已經(jīng)被錄入為其他數(shù)據(jù)格式的資料 需要將其內(nèi)容直接讀入SPSS中 2 2數(shù)據(jù)格式 原則 1 不同個案的數(shù)據(jù)不能再同一條記錄中出現(xiàn) 即同一個案的數(shù)據(jù)應(yīng)當(dāng)獨占一行 2 每一個測量指標(biāo) 影響因素只能占據(jù)一列的位置 即同一指標(biāo)的測量數(shù)值都應(yīng)當(dāng)錄入到同一個變量中去 數(shù)據(jù)錄入三部曲 1 定義各變量名 即給每個指標(biāo)起個名字 2 指定每個變量的各種屬性 即對每個指標(biāo)的一些統(tǒng)計特性做出指定 3 錄入數(shù)據(jù) 即把每個被訪者各指標(biāo)取值錄入為電子格式 變量屬性 1 變量的存儲類型數(shù)值型字符串日期型 1 數(shù)值型 Numeric 最常用是由0 9的阿拉伯?dāng)?shù)字和其他特殊符號 如美元符號 逗號或圓點組成的 工資 年齡 成績等 標(biāo)準(zhǔn)數(shù)值型逗號數(shù)值型 每3位用逗號分隔圓點數(shù)值型 每3位用圓點分隔科學(xué)計數(shù)型美元數(shù)值型 顯示時帶美元符號用戶自定義型 2 字符型 String 較常用默認(rèn)顯示寬度為8個字符位 區(qū)分大小寫字母 并且不能進(jìn)行數(shù)學(xué)運算 用一對引號引起來 3 日期型 Date 表示日期或時間mm dd yy或類似的兩位數(shù)年份記錄方式 2 變量的測量尺度定類尺度定序尺度定距尺度定比尺度 1 定類尺度是對事物的類別或?qū)傩缘囊环N測量 按照事物的某種屬性對其進(jìn)行分類或分組 其值僅代表了事物的類別和屬性 僅能測定類別差 不能比較各類之間的大小 所以各類之間沒有順序或等級 只能計算頻數(shù)和頻率 S0城市 2 定序尺度對事物之間等級或順序差類別的一種測度 可以比較優(yōu)劣或排序 但無法測出類別之間的準(zhǔn)確差值 可以計算頻率 累計頻率 S4學(xué)歷 3 定距尺度對事物類別或次序之間間距的測度 不僅能將事物區(qū)分為不同類型并進(jìn)行排序 而且可以準(zhǔn)確指出類別之間差距是多少 溫度 4 定比尺度能夠測量兩個測量值之間的比值 零點 溫度與重量 3 變量名與變量值標(biāo)簽變量值標(biāo)簽是對變量取值含義的解釋說明信息 4 缺失值系統(tǒng)缺失值 空字符串自定義缺失值 缺失值屬性對話框 5 角色 1 輸入 2 目標(biāo) 3 兩者 4 無 5 分區(qū) 6 拆分 2 3數(shù)據(jù)的直接錄入 1 開放題的錄入 ID 數(shù)值型開放題 姓名 字符型開放題2 單選題的錄入 性別 字符直接錄入字符代碼 值標(biāo)簽數(shù)值代碼 值標(biāo)簽3 半開放題的錄入 其他 請指出 選項兩個變量 1 選項 2 獨立的開放題 第一個變量名直接加 a 5 多選題的錄入稱為 多重響應(yīng) 數(shù)據(jù)錄入后需定義多選題集 多重二分法 多重分類法 1 多重二分法指在編碼時 對應(yīng)每一個選項都要定義一個變量 有幾個選項就有幾個變量 這些變量分別代表對其中一個選項的選擇結(jié)果 一般均為二分類 而其中必然有一個類別代表選中了這一選項 2 多重分類法利用多個變量來對一個多選題的答案進(jìn)行定義 應(yīng)該用多少個變量由被訪者實際可能給出的最多答案數(shù)而定 而且 這些變量必須為數(shù)值型變量 利用值標(biāo)簽將答案標(biāo)出 所有變量采用一套值標(biāo)簽 之所以稱為多重分類法 是因為每個變量都是多分類的 每個變量代表被訪者的一次選擇 設(shè)定多選題變量集Tables模塊和多重響應(yīng)菜單 分析多重響應(yīng)定義變量集 6 半開放多選題與半開放單選題非常相似 2 4外部數(shù)據(jù)的獲取 SPSS格式 文件 打開 數(shù)據(jù) 非SPSS格式 直接打開 Excel格式 利用文本向?qū)ёx入文本數(shù)據(jù) 文本數(shù)據(jù) 利用數(shù)據(jù)庫ODBC接口讀取 Access數(shù)據(jù) 1 讀取電子表格數(shù)據(jù)文件 文件 打開 數(shù)據(jù) 或Demo xls事先打開了解文件結(jié)構(gòu) 1 包含幾個數(shù)據(jù)表 2 若只需讀入部分 了解精確位置 3 第1行是否為變量名 2 讀取文本數(shù)據(jù)文件 文件 打開文本數(shù)據(jù) 文件 打開 數(shù)據(jù) demo txt 3 用ODBC接口讀取各種數(shù)據(jù)庫文件demo mdb 文件 打開數(shù)據(jù)庫 新建查詢 2 5數(shù)據(jù)的保存 1 保存為SAV格式2 保存為其他數(shù)據(jù)格式 第三章變量級別的數(shù)據(jù)管理 變量級別的數(shù)據(jù)管理 轉(zhuǎn)換 文件級別的數(shù)據(jù)管理 數(shù)據(jù) 轉(zhuǎn)換 1 計算新變量 最為常用和重要的過程2 變量轉(zhuǎn)換 從菜單第2項開始的多個計數(shù)過程 重編碼過程和離散化過程 實際上可以看成是 計算變量 過程某一方面的強(qiáng)化和打包 3 時間序列模型專用過程 時間和日期向?qū)?創(chuàng)建時間序列 替換缺失值 4 自動數(shù)據(jù)準(zhǔn)備5 其他 隨機(jī)數(shù)字生成器 第5章 運行掛起的轉(zhuǎn)換 3 1變量賦值 變量賦值就是指在原有數(shù)據(jù)的基礎(chǔ)上 根據(jù)用戶的要求 使用SPSS算術(shù)表達(dá)式及函數(shù) 對所有記錄或滿足SPSS條件表達(dá)式的某些記錄進(jìn)行四則運算 并將結(jié)果存入一個用戶指定的變量中 該指定變量可以是一個新變量 也可以是一個已經(jīng)存在的變量 1 算術(shù)表達(dá)式 由常量 SPSS變量名 SPSS算術(shù)運算符 圓括號等組成的式子 數(shù)據(jù)類型和結(jié)果均為數(shù)值型 2 函數(shù) 函數(shù)名 參數(shù) 8類函數(shù)3 條件表達(dá)式與邏輯表達(dá)式 用來指定對哪些記錄進(jìn)行計算 計算變量 轉(zhuǎn)換 計算變量 目標(biāo)變量 文本框 用于輸入需要賦值的變量名 候選變量列表 數(shù)字表達(dá)式 文本框 用于給目標(biāo)變量賦值 函數(shù)組 列表框 函數(shù)和特殊變量 列表框 函數(shù)解釋文字文本框 3 2已有變量值的分組合并 將連續(xù)變量轉(zhuǎn)換為等級變量或?qū)⒎诸愖兞坎煌淖兞康燃夁M(jìn)行合并 重新編碼為相同變量 對原始變量的取值直接進(jìn)行重編碼 重新編碼為不同變量 根據(jù)原始變量的取值生成一個新變量來記錄重編碼的結(jié)果 對連續(xù)性變量進(jìn)行分組合并 兩種方法 重編碼可視化分段過程重編碼 轉(zhuǎn)換 重新編碼為不同變量 分類變量類別的合并 連續(xù)性變量的離散化 可視化離散化過程 用于在可視界面下將連續(xù)變量進(jìn)行分段 該過程可以使用百分位數(shù) 標(biāo)準(zhǔn)差范圍或者等間距方式將連續(xù)變量劃分為若干組段 并采用圖形化操作的方式 非常直觀好用 最優(yōu)離散化過程 是對前述可視化離散過程的進(jìn)一步自動化 根據(jù)某些作為 關(guān)鍵指示變量 的分類變量 將原有的一個或多個連續(xù)性變量按照該分類變量類間差異最大化的優(yōu)化原則離散化為分類變量 然后就可以使用離散后變量而非原始數(shù)據(jù)值進(jìn)行后續(xù)的分析了 3 4轉(zhuǎn)換菜單的其他功能 變量的自動重編碼 用于將字符變量轉(zhuǎn)換為數(shù)值變量變量值的移動 某變量值的前移或后移指定數(shù)值的查找和計數(shù) 對某個個案進(jìn)行計數(shù)變量的編秩 根據(jù)某變量的數(shù)值大小來排出次序 然后將次序結(jié)果存儲到一個新變量中去自動準(zhǔn)備建模數(shù)據(jù)隨機(jī)數(shù)字生成器 第四章文件級別的數(shù)據(jù)管理 1 簡單命令 插入變量 插入個案 到達(dá)某條個案 復(fù)制數(shù)據(jù)集等 2 常用簡單過程 排序 拆分文件 個案篩選和個案加權(quán) 必須掌握 3 數(shù)據(jù)重組向?qū)?用于進(jìn)行數(shù)據(jù)轉(zhuǎn)置 或者對重復(fù)測量數(shù)據(jù)進(jìn)行長型 寬型記錄格式間的轉(zhuǎn)換 4 文件合并向?qū)?將幾個數(shù)據(jù)文件合并為一個大的SPSS數(shù)據(jù)文件 含橫向合并和縱向合并兩種情況 5 數(shù)據(jù)字典相關(guān)向?qū)?包括定義變量屬性 復(fù)制變量屬性 以及新建設(shè)定屬性三個向?qū)Ы缑?6 與數(shù)據(jù)準(zhǔn)備有關(guān)的功能 用于復(fù)雜數(shù)據(jù)項目 用于簡化數(shù)據(jù)管理工作 7 與統(tǒng)計模型密切相關(guān)過程 正交設(shè)計過程 8 其他過程 定義多重響應(yīng)集 數(shù)據(jù)匯總過程等 4 1幾個常用的過程 1 排序個案數(shù)據(jù)編輯窗口中的記錄的前后次序在默認(rèn)情況下由錄入時的先后順序決定 1 單變量排序 變量名處右擊 升序排列 降序排列 2 多變量排序 使用 排序個案 對話框2 分割文件 SplitFile 3 選擇個案 用于只分析部分?jǐn)?shù)據(jù)4 加權(quán)個案 1 以頻數(shù)格式錄入的數(shù)據(jù) 2 案例數(shù)據(jù)抽樣權(quán)重的調(diào)整5 分類匯總 按指定的分類變量對個案進(jìn)行分組 并按分組對變量求指定的描述統(tǒng)計量 4 3數(shù)據(jù)文件的重組與轉(zhuǎn)置 1 數(shù)據(jù)的長型與寬型格式指的是重復(fù)測量數(shù)據(jù)的兩種不同的排列方式 長型格式 在重復(fù)測量數(shù)據(jù)中 每一次測量被單獨記錄為一個個案 anxiety sav 寬型格式 在重復(fù)測量數(shù)據(jù)中 每一個個體被記錄為一個個案 他的所有測量被記錄在不同的變量中 anxiety2 sav 2 長型格式轉(zhuǎn)換為寬型格式3 寬型格式轉(zhuǎn)換為長型格式4 數(shù)據(jù)轉(zhuǎn)置 4 3多個數(shù)據(jù)文件的合并 1 縱向拼接指的是幾個數(shù)據(jù)集中的數(shù)據(jù)縱向相連 組成一個新的數(shù)據(jù)集 新數(shù)據(jù)集中的記錄數(shù)是原來幾個數(shù)據(jù)集中記錄數(shù)的總和 其實質(zhì)就是將兩個數(shù)據(jù)文件的變量按照各個變量名的含義一一對應(yīng)進(jìn)行首尾相接 a和b 2 橫向合并指的是按照記錄的次序 或者某個關(guān)鍵變量的數(shù)值 將不同數(shù)據(jù)集中的不同變量拼接為一個數(shù)據(jù)集 新數(shù)據(jù)集中的變量數(shù)是所有原數(shù)據(jù)集中不重名變量的總和 實質(zhì)就是將兩個數(shù)據(jù)文件的記錄按照某種對應(yīng)關(guān)系一一進(jìn)行左右對接 a和c 4 4與數(shù)據(jù)字典有關(guān)的功能 如果有事先定義的數(shù)據(jù)字典格式 則可以先生成一個沒有記錄的空數(shù)據(jù)文件 將全部的數(shù)據(jù)字典設(shè)定好 將來在數(shù)據(jù)錄入完畢后使用復(fù)制文件屬性向?qū)子靡幌伦值浼纯?如果沒有事先定義的數(shù)據(jù)字典格式 則可以在錄入工作進(jìn)行了一段時間以后先使用變量屬性定義向?qū)瓿蓴?shù)據(jù)字典的設(shè)定工作 然后隨著錄入工作的進(jìn)行經(jīng)常掃描數(shù)據(jù)的情況 以及時更新字典 最后在錄入工作完畢后使用復(fù)制文件屬性向?qū)?yīng)用字典的最終版本 如果數(shù)據(jù)管理任務(wù)不太復(fù)雜 也可以直接在數(shù)據(jù)字典中錄入數(shù)據(jù) 或者直接在變量視圖中修改屬性 或者直接在SPSS中錄入 導(dǎo)入數(shù)據(jù) 然后利用設(shè)置未知測量級別向?qū)砜焖僭O(shè)定數(shù)據(jù)字典 1 定義變量屬性2 復(fù)制變量屬性3 新建自定義屬性4 設(shè)置未知測量屬性 4 5與數(shù)據(jù)準(zhǔn)備有關(guān)的功能 1 數(shù)據(jù)驗證模塊2 自動數(shù)據(jù)準(zhǔn)備過程3 標(biāo)識重復(fù)個案過程4 標(biāo)識異常個案過程5 最優(yōu)離散化過程6 缺失值分析 數(shù)據(jù)驗證模塊 數(shù)據(jù)驗證模塊用于實現(xiàn)數(shù)據(jù)核查功能 用戶通過自行定義數(shù)據(jù)驗證規(guī)則 以確定個案取值是否有效 A單變量規(guī)則 單變量規(guī)則包含一組應(yīng)用于單個變量的數(shù)值檢查規(guī)則 例如 范圍外值的檢查 對于單變量規(guī)則 有效值可以表示一個范圍 也可以表示為一個有效值列表

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論