實驗一 數據的搜集與整理.doc_第1頁
實驗一 數據的搜集與整理.doc_第2頁
實驗一 數據的搜集與整理.doc_第3頁
實驗一 數據的搜集與整理.doc_第4頁
實驗一 數據的搜集與整理.doc_第5頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

實驗一 統計數據的搜集與整理一、實驗目的培養(yǎng)學生處理數據的基本能力。通過本實驗,學生應開始了解Excel 2003的操作界面,在有效搜集數據資源的基礎上,利用軟件完成數據的輸入、導入、保存、編碼、分類(組)、篩選、排序等數據整理工作。二、實驗手段計算機、Excel 2003三、實驗要求(1)熟悉Excel 2003的基本操作界面;(2)熟悉間接數據的搜集方法、搜集途徑,能熟練通過網絡搜集間接數據;(3)了解直接數據的搜集;(4)掌握不同類型的數據的處理方法,尤其是注意Excel 2003在數據輸入、導入等方面的區(qū)別,掌握數據文件的建立和保存方法。(5)掌握數據的編碼、分類(組)、篩選、排序等整理操作的方法。四、實驗內容(一)數據的搜集統計數據主要來源于兩種渠道:一種是來源于別人的調查或實驗數據,稱為間接數據;另一種是來源于科學實驗或者直接的調查數據,稱為直接數據。1.間接數據的搜集間接統計數據主要是公開出版或報道的數據,可以通過年鑒、期刊、報紙、廣播、電視等途徑搜集獲取。在網絡廣泛普及的今天,通過網絡搜集間接數據已經成為了一種主流手段。一般,在網絡上搜集數據可以采用兩種方式。一種方式是直接進入網站查詢數據。比如,要搜集四川省成都市2008年經濟數據,你可以進入網址/index.asp,點擊其中的統計數據目錄,如圖1-1所示。圖1-1進入統計數據頁面,選擇其中的統計年鑒,如圖1-2所示。圖1-2進入統計年鑒頁面,點擊2008年年度數據,就可以下載和查看成都市2008年的年鑒經濟數據文件了。如圖1-3所示。圖1-3常見的統計數據獲取網站可見表1-1。表1-1 常見的統計數據網站網站名稱網址簡介中華人民共和國國家統計局/提供全國的月度數據、季度數據、年度數據、普查數據、專題數據、部門數據和國際數據各地方統計局及國外統計網站/tjlj/可以從國家統計局的網站鏈接目錄,鏈接進入各地方統計局及國外統計網站,獲取統計數據中國人口信息網/提供有關人口統計的公報、專題抽樣調查數據、常用人口數據等中國經濟信息網/提供宏觀經濟信息、地區(qū)經濟信息、行業(yè)經濟信息、國際經濟信息、專業(yè)統計數據等中宏數據庫/macro_data/涵蓋了20世紀90年代以來宏觀經濟、區(qū)域經濟、產業(yè)經濟、投資消費、統計數字、研究報告等方面的詳盡內容第二種通過網絡獲取二手數據的方式是使用搜索引擎。比如,我們可以使用谷歌網站,搜索四川省成都市2008年經濟數據。在瀏覽器地址欄中輸入.hk ,進入谷歌搜索網站,在搜索框中輸入“成都市2008年經濟數據”,如圖1-4所示。圖1-4單擊“Google 搜索”按鈕,獲得搜索結果如圖1-5所示,可以在搜索顯示出的結果中,選擇鏈接進入查看是否符合自己的搜索目標。圖1-5實例操作:例:查詢北京市2008年的人口數。方法一:查詢2009年北京統計年鑒,可通過紙質年鑒,也可以通過網絡獲取。如果通過網絡獲取,步驟如下:第一步:瀏覽器中輸入地址/,進入北京統計信息網;第二步:選擇“統計數據年度數據”,在年度選擇下拉框中選擇2009年,點擊查詢,進入北京市2009年度統計年鑒,界面如圖1-6所示;圖1-6第三步:在年鑒中點擊“3-1人口狀況(1978-2008年)”,內容如圖1-7所示。圖1-7第四步:查詢得到北京市2008年常住人口1695.0萬人,戶籍人口1229.9萬人。方法二:通過搜索網站。步驟如下: 第一步:瀏覽器中輸入地址,進入谷歌搜索網站;第二步:在搜索框中輸入“北京市2008年人口數”;第三步:單擊“Google 搜索”按鈕,獲得搜索結果,如圖1-8所示;圖1-8第四步:點擊“2008年中國各城市人口數量 廣闊天地 新浪博客”這一搜索結果,得到北京市2008年人口數為1633萬人(如圖1-9所示)。圖1-92.直接數據的搜集直接統計數據可以通過兩種途徑獲得:一是統計調查或觀察,二是實驗。統計調查是取得社會經濟數據的最主要來源,它主要包括普查、重點調查、典型調查、抽樣調查、統計報表等調查方式。本實驗主要介紹抽樣調查取得直接數據的方法。抽樣調查的步驟如圖1-10所示:調查方案設計調查問卷設計問卷發(fā)放問卷收回數據初步整理圖1-10實例操作:例:大學生生活費收支狀況調查步驟一:調查方案設計一、調查方案:(一)調查目的:通過了解大學生日常收入和消費的主要狀況,為學校的助學政策提供參考,同時為大學生消費市場的開發(fā)提供一定的參考。(二)調查對象:西南科技大學經濟管理學院在校本科大學生(三)調查單位:抽取的樣本學生(四)調查程序:1.設計調查問卷,明確調查方向和內容2.分發(fā)調查問卷。隨機抽取該大學大一至大四的在校本科大學生,每一年級隨機抽出男、女生各30人左右作為調查單位3.根據回收的有效問卷進行分析,具體內容如下:(1)根據樣本的生活費來源、分布狀況的均值、方差等分布的數字特征,推斷西南科技大學經濟管理學院大學生總體分布的相應參數;(2)根據性別進行男女兩個總體生活費軍紙質差得比較以及方差筆的區(qū)間估計;(3)對四個年級的在校本科生進行四個總體生活費均值之差即方差筆的區(qū)間估計;(4)繪制統計圖形是樣本數據直觀化并對統計量進行分析。(五)調查時間:年月日年月日步驟二:問卷設計在明確了調研的目的后,應該思考數據搜集的方法,確定問題的回答方式和問題的用詞方式,使得問卷易于回答且不會產生歧義。完成初步問卷的設計和編排后,征詢相關方面的意見,通過小范圍測試或反復修訂,得到最終的問卷,用于實施發(fā)放。大學生收支調查問卷同學:您好,請配合我們完成以下調查問卷,請在符合您的實際情況的選項下畫“”Q1.您的性別:A.男 B.女Q2.您的年級:A.大一 B.大二 C.大三 D.大四Q3.您的月生活費支出在: A.300元以下 B.300-400元 C.400-500元D.500-600元 E.600-700元 F.700元以上Q4.您的生活費主要來源依次是: A.父母 B.勤工儉學 C.助學貸款 D.其他 (請注明)請排序:Q5.您的各項開支為(單位:元) A.伙食費 B.衣著 C.學習用品 D.日化用品 E.娛樂休閑 F.其他 非常感謝您的合作!步驟三:問卷的發(fā)放與收回本次調查采取分層抽樣,對在校本科生各個年級男、女各發(fā)放問卷30份左右;共發(fā)放問卷份,回收問卷份,其中有效問卷份。各年級男女生回收有效問卷具體情況:大一: (男生)份 (女生)份大二: (男生)份 (女生)份大三: (男生)份 (女生)份大四: (男生)份 (女生)份(二)數據的整理1.Excel的數據整理及數據文件的建立首先,大家應該熟悉Excel的操作界面。(1)數據的編碼 編碼是對數據進行初步分組和確定數字代碼的過程。它可以把復雜的文字用簡單的代碼代替,有利于簡化數據輸入和處理。一般直接數據如果是由封閉式問題獲取,那么涉及問題的時候就已經對答案進行了預編碼。如果數據是由開放式的問題來獲取的,那么,需要對答案進行羅列、合并、設碼三個過程來完成編碼工作。(2)數據的錄入 數據的錄入是將搜集到的數據直接輸入到數據庫文件中。數據錄入既要講究效率,又要保證質量。Excel的數據錄入操作比較簡單,一般只要在工作表中,單擊激活一個單元格就可以錄入數據了。單元格的切換可以使用鼠標,也可以在激活一個單元格以后用Enter鍵(或者Tab)鍵,向下(或者向右)切換單元格。在單元格內部的換行可以使用“Alt+Enter”。當然,數據錄入中最重要的還是要保證數據形式完整和性質正確。這就需要通過“格式-單元格格式”(Ctrl+1)菜單來實現。對于錄入重復數據,大家一般都習慣使用復制功能(Ctrl+C),但是Excel在簡單復制數據時不能保證格式的完整性,這個時候,就需要單擊鼠標右鍵,使用“選擇性粘貼”,進行設置來實現復制的格式要求。對于未輸入(或未確定格式)的數據,想要實現和已經輸入數據相同的格式要求,則可以使用工具欄中的“格式刷”。 (3)數據文件的導入 Excel數據文件的導入是將別的軟件形成的數據或數據庫文件,轉換到Excel工作表中。這樣,大家就不必要掌握那么多紛繁復雜的軟件,方便提高工作效率,也方便協同處理數據。Excel支持文本文件、Office數據庫文件、網頁文件、Dbase文件、Paradox文件、Xml文件等多種外部數據源的導入。導入的方法有二,一是使用“文件-打開”菜單,二是使用“數據-導入外部數據-導入數據”菜單,兩者都是打開導入向導,按向導一步步完成對數據文件的導入。(4)數據的篩選 數據的篩選是從大數據表單中選出分析所要用的數據。Excel中提供了兩種數據的篩選操作,即“自動篩選”和“高級篩選”?!白詣雍Y選”使用“數據-篩選-自動篩選”菜單,通過下拉箭頭的選擇來實現篩選。一般用于簡單的條件篩選,篩選時將不滿足條件的數據暫時隱藏起來,只顯示符合條件的數據。如果在下拉箭頭中選擇“自定義”,自動篩選還可以根據條件篩選出數據在某一范圍內符合條件的記錄,自定義中可以用“與”、“或”來約束區(qū)分條件。此外,使用“自動篩選”還可同時對多個字段進行篩選操作,此時各字段間限制的條件只能是“與”的關系?!案呒壓Y選” 使用“數據-篩選-高級篩選”菜單,調用對話框來實現篩選。一般用于條件較復雜的篩選操作,其篩選的結果可顯示在原數據表格中,不符合條件的記錄被隱藏起來;也可以在新的位置顯示篩選結果,不符合的條件的記錄同時保留在數據表中而不會被隱藏起來,這樣就更加便于進行數據的比對了。高級篩選需要在單元格或區(qū)域內輸入篩選條件,由于Excel的篩選只認列數據,所以列標題成為篩選的標題依據。列標題下可以輸入篩選的條件,條件放在同一行表示“與”的關系,條件不在同一行表示“或”的關系。(5)數據的排序 數據的排序是將數據的次序排列整理并顯示出來的過程。排序在顯示數據的序數排列結果的同時,也有利于方便的查詢某些數據,比如:最大、最小等。 Excel的排序功能主要靠“升序排列”(“降序排列”)工具按鈕和“數據-排序”菜單實現。在選中需排序區(qū)域數據后,點擊“升序排列”(“降序排列”)工具按鈕,數據將按升序(或降序)快速排列?!皵祿?排序”菜單可進行最多三級的條件排列。同時,“數據-排序”菜單還可進行自定義排序,來實現那些直觀從數據、時間、文本或字母上排序無意義的數據排序特殊要求。一般要自定義特殊的排序要求,需要先使用“工具-選項-自定義序列”,手工輸入新的排序序列,然后在“數據-排序”菜單打開的排序對話框中點擊“選項”,在新彈出的對話框的“自定義排序次序”下拉框中選擇手工輸入的排序次序。 此外,Excel分析工具庫宏中的“排位與百分比排位”工具,也能部分實現顯示排序結果的功能。其調用菜單為“工具-數據分析-排位與百分比排位”。(6)數據的分組 數據分組是將數據整理形成匯總表或頻數分布表的過程。匯總表可以使用“數據-分類匯總”菜單來實現,可形成求和、平均值、最大值、最小值、乘積、標準差、方差等條件的分類匯總結果。頻數分布分組情況可以由Frequency函數或直方圖工具來實現。Frequency函數以一列垂直數組返回某個區(qū)域中數據的頻率分布。它可以計算出在給定的值域和接收區(qū)間內,每個區(qū)間包含的數據個數。Frequency函數要求按組距上限分組,輸入的組限數據比每組的上限少1,并

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論