首頁 > 文章中心 > 正文

          數據的直線回歸探析

          前言:本站為你精心整理了數據的直線回歸探析范文,希望能為你的創作提供參考價值,我們的客服老師可以幫助你提供個性化的參考范文,歡迎咨詢。

          數據的直線回歸探析

          摘要:本文通過電子表格軟件Excel進行兩組數據直線回歸分析,為人們提供了一種方便快捷的分析方法。Ex-cel對于非統計專業人員的確是一個簡便易學、高效實用的好幫手。

          關鍵詞:Excel;直線回歸;統計分析

          中圖分類號:R195·1文獻標識碼:B

          醫藥衛生工作者在工作和科學研究中經常需要對數據進行統計分析。有報道表明,醫學期刊論文中應用的統計方法大多數屬于t檢驗、χ2檢驗、方差分析和直線回歸與相關分析等經典的統計方法[1]。當前計算機已普及,利用計算機完成統計分析工作已成為人們的第一選擇。雖然目前有一些專業統計軟件可供人們選用,如SAS、SPSS軟件等,但這些專業統計軟件結構復雜,一般的應用者不容易掌握,并且價格昂貴,使人難以承受。Excel是Office家族的一個成員,是一種電子表格軟件,眾多醫藥衛生工作者和科研工作者喜歡用它來記錄和整理實驗數據,其處理數據和繪圖等功能的確方便了廣大用戶,但大多數人并不知道Excel還可以提供一些基本的、經典統計分析方法。下面根據筆者多年來在教學和科研中應用Excel軟件的經驗,談一談如何利用Excel進行直線回歸分析。

          1為Excel安裝“分析工具庫”

          1·1在使用“分析工具”之前,應檢查“工具”菜單,確定Excel當前是否安裝了“分析工具”。如果在“工具”菜單中沒有“數據分析”命令項,則需通過調用加載宏來安裝“分析工具庫”[2]。

          圖1當前家載宏對話框

          1·2單擊“工具”菜單,在其下拉菜單中選中并單擊“加載宏”,命令彈出“加載宏”對話框,見圖1。

          1·3在對話框的“當前加載宏”列表框中選中“分析工具庫”,加載宏左側復選框中打“√”。然后單擊“確定”按鈕,關閉對話框。至此,為Excel安裝“分析工具庫”的工作已經完成。

          2制作回歸曲線、求出直線回歸方程及決定系數

          2·1在Excel工作表中拖動鼠標,選中數據所在的區域,例如:現有二組數據:X分別為1.0、2.0、3.0、4.0、5.0、6.0;Y分別為2.0、3.9、5.8、8.4、10.1、11.9。X用A列表示,將它們分別輸入A1-A6的區域;Y用B列表示,將它們分別輸入B1-B6的區域,然后選中A1-B6數據所在區域,點擊工具欄上的“圖表向導”圖標或點擊插入菜單中選擇圖表項,就可以打開圖表向導。

          2·2在“標準類型”選項卡的“圖表類型”中選擇“XY散點圖”。點擊“完成”鍵,散點圖出現在工作表中。在圖表區內按鼠標右鍵,根據需要可對標題、橫縱坐標、網絡線、線性的粗細等進行添加、修改和刪除。

          圖2由Excel作出的回歸曲線

          2·3將鼠標放在散點圖中任一數據上按右鍵,在出現的浮動菜單中選擇“添加趨勢線”項,出現“添加趨勢線”窗口。在“添加趨勢線”窗口的“類型”選項卡“趨勢預測/回歸分析類型”中選擇“線性”;在“選項”選項卡中的“顯示公式”和“顯示R平方值”復選框中打上“√”,點擊“確定”按鈕后在繪圖區就顯示曲線、回歸方程和決定系數R2的值,見圖2。

          3檢驗求得的直線回歸方程是否成立

          3·1在“工具”菜單的選項卡中點擊“數據分析”,彈出“數據分析”窗口,在“分析工具”中選擇“回歸”,然后點擊“確定”按鈕,出現“回歸”窗口,見圖3。

          圖3回歸分析窗口

          3·2將光標移至“Y值輸入區域”,選定B1-B6間的數據;然后將光標移至“X值輸入區域”,選定A1-A6間的數據;再在“置信度”左側復選框中打“√”,點擊“確定”按鈕,出現分析結果,見圖4。

          SUMMARYOUTPUT

          回歸統計

          MultipleR0.998453792

          RSquare0.996909975

          AdjustedRSquare0.996137469

          標準誤差0.235230384

          觀測值6

          方差分析

          DfSSMSFSignificanceF

          回歸分析171.40771.4071290.4879523.58429E-06

          殘差40.2213333330.055333333

          總計571.62833333

          Coefficients標準誤差tStatP-valueLower95%Upper95%下限95.0%上限95.0%

          Intercept-0.0533333330.218987569-0.243545030.819563773-0.6613415580.55467489-0.66134160.55467489

          XVariable12.020.05623081735.92336223.58429E-061.86387792.17612211.86387792.1761221

          圖4直線回歸分析結果

          3·3對圖4所示的數據,主要看“方差分析”的結果:“df”表示自由度、“SS”表示離均差平方和、“MS”表示均方、“F”表示統計量F值、“SignificanceF”表示P值。一般來說,若P0.05,表明有統計學意義,即總體回歸系數β≠0;反之,表明無統計學意義,總體回歸系數β=0。本例F=1290.487952、P=3.58429E-06(3.58429×10-6),很明顯P<0.05,表明二組數據之間存在依存關系,其關系可用回歸方程Y=2.02X-0.0533表示。

          4結語

          本文通過實例,具體地說明了如何利用Excel進行直線回歸分析,但對其他方法沒有做過多的論述。其應用前提是使用者必須對統計學的基本概念和基本方法有所了解,而且對電子表格軟件Excel的功能也有一定的了解。學會使用這種方法后,將為許多人在工作和研究中節約許多寶貴時間。而且,Ex-cel還可以與其他一些軟件如Word、PowerPoint和SPSS等軟件之間進行數據的交換[3],使之發揮更多的作用。由于該方法操作簡便,得到結果快速而準確,同時能得到直觀圖形,因而值得大力推薦。

          [參考文獻]

          [1]張立群,魏麗惠.醫學科研論文中常見統計學錯誤分析[J].中國婦產科臨床雜志,2006,7(6):473-474.

          [2]劉鋼.Excel在統計分析中的應用[M].北京:人民衛生出版社,2002·147-148.

          [3]陳雄新,曾建一,蔡岳華.Excel在四格表χ2檢驗中的應用技巧[J].