首頁 > 文章中心 > 常用統計學方法分析

          常用統計學方法分析

          前言:想要寫出一篇令人眼前一亮的文章嗎?我們特意為您整理了5篇常用統計學方法分析范文,相信會為您的寫作帶來幫助,發現更多的寫作思路和靈感。

          常用統計學方法分析

          常用統計學方法分析范文第1篇

          【關鍵詞】醫學統計學;研究生;教學改革

          培養醫學研究生不僅要提高其專業能力,更要培養其科研思維能力和解決科研實際問題的能力。《醫學統計學》的學習不僅能夠培養醫學研究生良好的科研思維能力,而且能夠從科研設計、資料收集、數據統計分析、結果正確解釋等方面大大提高學生解決實際科研問題能力。因此,《醫學統計學》教學在研究生課程教學中有著舉足輕重的作用。

          1《醫學統計學》教學中存在的問題

          盡管在本科教學、碩士研究生教學、博士研究生教學均開設了《醫學統計學》課程,但是,在目前教學模式下,經過《醫學統計學》課程學習的大部分醫學研究生在醫學統計學的理論學習和實際應用方面仍存在嚴重的脫節現象,如統計設計不合理、資料分析統計學方法應用錯誤、研究結果解釋不正確等。有調查顯示,只有不到30%的研究生能夠熟練掌握和正確運用常見的統計學方法,如統計描述、t檢驗、相關分析、單因素方差分析等。由于缺乏良好的運用統計學方法的能力,有許多學生在開展科研實踐中遇到了較多的麻煩,造成了不必要的損失。有的因為課題設計存在嚴重問題,只好在課題已經開始實施后推到重來;有的因為在資料分析時采用了錯誤的統計學方法,得出了錯誤的結果和結論,不僅導致了本研究的失敗和科研資源的浪費,而且由于錯誤的研究結論未能得到及時發現和糾正而導致了后續研究資源的投入,產生了更多研究資源的浪費。此外,目前《醫學統計學》教學對醫學研究中常用的一些高級統計學方法如生存分析、Meta分析等涉及較少或者著力不夠。

          2 《醫學統計學》教改措施

          2.1教學方式的調整

          目前醫學研究生《醫學統計學》教學模式中采取的教學方式仍然是本科學習階段的教學方式,即老師理論授課,輔助課后練習題的完成。研究生在本科階段已經較為系統地學習了《醫學統計學》的基礎理論知識,在碩士或博士階段則應更加注重《醫學統計學》方法實際應用能力的培養。因此,醫學研究生《醫學統計學》教學應采用理論教學為輔,實踐操作為主的方式。減少理論課課時數,增加實踐操作課時數。理論授課應結合醫學研究的需要,采用問題為基礎,學生為主,老師為導向的啟發教學方法;實踐操作教學可采用如下方式:

          (1)典型案例分析法 老師可以選用一些典型的課題標書、研究論文,先讓學生進行課前閱讀,找出標書或論文在統計設計或統計方法運用方面的缺點和巧妙之處,然后在課堂上進行討論,老師最后剖析和點評。

          (2)小組課題設計 可通過學生自主設計課題的方式提高學生對統計方法、統計設計等的應用能力。具體方式為:首先對學生進行分組,每組自行選題,進行科研設計,然后在老師的引導下,對每一組課題標書進行課堂討論和點評。

          (3)導師課題演練法 學校安排一定的課時,讓學生在《醫學統計學》課程開始前、開始中積極參與導師課題研究活動。一方面可以通過提高學生對醫學統計學方法應用的需求,激發學生學習《醫學統計學》的熱情和積極主動性;另一方面,學生在參加課題實踐過程中往往會遇到許多有關課題設計、資料統計分析等方面的問題,帶著這些問題去學習《醫學統計學》,將有更加深刻的體會。

          2.2課程內容的調整

          目前,研究生《醫學統計學》教學課程內容主要包括:①基本統計學方法。主要有:統計描述、t檢驗、單因素方差分析、單相關分析、一元線性回歸、二維表、秩和檢驗等。②高級統計學方法。主要有:多元線性回歸、logistic回歸、多維表x2檢驗、生存分析等。③科研設計。主要有:簡單析因設計、簡單拉丁方設計以及研究樣本量的估算等。④統計軟件及應用。主要有SPSS軟件的應用。研究生《醫學統計學》教學課程內容應根據培養學生的類型及醫學研究的需要進行實時調整。一方面強調專業型碩士研究生基礎統計學方法的學習;另一方面要增加或加強學術型碩士研究生和所有博士研究生對logistic回歸、多維表x2檢驗、生存分析如COX回歸和Kaplan Meier等常用高級統計學方法的學習。雖然有些學校現有教學課程內容包含了這些內容,但要求學習的內容不夠全面和深入,只有極少數學生能夠熟練應用此方法開展科研實踐。此外,還應增加高級統計學方法在醫學統計軟件中的使用方面的教學內容。

          2.3考核方式的調整

          目前,研究生《醫學統計學》課程考核方式主要是以閉卷筆試為主的理論考試,而對學生統計學方法的實際運用能力考核重視程度不夠。對于碩士研究生,我們可以采用閉卷考試為主,輔之以實際操作能力考核。具體為:一方面采用閉卷考試考核,分值約60-70分;另一方面要求學生結合醫學研究工作的需要,設計一項科研課題,撰寫一份課題標書。此項考核分值約30-40份。博士研究生則采用實際操作能力考核,平時作業綜合考評得分為輔的考核方式。具體為:要求博士研究生結合醫學研究工作的需要,設計一項科研課題,撰寫一份高質量的科研標書,此項考核分值約60-70分;同時,任課老師對每位學生平時作業情況進行綜合考評,此項考核分值約30-40分。

          3 思考

          研究生《醫學統計學》教學改革的重點內容包括:一方面要改變理論教學為主、實際運用能力為輔的教學方式,從而提高學生科研實踐能力;另一方面,還要根據醫學研究的需要,豐富《醫學統計學》教學內容,以此滿足醫學研究的需要。教學改革需要教育部門、學校的高度重視;同時也對老師和學生提出了更高的要求和挑戰。不僅需要教師不斷更新、完善自己的知識結構,在教學實踐中反復摸索、不斷嘗試,而且也要求學生具有更廣的知識面和更強的自學能力及動手能力。

          參考文獻:

          [1]潘發明,廖芳芳,夏果,等.1臨床科研論文中常見的統計學錯誤分析(一).安徽醫藥,2008,12(2):192-193.

          [2]李淑,杰孫忠. 加強醫學統計學教育 提高醫療及科研水平. 中華醫院管理雜志,2009, 25(5):346-348.

          [3]潘發明,夏果,廖芳芳,等.I臨床科研論文中常見的統計學錯誤分析(二).安徽醫藥,2008,12(6):576-577.

          [4]萬獻堯, 張久之. 醫學科研或論文中常見的統計學問題. 醫學與哲學(臨床決策論壇版),2009,30(12):74-75.

          [5]漆光紫,任美璇,黃高明. 不同類型醫學碩士研究生《醫學統計學》知識掌握和需求情況調查. 中華醫學教育探索雜志2011, 10( l2):1459-1463.

          [6]鄒延峰,潘發明,田果等. 某醫科大學研究生醫學統計學教學需求調查 .中國衛生統計,30(6):934-935轉933.

          常用統計學方法分析范文第2篇

          [關鍵詞]衛生信息管理醫學統計學教學改革

          [作者簡介]周文君(1975-),女,江蘇鹽城人,鹽城衛生職業技術學院衛生信息管理教研室主任,講師,研究方向為公共衛生及衛生信息管理專業教學。(江蘇鹽城224005)孫曉凱(1978-),男,江蘇鹽城人,鹽城市疾病預防與控制中心慢性病科主管醫師,研究方向為慢性非傳染性疾病的預防與控制及衛生統計學教學。(江蘇鹽城224002)

          [中圖分類號]G642.0[文獻標識碼]A[文章編號]1004-3985(2009)20-0144-02

          現代醫藥衛生科技信息化發展迅速,衛生信息管理科學的發展對衛生信息管理專業人員的素質提出了很高的要求。醫學院校培養的衛生信息管理專業學生需要面向各級衛生行政管理部門、醫院、醫學信息部門、醫學圖書館等部門,從事日常辦公事務處理、病案管理、衛生信息資料、醫學圖書、檔案管理等工作和計算機維護工作。①他們除了需要掌握基礎醫學、臨床醫學等醫藥衛生知識和程序設計、數據庫管理等計算機知識外,還需要具有較好的統計學理論知識,能夠熟練掌握部分統計軟件的使用,以便為各級醫藥衛生機構提供信息和決策依據。為了提高醫學統計學課程質量,培養衛生信息管理專業學生建立統計學觀念,提高動手解決實際問題能力,近年來,鹽城衛生職業技術學院對衛生信息管理專業的醫學統計學的教學方法進行了探索與研究,主要從以下幾個方面著手。

          一、根據課程特點明確學習要求

          1.課程特點。醫學統計學是一門既有復雜理論知識,又有豐富應用技巧的醫學專業基礎課程。它是科研設計、資料的搜集、整理和分析的靈魂,可應用于居民健康狀況評價、醫療衛生實踐和醫學科研等各個方面,涉及基礎醫學、臨床醫學、預防醫學等多學科領域。醫學統計學內容主要是以醫學理論及其研究內容為載體,應用數理統計學的理論和方法來闡述某個醫學實際問題。②

          2.學習要求。醫學生學習醫學統計學,并非要成為醫學統計學的專業人才,其目的在于建立起統計學觀念,學會從不確定性、機遇、風險和推斷的角度去思考醫學問題。對于衛生信息管理專業等非預防醫學專業學生,特別是專科生,醫學統計學的數學原理、公式推導等要求可以更加放寬,重點應放在統計方法的應用上。因此,我們要求學生學習醫學統計學必須要牢固樹立起統計學觀念,如生物性個體變異觀念,各種醫學指標獨特和分類觀念,抽樣誤差不可避免及各種條件下樣本具有不同的誤差觀念,各種研究對象和研究方式含有不同變異的觀念,等等。學習醫學統計學的具體要求是:能夠理解一些基本概念、基本原理;記住一些最基本的公式和界值;重點要掌握統計方法的適用條件、統計結果的解釋;此外還要再加上認真的課后練習和上機實習。

          二、系統安排教學重點

          1.合理選擇授課章節。目前,各地院校本科、專科生開設的醫學統計學課程課時大多在50~100節課間,要在這有限的課時內講完這么多的內容很不現實,所以各地學校要根據培養目標選擇適當的章節為學生講解。對于非預防醫學專業學生,除了基本的概念、統計描述、概率分布、參數估計、t檢驗、卡方檢驗、非參數檢驗等醫學統計學基礎理論部分外,其他的理論部分,如實驗設計、調查設計、復雜的相關與回歸等章節可以不講,留給有興趣的同學自學,把更多的時間安排在課上討論和實習課的操作上。對于衛生信息管理專業學生的培養目標,除了基本統計學理論外,還應重點加上在日后信息統計工作中會常用到的關于各種率的概念、計算方法的章節。此外,還可以講座的形式為學生介紹一些常用的、比較復雜的統計學方法。

          2.明確教學重點。傳統的統計學教學內容包括三個方向:一是基本概念和方法;二是公式的來源、推導和詳細的手工計算步驟;三是統計結果的解釋與分析。③傳統的公式推導雖有利于對統計基本概念的理解,但對非統計專業的醫學生來講,冗長的公式推導已很難理解,更談不上對它的記憶了。因此,對于統計公式,我們要求學生只要了解其直觀意義、用途和應用條件,而不要求掌握其數學推導,教學內容的重點放在統計學基本原理、基本要領和邏輯思維上,而不是統計學方法的計算過程或數學算法的講解上。同時,隨著信息技術的迅速發展,各種數據處理軟件和統計軟件唾手可得,統計學計算也很容易實現,相反,統計學基本知識和基本原理的教學更顯迫切。我們的教學重點是培養學生解決實際問題的能力,讓學生對已有資料能夠找到適合的統計方法,結合本專業知識解釋統計結果。為此我們調整了一些教學內容,注重統計學基礎、統計學思維、統計學操作能力的培養,同時利用優秀的統計軟件,簡化統計計算過程,強調統計方法的選擇與報告信息的提取。例如,目前醫學上常用的假設檢驗方法有十余種。我們要教會學生能夠根據研究目的、資料類型選擇最適宜的統計方法,如計量資料常用t檢驗、方差分析等方法;計數資料常用卡方檢驗;等級資料可用秩和檢驗等,同時還要注意各種檢驗方法的應用條件。

          三、注重例題的練習

          1.從例題入手,提高學生的認識。醫學統計學的學習以理解為主,而一般醫學院校的學生對數學的接觸很少,因此,對于醫學統計學這門課程,很多學生往往存在一種恐懼心理。為消除這種心理,使學生對之感興趣,從實例入手是非常重要的。在理論教學課上講授某個概念或方法之前先舉個例子或提出問題,讓學生給出自己的看法和解決思路,教師適當加以引導和啟發,在解決這些問題的同時,再將統計學基本概念、基本原理和基本方法融入其中。這里提到的實例,可以是教材中現有的例題或練習題,可以是統計咨詢中碰到的實際問題,或醫學期刊論著中的一些實例,也可以是日常生活中的某一現象。學生的思維經過這樣一個由感性到理性,由具體到抽象的認識過程,減輕了接受抽象概念和方法的難度,加深了對書本內容的理解,還調動了他們學習的積極性,對提高教學效果大有幫助。此外,大量例題的講解和練習還有利于提高學生日后解決實際問題的能力。由于畢業后從事不同的工作崗位,對于大部分人來說,很多統計方法往往因用不到而不會使用,等實際工作中碰到時候便無從下手,這時他們便可查閱以往教材、參考書上的例題,與實際工作中的材料進行對比來獲得合適的統計方法。

          2.進行案例討論,加深對常見錯誤的認識。統計方法的選擇重點在于要根據設計類型、資料類型及分析目的選用適當的檢驗方法和檢驗統計量。我們在講授各種檢驗方法時,不但重點強調各種方法的應用條件,還舉出具體誤用例子加以討論,將常被誤用的方法列舉出來,供學生辨析,從反面吸取經驗教訓。比如常見誤用有:配對t檢驗誤用為成組t檢驗;多組均數比較應用方差分析及q檢驗誤用為t檢驗;配對設計卡方檢驗誤用為成組卡方檢驗;多個率比較應用行×列表卡方檢驗誤用為四格表;應該用確切計算概率法誤用為四格表卡方檢驗;等等。新版的“衛生統計學”教材每章都增加了“案例討論”部分,教師減少了習題課時間,充分利用這些案例,給學生足夠時間進行課堂討論。案例討論在不偏離主題的前提下,調動了每一個同學的積極性,又能及時發現問題,解決問題,培養學生的綜合應用能力,為今后的實際應用打下堅實基礎,很受學生的歡迎。

          四、使用統計軟件提高教學質量

          1.選擇SPSS軟件作為教學軟件。計算機和軟件技術的飛速發展避免了在醫學統計工作中煩瑣的計算過程和記憶復雜的計算公式,使得醫學統計學的應用越來越易于實現。衛生信息管理專業學生之前接受過計算機基本知識的培訓,很容易掌握軟件的操作,因此開設統計軟件實習課顯得尤為必要。目前,國內外的統計軟件眾多,根據學生的實際情況,從針對性、實用性的觀點出發,我們選擇了功能強大且易于掌握的SPSS軟件作為醫學統計學實習課的教學軟件。SPSS是目前國際上最流行的、具有權威性的統計分析軟件之一,它操作簡單,無須編程,易學易用,可以直接讀取Excle等數據文件,分析結果清晰、直觀,可以直接復制到Word文檔中,為學生使用帶來極大的方便。④

          2.精心安排實習課內容。實習課我們要求學生在計算機上學會應用該軟件,能夠在學習之后應用該軟件獨立完成實際資料的統計分析等工作。具體做法是,首先由實習教師對本節課的內容進行講解,并在主機動態演示SPSS軟件的操作過程,解釋結果,然后讓學生應用SPSS軟件獨立完成書本上或教師精心篩選的習題,并要求學生看懂計算機輸出的結果,同時能對資料進行解釋。我們重點讓學生掌握的是一些基本操作(包括數據的輸入和整理、變量的設置、轉換等)、主要統計分析過程(包括描述性統計、t檢驗、方差分析、卡方檢驗、線性回歸和相關分析、非參數檢驗)和基本統計圖等內容,同時要求學生能理解輸出的結果,合理解釋統計結論中重點指標的含義。

          3.避免盲目使用統計軟件。統計方法選擇的正確與否依賴于使用者對資料的了解程度與統計分析方法的掌握程度。而SPSS軟件只是一種工具,它無法對統計方法的適應性做出判斷,不能取代分析過程。如果不懂得選用正確的統計方法,而盲目使用計算機和統計軟件,不管是什么研究類型的數據都簡單地交給計算機處理,用計算機取代統計,那么大量的信息和統計數據將得不到有效的利用,勢必造成統計方法的濫用和誤用。另外,學生在課本上看到的是規范化的表格表示出來的資料,很容易選擇適當的方法,而日常工作中往往不是這樣,因此,如果學生對統計方法掌握不好,在實際工作學習中很容易出現濫用統計軟件的情況。所以,我們教學中一再強調不能盲目的使用統計軟件,而是要根據統計學原理選擇合適的統計方法,然后再使用統計軟件進行分析。

          五、采用現代化教學手段

          常用統計學方法分析范文第3篇

          [關鍵詞]生物統計學;本科教學;Excel軟件;統計功能

          [中圖分類號] G642 [文獻標識碼] A [文章編號] 2095-3437(2017)03-0066-03

          統計學是生物學領域進行科學研究不可或缺的工具,目前大多數高校已把生物統計學列為生物學相關專業的必修課。通過該課程的學習,有利于培養學生正確分析試驗數據的能力,對于進一步學習專業課程和日后進行科研也有著非常重要的作用。近年來,統計分析軟件的應用越來越普及,應用統計軟件來輔助生物統計學的理論教學變得尤為重要。[1][2]

          Excel作為常用辦公軟件,除具備較強的圖表和計算功能外,還提供了大量的統計函數和數據分析工具。利用Excel的統計功能,可快速、簡便地進行描述性統計、t檢驗、方差分析、回歸、相關等多種統計分析,從而為生物統計學的教學提供了極大便利,強化了教學效果。Excel的統計功能雖不如SPSS、SAS等專業統計軟件強大,但具有易學易用的優勢,適用于統計學的初學者,可基本滿足本科生的教學需要。[3][4]

          一、Excel統計函數簡介

          (一)統計函數的插入

          Excel軟件提供了豐富的數學和統計函數,將這些函數結合起來應用,可顯示出Excel的統計分析功能。[3][4]在Excel 2003菜單中的“插入”項,選擇“函數”。或在2007及以上版本中,在“公式”菜單項選“插入函數”命令,之后在“選擇類別”欄選擇“統計”,即顯示大量統計函數。

          (二)常用統計函數介紹

          1.統計學參數或特征數的計算

          數據的標準差、平均數等特征數均可由統計函數計算得到。反映集中性的函數包括AVERAGE(均值)、GEOMEAN(幾何平均數)、HARMEAN(調和平均數)、MEDIAN(中位數)等;反映離散性的函數有:DEVSQ(離差平方和)、STDEV(樣本標準差)、VAR(樣本方差)、KURT(峰度系擔┑取

          2.數據分類

          FREQUENCY函數可對大量數據進行分類和統計,表達式為:FREQUENCY(Data array,Bins array)。該函數為數組公式形式,運行顯示出一個分組的頻數后,還需選中所有結果的顯示區域,按F2鍵,再按“Ctrl+Shift+En?鄄ter”組合鍵,方可求出所有分組的頻數。[5]FREQUENCY的操作步驟因分類資料的性狀而有所差異。A. 質量性狀資料:在函數對話框中,“Data array”一欄輸入分類數據所在的單元格地址,“Bins array”一欄輸入分類標志值所在單元格。B. 數量性狀資料:確定好分類的組數、組距和組限后,將各組的上限按升序輸入工作表,在“Data array”和“Bins array”分別輸入相應的單元格地址。

          例:現有350名學生的英語成績,需按優秀、良好、一般和不及格進行分類,并統計各等級人數。考試成績為數量性狀資料,首先按升序將各組上限按升序輸入工作表(60、74、90)形成一列,插入FREQUENCY函數,在“Data array”輸入成績所在單元格區域,在“Bins array”輸入各上限所在的單元格區域,確認后即可計算出不及格的人數(

          3.概率函數

          概率函數可直接計算出給定參數條件下各理論分布的概率值(P)。[6]常用函數有BINOMDIST(二項分布)、POISSON(泊松分布)、NORMDIST(正態分布)、NORMSDIST(標準正態分布)、TDIST(t分布),FDIST(F分布)等。

          例如,BINOMDIST函數的功能為計算給定參數條件下二項分布的概率值。函數表達式:BINOMDIST(number_s,trials,probability_s,cumulative),其中num?鄄ber_s為試驗成功的次數,trials為獨立試驗的次數,prob?鄄ability_s為試驗成功的概率;cumulative為一邏輯值,用于確定函數的形式,取值為1和0。Cumulative如果取1,結果顯示至多n次成功的概率;如為0,則返回恰好為n次成功的概率。

          4.t 檢驗

          TTEST函數功能為返回t檢驗的概率,以此來判斷假設檢驗的顯著性。函數表達式:TTEST(array1,array2,tails,type),其中array1為第一組數據所在的單元格區域,array2為第二組數據的區域,tails為分布曲線的尾數(雙尾或單尾),type表示t檢驗的類型。函數運行后得到t檢驗的概率值(P),如P

          5.相關和回歸系數計算

          CORREL函數功能為計算兩變量間的相關系數,以此來判斷兩變量間的相關程度和性質,表達式為COR?鄄REL(array1,array2),array1和array2代表進行相關分析的兩組數據。利用INTERCEPT和SLOPE兩函數可計算線性回歸系數,函數表達式分別為INTERCEPT(known_x′?鄄s,known_y′s),SLOPE(known_x′s,known_y′s),其中known_x′s、known_y′s為自變量和因變量的數據集合。INTERCEPT函數可計算線性回歸的截距(a),SLOPE函數可計算線性回歸的斜率(b),從而得到線性回歸方程:=a+bx。

          二、數據分析工具的應用

          (一)分析工具庫加載

          Excel的分析工具庫具有較強的統計分析功能,但此功能通常未默認安裝,需加載后使用。

          1.在Excel 2003中,在“工具”菜單中單擊“加載宏”,在彈出對話框中選中“分析工具庫”即可,之后“工具”菜單中即出現“數據分析”條目。

          2.在Excel 2007或更高版本中,單擊左上角的“Office按鈕”,選擇“Excel 選項”,在彈出對話框中單擊“加載項”,然后在“管理”欄中選擇“Excel加載項”,單擊“轉到”,最后在“加載宏”窗口中選中“分析工具庫”,之后在“數據”菜單中即出現“數據分析”條目。

          (二)常用統計方法介紹

          分析工具庫包括描述性統計、t檢驗、方差分析、回歸、相關、F檢驗等多種統計方法。[3][5]每次使用時,按照各統計方法的格式要求輸入原始數據,單擊“數據分析”選項,在彈出對話框中選擇所需統計方法即可。

          1.數據分類

          將各組的分類標志值(質量性狀資料)或上限值(數量性狀資料)輸入工作表,在“數據分析”中選擇“直方圖”;彈出對話框后,在“輸入區域”選擇分類數據的單元格地址,“接收區域”選擇分類標志所在的單元格,運行即可。

          2.描述統計

          輸入數據資料,在“數據分析”中選擇“描述統計”,運行后即可得到最小值、最大值、平均數、標準差、方差、峰度、偏度等常用統計量。

          3.t檢驗

          t檢驗包括平均值的成對二樣本分析,雙樣本等方差假設,雙樣本異方差假設檢驗。如進行平均值的成對二樣本分析,彈出對話框后,分別在“變量1區域”、“變量2區域”輸入兩組數據所在的單元格地址,之后在“輸出區域”選擇某空白區域,確定即可。運行結果包括平均數、t值、df、單尾和雙尾概率(P)、臨界t值等信息。若P

          如進行成組設計的兩樣本均值檢驗,需先進行F檢驗:雙樣本等方差假設,判斷兩樣本所在總體方差是否同質。步驟:分別在變量1、變量2輸出區域選擇相應單元格區域,運行結果包括方差、F值、單尾概率(P)、臨界F值等。如P

          4.方差分析

          方差分析包括單因素、無重復雙因素、有重復雙因素三種類型。如進行單因素方差分析,彈出對話框中,在輸入區域、分組方式、輸出區域分別輸入相應信息后,單擊“確定”即可。輸出結果包括平方和(SS)、df(自由度)、MS(均方)、F值、F crit(F臨界值)、P值等信息(表1)。如P>0.05(或F

          5.回歸與相關分析

          線性回歸分析:在“數據分析” 菜單選擇“回歸”, 在彈出對話框中輸入Y值、X值、置信度、輸出區域等信息后,運行即可得到回歸截距(Intercept,a)和回歸系數(b)(表2),從而寫出回歸方程。根據回歸系數的t檢驗結果或方差分析的F檢驗結果,可判斷兩個變量間的線性回歸關系是否有效。[7]由表2可知,a(Intercept)=-1.382,b=5.503,回歸方程為:=5.503x-1.382。由回歸系數的t檢驗可知,P=0.00004

          三、結語

          Excel軟件提供的統計功能基本涵蓋了統計學的教學內容,且對于生物統計學的初學者而言,具有易學易用的優勢,可作為本科教學的有效輔助工具。在每章理論知識講解完畢,應緊接著介紹Excel的統計功能、操作步驟和結果解釋,把課程理論教學、實際案例分析和軟件應用有機結合,可取得較好的教學效果。教學實踐表明,運用Excel的統計功能來輔助理論教學,不僅能夠加深學生對統計學原理的理解,還可以提高學生運用理論知識來分析數據的能力,從而使得生物統計學的學習變得輕松。在今后的生物統計學教學實踐中,應緊密加強Excel軟件應用與理論教學的融合,并考慮將 SPSS等專業軟件逐步引入教學中,以期進一步提升學生分析處理復雜數據、解決實際問題的能力。

          [ 參 考 文 獻 ]

          [1] 張丹,呂海燕,張幸果,等.應用Excel軟件有效提高《生物統計學》課程的教學效果[J].河北農業科學,2012(8):93-95,99.

          [2] 魏興民,任真,代婷.Excel在中醫藥統計學教學中的應用[J].高等數學研究,2013(1):93-95.

          [3] 張聯鋒,蔣敏杰,張鵬龍,等.Excel統計分析與應用[M].北京:電子工業出版社,2011.

          [4] 楊景峰.EXCEL的計算功能在生物統計學教學中的應用[J].內蒙古民族大學學報(自然科學),2012(6):738-741.

          [5] 王錕.Excel 在統計學中的應用[J].湖南科技學院學報,2013(12):9-11.

          常用統計學方法分析范文第4篇

          【論文摘要】所謂統計思想,就是在統計實際工作、統計學理論的應用研究中,必須遵循的基本理念和指導思想。統計思想主要包括均值思想、變異思想、估計思想、相關思想、擬合思想、檢驗思想等思想。文章通過對統計思想的闡釋,提出關于統計思想認識的三點思考。

          【論文關鍵詞】統計學;統計思想;認識

          1關于統計學

          統計學是一門實質性的社會科學,既研究社會生活的客觀規律,也研究統計方法。統計學是繼承和發展基礎統計的理論成果,堅持統計學的社會科學性質,使統計理論研究更接近統計工作實際,在國家和社會得到廣泛發展。

          2統計學中的幾種統計思想

          2.1統計思想的形成

          統計思想不是天然形成的,需要經歷統計觀念、統計意識、統計理念等階段。統計思想是根據人類社會需求的變化而開展各種統計實踐、統計理論研究與概括,才能逐步形成系統的統計思想。

          2.2比較常用的幾種統計思想

          所謂統計思想,就是統計實際工作、統計學理論及應用研究中必須遵循的基本理念和指導思想。統計思想主要包括:均值思想、變異思想、估計思想、相關思想、擬合思想、檢驗思想。現分述如下:

          2.2.1均值思想

          均值是對所要研究對象的簡明而重要的代表。均值概念幾乎涉及所有統計學理論,是統計學的基本思想。均值思想也要求從總體上看問題,但要求觀察其一般發展趨勢,避免個別偶然現象的干擾,故也體現了總體觀。

          2.2.2變異思想

          統計研究同類現象的總體特征,它的前提則是總體各單位的特征存在著差異。統計方法就是要認識事物數量方面的差異。統計學反映變異情況較基本的概念是方差,是表示“變異”的“一般水平”的概念。平均與變異都是對同類事物特征的抽象和宏觀度量。

          2.2.3估計思想

          估計以樣本推測總體,是對同類事物的由此及彼式的認識方法。使用估計方法有一個預設:樣本與總體具有相同的性質。樣本才能代表總體。但樣本的代表性受偶然因素影響,在估計理論對置信程度的測量就是保持邏輯嚴謹的必要步驟。

          2.2.4相關思想

          事物是普遍聯系的,在變化中,經常出現一些事物相隨共變或相隨共現的情況,總體又是由許多個別事務所組成,這些個別事物是相互關聯的,而我們所研究的事物總體又是在同質性的基礎上形成。因而,總體中的個體之間、這一總體與另一總體之間總是相互關聯的。

          2.2.5擬合思想

          擬合是對不同類型事物之間關系之表象的抽象。任何一個單一的關系必須依賴其他關系而存在,所有實際事物的關系都表現得非常復雜,這種方法就是對規律或趨勢的擬合。擬合的成果是模型,反映一般趨勢。趨勢表達的是“事物和關系的變化過程在數量上所體現的模式和基于此而預示的可能性”。

          2.2.6檢驗思想

          統計方法總是歸納性的,其結論永遠帶有一定的或然性,基于局部特征和規律所推廣出來的判斷不可能完全可信,檢驗過程就是利用樣本的實際資料來檢驗事先對總體某些數量特征的假設是否可信。

          2.3統計思想的特點

          作為一門應用統計學,它從數理統計學派汲取新的營養,并且越來越廣泛的應用數學方法,聯系也越來越密切,但在統計思想的體現上與通用學派相比,還有著自己的特別之處。其基本特點能從以下四個方面體現出:

          (1)統計思想強調方法性與應用性的統一;

          (2)統計思想強調科學性與藝術性的統一;

          (3)統計思想強調客觀性與主觀性的統一;

          (4)統計思想強調定性分析與定量分析的統一。

          3對統計思想的一些思考

          3.1要更正當前存在的一些不正確的思想認識

          英國著名生物學家、統計學家高爾頓曾經說過:“統計學具有處理復雜問題的非凡能力,當科學的探索者在前進的過程中荊棘載途時,唯有統計學可以幫助他們打開一條通道”。但事實并非這么簡單,因為我們所面臨的現實問題可能要比想象的復雜得多。此外,有些人認為方法越復雜越科學,在實際的分析研究中,喜歡簡單問題復雜化,似乎這樣才能顯示其科學含量。其實,真正的科學是使復雜的問題簡單化而不是追求復雜化。與此相關聯的是,有些人認為只有推斷統計才是科學,描述統計不是科學,并延伸擴大到只有數理統計是科學、社會經濟統計不是科學這樣的認識。這種認識是極其錯誤的,至少是對社會經濟統計的無知。比利時數學家凱特勒不僅研究概率論,并且注重于把統計學應用于人類事物,試圖把統計學創建成改良社會的一種工具。經濟學和人口統計學中的某些近代概念,如GNP、人口增長率等等,均是凱特勒及其弟子們的遺產。

          3.2要不斷拓展統計思維方式

          統計學是以歸納推理或歸納思維為主要的邏輯方式的。眾所周知,邏輯推理方式主要有兩種:歸納推理和演繹推理。歸納推理是基于觀測到的數據信息(尤其是不完全甚至劣質的信息)去產生新的知識或去驗證一個假設,即以所掌握的數據信息為依據,歸納得出具有一般特征的結論。歸納推理是要在數據信息的基礎上透過偶然性去發現必然性。演繹推理是對統計認識能力的深化,尤其是在根據必然性去研究和認識偶然性方面,具有很大的作用。

          3.3深化對數據分析的認識

          任何統計研究都離不開數據分析。因為這是得到統計研究結論的必要環節。雖然統計分析的形式隨時代的推移而變化著,但是“從數據中提取一切信息”或者“歸納和揭示”作為統計分析的目的卻一直沒有改變。對統計數據分析的原因有以下三個方面:一是基于同樣的數據會得出不同、甚至相反的分析結論;二是我們所面對的分析數據有時是缺損的或存在不真實性;三是我們所面對的分析數據有時則又是海量的,讓人無從下手。雖然統計數據分析已經經歷了描述性數據分析(DDA)、推斷性數據分析(IDA)和探索性數據分析(EDA)等階段,分析的方法技術已經有了質的飛躍,但與人類不斷提高的要求相比,存在的問題似乎也越來越多。所以,我們必須深化對數據分析的認識,圍繞“準確解答特定問題并且從數據中獲取一切有效信息”這一目的,不斷拓展研究思路,繼續開展數據分析方法技術的研究。

          參考文獻:

          [1]陳福貴.統計思想雛議[J]北京統計,2004,(05).

          [2]龐有貴.統計工作及統計思想[J]科技情報開發與經濟,2004,(03).

          常用統計學方法分析范文第5篇

          目前,醫學統計學的很多原理和方法已成功地應用于這些新研究之中,并在此基礎之上有了新的發展和改進。如概率分布的知識與序列相似性分析、蛋白質分類等技術密切相關;方差分析、非參數檢驗方法經改進和結合后在基因表達數據的前期分析中發揮了較好的作用;而聚類分析、判別分析、相關分析這些大家所熟知的統計學方法更是在基因分類和調控網絡的建立中得到了廣泛的應用。在進行醫學統計學課堂教學時加入生物信息學方面的應用實例,不僅可以使學員了解本學科研究的前沿和醫學、生物信息學研究的新發展,還可以提高學員對于醫學統計學理論學習的興趣,掌握先進的生物實驗數據分析方法,提高今后從事醫學科研的能力。下面,本文在回顧醫學統計學授課主要內容的基礎上,就醫學和生物信息學中的可能應用舉例如下:

          一、概率分布

          概率分布(probabilitydistribution)是醫學統計學中多種統計分析方法的理論基礎。授課內容一般包括:二項分布、Possion分布、正態分布、t分布、F分布等。

          借助概率分布常常可以幫助我們了解生命指標的特征、醫學現象的發生規律等等。例如,臨床檢驗中計量實驗室指標的參考值范圍就是依據正態分布和t分布的原理計算得到;許多醫學試驗的“陽性”結果服從二項分布,因此它被廣泛用于化學毒性的生物鑒定、樣本中某疾病陽性率的區間估計等;而一定人群中諸如遺傳缺陷、癌癥等發病率很低的非傳染性疾病患病數或死亡數的分布,單位面積(或容積)內細菌數的分布等都服從Poisson分布,我們就可以借助Poisson分布的原理定量地對上述現象進行研究。

          在生物信息學中概率分布也有一定應用。例如,Poisson分布可以用于基因(蛋白質)序列的相似性分析。被研究者廣泛使用的分析工具BLAST(BasicLocalAlignmentSearchTool)能迅速將研究者提交的蛋白質(或DNA)數據與公開數據庫進行相似性序列比對。對于序列a和b,BLAST發現的高得分匹配區稱為HSPs。而HSP得分超過閾值t的概率P(H(a,b)>t)可以依據Poisson分布的性質計算得到。

          二、假設檢驗

          假設檢驗(hypothesis)是醫學統計學中統計推斷部分的重要內容。假設檢驗根據反證法和小概率原理,首先依據資料性質和所需解決的問題,建立檢驗假設;在假設該檢驗假設成立的前提下,采用適當的檢驗方法,根據樣本算得相應的檢驗統計量;最后,依據概率分布的特點和算得的檢驗統計量的大小來判斷是否支持所建立的檢驗假設,進而推斷總體上該假設是否成立。其基本方法包括:u檢驗、t檢驗、方差分析(ANOVA)和非參數檢驗方法。

          假設檢驗為醫學研究提供了一種很好的由樣本推斷總體的方法。例如,隨機抽取某市一定年齡段中100名兒童,將其平均身高(樣本均數)與該年齡段兒童應有的標準平均身高(總體均數)做u檢驗,其檢驗結果可以幫助我們推斷出該市該年齡段兒童身高是否與標準身高一致,為了解該市該年齡段兒童的生長發育水平提供參考。又如,醫學中常常可以采用t檢驗、秩和檢驗比較兩種藥物的療效有無差別;用2檢驗比較不同治療方法的有效率是否相同等等。

          這些假設檢驗的方法在生物實驗資料的分析前期應用較多,但由于研究目的和資料性質不同,一般會對某些方法進行適當調整和結合。

          例如,基于基因芯片實驗數據尋找差異表達基因的問題。基因芯片(genechip)是近年來實驗分子生物學的技術突破之一,它允許研究者在一次實驗中獲得成千上萬條基因在設定實驗條件下的表達數據。為了從這海量的數據中尋找有意義的信息,在對基因表達數據進行分析的過程中,找到那些在若干實驗組中表達水平有明顯差異的基因是比較基礎和前期的方法。這些基因常常被稱為“差異表達基因”,或者“顯著性基因”。如果將不同實驗條件下某條基因表達水平的重復測量數據看作一個樣本,尋找差異表達基因的問題其實就可以采用假設檢驗方法加以解決。

          如果表達數據服從正態分布,可以采用t-檢驗(或者方差分析)比較兩樣本(或多樣本)平均表達水平的差異。

          但是,由于表達數據很難滿足正態性假定,目前常用的方法基于非參數檢驗的思想,并對其進行了改進。該方法分為兩步:首先,選擇一個統計量對基因排秩,用秩代替表達值本身;其次,為排秩統計量選擇一個判別值,在其之上的值判定為差異顯著。常用的排秩統計量有:任一特定基因在重復序列中表達水平M值的均值;考慮到基因在不同序列上變異程度的統計量,其中,s是M的標準差;以及用經驗Bayes方法修正后的t-統計量:,修正值a由M的方差s2的均數和標準差估計得到。

          三、一些高級統計方法在基因研究中的應用

          (一)聚類分析

          聚類分析(clusteringanalysis)是按照“物以類聚”的原則,根據聚類對象的某些性質與特征,運用統計分析的方法,將聚類對象比較相似或相近的歸并為同一類。使得各類內的差異相對較小,類與類間的差異相對較大1。聚類分析作為一種探索性的統計分析方法,其基本內容包括:相似性度量方法、系統聚類法(HierarchicalClustering)、K-means聚類法、SOM方法等。

          聚類分析可以幫助我們解決醫學中諸如:人的體型分類,某種疾病從發生、發展到治愈不同階段的劃分,青少年生長發育分期的確定等問題。

          近年來隨著基因表達譜數據的不斷積累,聚類分析已成為發掘基因信息的有效工具。在基因表達研究中,一項主要的任務是從基因表達數據中識別出基因的共同表達模式,由此將基因分成不同的種類,以便更為深入地了解其生物功能及關聯性。這種探索完全未知的數據特征的方法就是聚類分析,生物信息學中又稱為無監督的分析(UnsupervisedAnalysis)。常用方法是利用基因表達數據對基因(樣本)進行聚類,將具有相同表達模式的基因(樣本)聚為一類,根據聚類結果通過已知基因(樣本)的功能去認識那些未知功能的基因。對于基因表達數據而言,系統聚類法易于使用、應用廣泛,其結果——系統樹圖能提供一個可視化的數據結構,直觀具體,便于理解。而在幾種相似性的計算方法中,平均聯接法(AverageLinkageClustering)一般能給出較為合理的聚類結果2。

          (二)判別分析

          判別分析(discriminantanalysis)是根據觀測到的某些指標的數據對所研究的對象建立判別函數,并進行分類的一種多元統計分析方法。它與聚類分析都是研究分類問題,所不同的是判別分析是在已知分類的前提下,判定觀察對象的歸屬3。其基本方法包括:Fisher線性判別(FLD)、最鄰近分類法(k-NearestNeighborClassifiers)、分類樹算法(ClassificationTreeAlgorithm),人工神經網絡(ANNs)和支持向量機(SVMs)。

          判別分析常用于臨床輔助鑒別診斷,計量診斷學就是以判別分析為主要基礎迅速發展起來的一門科學。如臨床醫生根據患者的主訴、體征及檢查結果作出診斷;根據各種癥狀的嚴重程度預測病人的預后或進行某些治療方法的療效評估;以及流行病學中某些疾病的早期預報,環境污染程度的堅定及環保措施、勞保措施的效果評估等。

          在生物信息學針對基因的研究工作中,由于借助了精確的生物實驗,研究者通常能得到基因(樣本)的準確分類,如,基因的功能類、樣本歸結于疾病(正常)狀態等等。當利用了這些分類信息時,就可以采用判別分析的方法對基因進行分類,生物信息學中又稱為有監督的分析(SupervisedAnalysis)。例如,基因表達數據分析中,對于已經過濾的基因,前三種方法的應用較為簡單。而支持向量機(SVMs)和人工神經網絡(ANNs)是兩種較新,但很有應用前景的方法。

          (三)相關分析

          相關分析(correlationanalysis)是醫學統計學中研究兩變量間關系的重要方法。它借助相關系數來衡量兩變量之間的關系是否存在、關系的強弱,以及相互影響的方向。其基本內容包括:線性相關系數、秩相關系數、相關系數的檢驗、典型相關分析等。

          我們常常可以借助相關分析判斷研究者所感興趣的兩個醫學現象之間是否存在聯系。例如,采用秩相關分析我們發現某種食物中黃曲霉毒素相對含量與肝癌死亡率間存在正相關關系;采用線性相關方法發現中年女性體重與血壓之間具有非常密切的正相關關系等等。

          生物信息學中可以利用相關分析建立基因調控網絡。如果將兩個不同的基因在不同實驗條件下的表達看作是兩個變量,相關分析所研究的正是兩者之間的調控關系。如采用線性相關系數進行兩基因關系的分析時,其大小反應了基因調控關系的強弱,符號則反應了兩基因是協同關系(相關系數為正),還是抑制關系(相關系數為負)。

          四、意義

          生物信息學不僅是醫學統計學的研究前沿,更是醫學研究由宏觀向微觀拓展的重要領域,其研究內容已逐漸為多數醫學院校的學員了解和熟悉。而如何對新技術產生的生物實驗數據進行準確合理的分析,卻成為生物信息學研究的主要瓶頸之一。