首頁 > 文章中心 > 數據可視化

          數據可視化

          前言:想要寫出一篇令人眼前一亮的文章嗎?我們特意為您整理了5篇數據可視化范文,相信會為您的寫作帶來幫助,發現更多的寫作思路和靈感。

          數據可視化

          數據可視化范文第1篇

          關鍵詞:大數據時代;可視化;應用領域

          引言

          在大數據時代來臨之際,不僅僅伴隨著發展的機遇,同時也伴隨著發展的調整。現如今對數據的應用十分廣泛,然而人們對數據的理解并不是十分正確與統一,沒有一定的標準容易出現混亂的情況。人們無法全方位的掌握數據的綜合信息,更加無法徹底的利用數據為發展服務,因此對大數據時代下對數據可視化的應用進行研究是十分有必要的。

          1.數據可視化的發展

          15世紀被認為是可視化發展的起源,天文學、繪圖學等都快速發展,實現了對未知世界的探索與追求;18世紀時期數據圖形開始出現,可視化的表達方式變的更加多樣,包括地圖、統計圖等等。20世紀中期至今為止,由于電子計算機的出現給時代的發展帶來了巨大的變化。計算機與數據分析之間存在密切的聯系,高分辨率的圖像與交互式圖形分析都是使用傳統手繪圖根本無法實現的。在計算機技術與數據可視化融合之后,統計計算工具、圖形軟件工具等應運而生。

          2.數據可視化的流程

          2.1原始數據的轉換

          原始數據轉換主要分為以下幾個步驟:1)獲取數據。數據可以從計算機本地獲取,也可以從互聯網上獲取。2)數據分析。應用結構圖表的方式來將數據的意義表示清楚,同時按照一定的類別順序進行排列,進而將數據的意義變得一目了然。在分析完數據后進行過濾工作是十分關鍵的。3)數據過濾。將有價值的數據過濾留下來,將無用的多余的數據刪除。降低數據處理量也是提升數據質量的重要方式之一,其能夠有效的改善數據的精準度。4)挖掘。應用數據挖掘的方式來對數據格式進行分析,亦或是將數據與數學環境相聯系,從海量數據中獲得一定的規律,進而給數據表達提供有意義的材料。原始數據的轉換過程可以簡單,也可以復雜,這主要受到需要處理的數據的類型與復雜程度的影響[1]。

          2.2數據的視覺轉換

          數據的視覺轉換主要包括了表示與修飾兩個階段。表示,主要就是選擇基礎的視覺模型將其表現出來,即為視覺設計草圖。表示這一步驟基本上確定看數據可視化的視覺效果。在選擇表示方式的過程中還要結合數據的維度來選擇合適的表現方式,例如可以選擇樹狀、列表等。這一步驟也是數據的轉換前后的審查與檢驗。尤其是數據的獲取與過濾工作。因此可以看出,表示是數據可視化中十分關鍵的步驟。

          3.數據可視化的適用范圍

          3.1思維導圖

          思維可視化已經廣泛被應用在教學、互聯網等需要進行邏輯分析與思路研究的工作淋雨中。例如在設計過程中普遍使用的思維導圖,能夠幫助人們通過發散性思維來解決問題。與知識可視化相似,如果在知識中加入了主觀的意識與見解,就會被賦予思想的含義,而這種思維意義的知識又形成了一種新型的能夠被人理解與傳播的知識。思維導圖能夠將數據庫中的數據進行分類并且展現出來。通過思維導圖可以將所有的相關數據展現出來,讓用戶第一時間獲得相關的數據以及數據彼此之間的聯系,這樣對于用戶對于整體數據都有了更加整體的認識與了解,從而推動工作的順利進行[2]。

          3.2新聞報道

          數據新聞能夠讓新聞工作者通過信息圖表來將報道復雜的新聞事件。通過數據可視化能夠讓我們準確的了解周圍的數據。這種對于數據能夠幫助人們進行更加準確決定的行為受到了歡迎。只有數據可視化存在一定的交互性時,數據可視化才是真正可行的。所以,數據可視化不僅僅要保證設計良好,同時還要做到簡潔方便,易被人接受。數據可視化能夠在表現新聞事實、表達評論觀點的過程中起到容易被受眾理解的作用,同時也具有貼近性。新聞報道不單單要報道新聞事實,同時還能夠大力收集新聞信息,向受眾反饋信息。在互聯網信息時代,新聞工作者可以通過微博、新聞論壇等多種方式來獲得受眾的反饋信息。然而這類的反饋信息沒有相對應的針對性。而在數據可視化過程中部分可視化工作能夠改善反饋信息與新聞無法融合的關鍵問題。互動性圖表不僅僅能夠與受眾開展互動,發掘受眾背后的故事,同時還能夠對信息進行分析,得出受眾對信息感興趣的細節,幫助媒體不斷發現受眾的需求。另外在收集受眾意見的過程中,可以讓新聞工作者將其轉化為有效的新聞之一,作為新聞報道的延伸與深化。

          3.3界面交互

          數據可視化的最后一個步驟就是對最終呈現的界面進行設計。在這一過程中用戶扮演的角色出現改變,其能夠對界面進行設計,轉換數據的處理方式,將被動接受信息轉為主動融合信息,分析信息。界面交互是信息分析、用戶決策聯系最為緊密的過程。心智模型與概念模型在界面交互的過程中被廣泛應用。界面交互的可用性與用戶感受是判斷界面交互的重要標準。在界面交互過程中首先要注意對數據的篩選,其所指篩選并非將無價值信息過濾掉,而是由于要展現的數據量十分大,也不需要同時全部展現,因此要兼顧到可視化的目標。包括潛在的目標用戶,要凸顯重要的信息,提供一個可以進行深層次范圍的入口,引導用戶來滿足其個性化需求。其次,在界面交互中不僅僅為了美觀而設計美觀,讓形式成為內容的主導,而是要重視形式是內容表現的原則[3]。例如信息需要通過視覺元素來表現,額可以通過圖形、圖標或照片進行,如何能夠將信息更加準確的表現出來才是最為重要的。數據可視化的界面可以分為兩種類型,包括交互操作與元素直接進行以及需要借助界面上工具進行。交互操作與元素直接進行即為界面與內容融合在一起,用戶在操作過程中更多的關注與元素之間的互動,融入感更加強烈。而需要借助界面上工具進行,與元素之間不便進行直接操作,或者是在用戶的使用習慣中尚未形成交互的操作模式。

          4.結束語

          伴隨著網絡技術的不斷成熟與發展,由量變轉換為質變的大數據時代已經到來。全世界用戶對傳感數據的使用量顯著上升,對數據挖掘分析工作的進步對于時代的發展有著不可忽視的重大意義。在用戶對數據分析與數據可視化需求增長的過程中,用戶對數據可視化的需求會更加強烈。一般用戶也會主動或被動的參與到數據可視化的建設過程中來,從將用戶所需的數據更加準確的呈現出來,從而讓數據能夠幫助用戶做出更加準確的決策。(作者單位:湖南師范大學)

          參考文獻:

          [1] 黃墨樵.論大數據時代下文化遺產數據的可視化――以故宮數字沙盤為例[J].博物館研究,2014,(04):87-93.

          [2] Viktor Mayer-Schonberger,Kenneth Cukier.Big Data:A Revolution That WillTransform How We Live[M].London:John Murray,2013:10-13

          數據可視化范文第2篇

          【關鍵詞】信息可視化技術 地理空間元數據 因素

          1 信息可視化和地理空間元數據的概念

          1.1 信息可視化

          信息可視化是個統稱,它包括了多方面的內容,有數據、知識可視化、信息圖形學等方面,具體是指不論通過動態或者靜態的方式,從呈現的圖標、文字等方面研究尋找問題的答案。它主要是創建一些直觀的表達手法來展現一些抽象的理念和知識,方便用戶理解,以便獲得內在的信息和引發新的思考,對問題有新的解決之道。

          1.2 地理空間元數據

          元數據目前的定義諸多,都有其立腳點。有的認為元數據是對數據的一種描述,對數據進行的總體的提煉的解釋和概括。有的認為它是一種機制,是描述說明數據集成的其他形式。還有的認為它是對地理數據的收集整理、標識數據的質量等方面的數據。還有其他的一些觀點,都有其道理,定論不一,但在不同的方面有不同的適用價值。而地理空間元數據地理空間數據的集合,它其中還包括了信息資源的描述相關信息,可以概括空間特征。

          2 地理空間元數據可視化的影響因素

          地理空間元數據可視化的功能對用戶是便捷有利的,但是不同的設備、不同的用戶、不同的目的所需要的可視化的功能不可能一致,這需要因時因地設計。地理空間元數據可視化的設計有下列的影響因素:

          2.1 目標要求

          地理空間元數據可視化服務的是用戶,所以要滿足用戶的目標需求。用戶的不同需求,使元數據的主要內容和關鍵點不同,對信息的傳送內容也不同,最終在可視化下,它的表現形式、搜索的刪選化程度、應用的版式都會不同,用戶的感官獲取的感受和接收的程度會受到影響。進一步目標要求會影響用戶的滿意度,用戶評價的依據較為注重數據的真實可靠性,實用性,還有準確度等方面,此外還有數據獲取的成本以及便捷程度,用戶也會考量。

          2.2 用戶

          地理空間元數據的服務對象,大部分用戶是GIS應用程序的用戶,用戶的范圍廣,從事各行各業,對地理空間元數據可視化的要求也是眾口難調,不同的人有不同的具體的要求。并且地理空間元數據的使用者除了這些用戶,還包括了元數據的開發者、管理者,他們也會使用元數據,還會定時檢測元數據,查看用戶滿意度以及建議,進行修改和重新設計,不斷的更新數據。

          3 可視化技術的分類

          3.1 單要素的可視化技術

          單要素的可化技術顧名思義,一個元素為主導。他具體指方法為單一的的表現形式,如用圖形、文字、或者其他的方法中的一種。其中圖形因為其直觀、簡單的反映信息的特點,應用相對廣泛。例如二維數據通常用散點圖標識,非常簡單直接的從圖形上可以分辨出兩種要素的關系,線性關系或非線性關系。如果元素超過兩個,可以采用顏色進行區分,也十分鮮明直觀。單要素的形式還是較為多樣化的,可以根據用戶的需要進行選擇,選擇合適的方法進行分析數據,獲得信息。

          3.2 多要素的可視化技術

          通常情況下數據的產生是由多種因素共同影響的作用,這時分析原因或者結果,就不能采用單要素的可視化技術,無法滿足現實的需求。地理空間元數據可視化多要素分析就應運而生了,它可以反映三個及三個以上的元數據要素的影響。這種可以較為完整分析因素對數據的影響,不會遺漏重要的因素。這種多要素可視化技術又可以分為多維可視化、圖標顯示技術、層次可視化技術。三種方式雖然有區別,但是總體上來看,圖形應用的比較多。樹狀圖、散點圖矩陣、雙曲線樹等都可以有效表現多因素的相互關系,而且相較于文件,更為直觀、簡單、簡潔明了。用戶也可以根據突出的重點內容不同選用不同的圖形,這樣不僅可以表現因素之間的相互關系,相互作用,還可以突出重點因素,有利于用戶快速把握重點信息,提取重點,可以更快速的解決問題。

          4 小結

          地理空間元數據可視化在現代的應用十分廣泛,如同數據庫一般,是個十分有效的解決問題的方法。而現階段的地理空間元數據可視化在信息可視化下,有一定的發展,也有一定的影響因素,用戶的不同目標也阻礙了它的發展,無法全面的普及市場。但是可視化的前景是廣大的,現代信息技術的發展會推動它的發展前進,人們的日常生活工作會逐漸適應這種方法的使用,也需要這種方法的幫助分析問題。

          參考文獻

          [1]李翠.Web前端地理數據可視化技術研究與實踐[D].華東師范大學,2016.

          [2]宋國民,吳軍珂,黃麗華,徐少坤.基于平行坐標的地理空間元數據可視化檢索研究[J].測繪工程,2015(05):1-4.

          [3]宋國民,于曉彭,羅奮勇,徐少坤.雙曲線樹在地理空間元數據可視化檢索中的應用研究[J].測繪科學技術學報,2014(03):300-304.

          [4]徐少坤,宋國民,王海葳,趙海見,陳令羽.地理空間元數據可視化設計及關鍵技術研究[J].測繪工程,2014(04):45-50.

          [5]潘立武.基于地理信息系統技術的潰壩洪水三維可視化研究[J].北京聯合大學學報,2013(04):19-23.

          [6]周光堯.基于觀測對象的地理空間信息頻度統計及可視化[D].中國科學院大學(工程管理與信息技術學院),2013.

          [7]楊靜飛,張強.基于地理信息可視化的空間認知研究[J].測繪與空間地理信息,2013(07):12-14.

          [8]張小諾,王宇,李宏偉,白天路,王建鵬.基于三維可視化技術的電廠地理信息系統設計與應用[J].工程勘察,2013(07):63-67.

          [9]徐少坤,宋國民,王海葳,陳令羽.基于信息可視化技術的地理空間元數據可視化研究[J]. 測繪工程,2013(03):83-87.

          [10]徐少坤.地理空間元數據可視化研究與實踐[D].信息工程大學,2013.

          [11]劉芳.信息可視化技術及應用研究[D].浙江大學,2013.

          [12]徐少坤,宋國民,陳令羽,王海葳.多維可視化技術在地理空間元數據檢索中的應用研究[J].地理信息世界,2013(01):46-50.

          數據可視化范文第3篇

          關鍵詞:三維環境矢量數據 可視化 數據匹配 坐標轉換

          中圖分類號:P208 文獻標識碼:A 文章編號:1674-098X(2014)08(b)-0094-01

          1 研究現狀

          從地圖學發展過程來看,二維GIS發展成熟,在數據結構、存儲、管理、空間查詢及分析等方面具有無可比擬的巨大優勢。而三維GIS在人機交互,實時渲染等方面有很好的效果。但兩者皆有其缺點,二維GIS由于其符號的抽象性,無法表現出逼真的的地形環境,三維GIS出現時間短,發展不夠完善,不能夠實現較高層次的信息查詢,基于拓撲關系的分析及相關屬性方面的管理,目前,將二維GIS強大功能和三維GIS直觀顯示進行有機結合主要有以下三種模式:

          (1)二三維切換模式。

          (2)二三維聯動模式。

          (3)基于緊密型二三維結合GIS。

          2 矢量數據可視化分析

          2.1 矢量數據可視化符號論基礎

          在傳統二維地圖上,視覺變量包括形狀、尺寸、亮度、密度、色彩,而到了三維環境中,視覺變量有了新變化。三維地圖符號的視覺參量與二維地圖符號的視覺參量存在差異,由狀態、動態變化和操作3個方面的視覺參量組成。狀態方面的參量與平面地圖的靜態視覺參量類似,然而,由于表達手段、技術的不同,參量描述與傳統靜態視覺參量也略有差異,主要包括形狀、尺寸、色彩、亮度、紋理、空間造型等6個方面的參量。

          2.2 二維環境與三維環境的差異

          傳統二維平面地圖的認知方式是通過對地圖的閱讀獲取關于地理實體的位置、大小、距離、方向、相互關系等空間信息,主要運用表象形式進行編碼和解譯。使用地圖時,讀者對空間信息的定位是使用外部參考框架,方向固定,。二維地圖是對地理空間的簡化和再現,然而二維平面地圖不夠生動;用戶對二維地圖的認知主要依靠人的視覺;VR技術在空間信息可視化中的應用為我們提供了一種新的認知環境――虛擬地理環境,是地圖在數字化時代的延伸和拓展, 是數字地圖支持下的一種新的空間認知工具。具體說來,三維環境與二維環境有如下幾個方面的不同。

          (1)投影方式不同,把三維場景中圖形顯示到二維平面多進行透視投影,而在二維場景中,一般只是進行簡單的正交投影即可。

          (2)繪制引擎不同,二維場景繪制時一般只要用GDI或GDI+二維引擎即可,而三維場景繪制時多采用OpenGL、OSG、D3D等三維引擎。

          (3)漫游方式不同,在二維場景中,只能進行簡單的近大遠小縮放和上下左右漫游,到了三維場景中,觀察方式變得更加豐富,如可以進行翻轉、旋轉等。

          (4)應用環境不同,二維環境多應用于二維GIS或二維電子地圖顯示,三維場景多應用于三維GIS或逼真的虛擬環境表達。

          (5)坐標系不同,二維環境中使用的X-Y坐標,三維環境中使用X-Y-Z坐標;

          (6)數據模型不同,二維環境中多使用矢量數據和柵格數據,三維環境多使用DEM與紋理。

          正因為兩者環境存在差異,將矢量數據在三維環境中可視化必須解決二三維環境下一體化的問題,如坐標的轉換問題、數據匹配問題等。

          2.3 矢量數據可視化圖形學基礎

          計算機圖形學為我們在理論上提供了大量的算法理論,具體包括以下幾點。

          (1)線型生成技術為線狀要素建模提供了有力支撐。

          計算機圖形學中的平行線生成算法、虛線生成算法可以為線狀要提供很好的借鑒作用,規則曲線和自由曲線生成為線狀要素顯示提供了很大幫助。

          (2)面域填充算法為面狀要素建模提供了很好的思路。

          面域填充算法包括掃描線填充算法、種子填充算法、圖案填充算法等,尤其是圖案填充算法為面狀要素建模提供了很好的算法基礎。

          (3)幾何變換特別是三維圖形幾何變換為矢量數據在三維場景中的顯示起了很大作用。

          2.4 矢量數據可視化思路

          由前面的符號論分析可知,二維地圖符號在三維可視化過程中并未過時,相反,還對三維符號發展起到借鑒作用,二維地圖符號在三維環境下仍然可以使用;同時三維環境下地圖視覺變量有了新的變化,如增加了紋理、空間造型等,這也啟示我們可以在三維環境下使用新的視覺變量,比如,使用紋理進行矢量地圖符號建模。

          二維與三維環境存在差異,在認知上,二維環境相對于三維環境而言,不夠生動,缺乏進入感等,這也是將矢量數據在三維環境中進行可視化的必要性。二三維環境的主要差異有投影方式、漫游方式、坐標系及數據模型,投影方式不同會導致顯示效果不同,漫游方式不同會導致符號繪制后不同視角會有不同的顯示,如圖1所示,各類符號在不同視角下顯示有明顯不同,以視點逼近為例,點狀符號將逐漸占據整個屏幕;同樣,線狀符號不同線型之間距離拉大;面狀符號隨著視點的變化其內部填充的圖案也變得十分稀疏;這些變化都影響了人的空間認知,而這都是可視化需要解決的問題;坐標系不同則必須要考慮統一坐標系,以及不同坐標下的坐標轉換;數據模型的不同則還需要考慮數據模型的匹配問題。

          計算機圖形學提供了大量的成熟的算法和理論知識,可以為符號建模、要素顯示提供思路,OSG的強大功能可以減少工作量。

          綜上所述,矢量數據可視化思路如下。

          (1)綜合運用各種視覺變量,實現點狀要素、線狀要素、面狀要素建模。

          (2)根據圖形學相關算法,解決地圖符號在三維環境中的應用問題。

          (3)利用相關技術(如RTT技術),解決各要素在不同三維場景中的匹配問題,如三維平面,三維球面,三維地形。

          參考文獻

          [1] 危擁軍.二維地圖與三維可視化的關系[J].測繪科學技術學報,2007(12).

          [2] 徐智勇.三維地圖符號視覺參量研究[J].武漢大學信息學報,2006(6).

          數據可視化范文第4篇

          【關鍵詞】 生物大數據 大數據可視化 發展趨勢

          在以往的10余年中,生命科學的各個領域得到了快速的增長,并且累積了海量的數據信息。海量的數據信息類型多樣,數量驚人,擁有巨大的潛在價值。如果采用傳統的處理方式來對海量數據進行處理不僅僅需要大量的人力、物力投入,而且還會使得失誤率大大提升。在這一情況下,生物大數據可視化技術應運而生。

          一、大數據及其技術

          大數據是一種區別于傳統意義的研究模式,其與傳統模式中以個別案例作為研究對象的方式不同,其需要使用大規模的數據來開展研究。大數據最為顯著的特征就是包括:1)海量數據。伴隨著信息技術的進步,2009-2012年在醫學領域有數以千百萬計的患者的病歷并采用電子格式保存[1]。電子病歷形式的數據給予了利用大量患者數據開展醫學研究的機會。2)類型多樣。基因測序技術在細胞領域的各個層面都形成了組學系統。同時,很多數據都是呈現非結構化的狀態,給醫療信息化的進步帶來了巨大的空間;3)形成速度快。當前大數據的增長數據依然處于持續增加的狀態中。在臨床醫學領域中,預計2019年采用電子病歷形式存儲的患者將會增加10倍。

          二、生物大數據應用

          生物大數據不僅僅擁有大數據的特點,而且同時還擁有生物數據的特征,生物大數據擁有數據量大、數據多樣化、數據價值高等重要特征。就當前生物大數據的應用狀況來看,生物大數據的應用有待進一步的深入開發,根據生物大數據的上述特征,其能夠在醫療健康、農業領域、食品健康領域得到廣泛的應用。

          三、生物大數據可視化的現狀

          1、測序數據。測序數據能夠將被比對至基因組中的所有數據類型通過圖像的形式顯現出來。其對于基因組數據展示模式大部分現存瀏覽器的相同特征:1)將染色置作為索引的基因組數據視圖;2)以參考基因組為標準提供位置坐標軸;3)優越的交互性與可定制性,可以根據不同需求來隱藏或裝載相關內容[2]。

          2、分子結構數據。結構分子生物是物理、化學與生物學緊密聯系的重要學科,其主要關注3D與4D復雜形狀與功能關系的探索,成像捕捉、顯微觀察等技術給其研究工作提供了直觀的視圖數據。例如,軟件Para View在使用過程中,使用者可以利用其通過定性預定量的方式選取大海量的數據快速建立三維視圖模型,并且可以從隨意一個角度來進行分子的結構進行細致觀察。蛋白質等類型大分子結構十分復雜,其內部的位置關系與詳細情況需要海量的運算空間,所以三維視圖軟件的使用相對于二維軟件來說需要更加強勁的算法設計,因此軟件的硬件設備也需要相應的提高,以支持軟件的運算。為了全面提升海量數據的處理能力,Para View可以使用分布式存儲計算資源,能夠在超級計算機中來進行運算,從而實現可視化。

          3、臨床數據。雖然電子病歷的普及范圍是在不斷擴大,然而非統一的標準以及非結構化的數據模式對于獲取患者資料有著一定的阻礙[3]。鑒于改善這一問題,Flatiron技術建立Oncology Cloud就能夠歸納整理來自多渠道的患者詳細信息與患者恢復情況,并且還可以對數據集進行分類研究。醫生不單單可以利用Oncology Cloud搜索到同類病人的治療結構,還可以實時搜索到以往不同治療方式下不同的療效。又例如,Chimera軟件可以將分子結構、序列對比、軌跡等數據整合起來,以形成高質量的動畫效果。另外,針對臨床數據的可視化軟件還包括能夠實現核小體定位與組蛋白分析的可視化等。

          四、生物大數據可視化新技術展望與挑戰

          首先,在目前擁有的海量數據中存在著大量的冗余,因此在未來的生物大數據可視化技術發展趨勢中可以將數據分類歸納,采用統一的規格來進行存儲,降低數據存儲與處理的成本,提升數據的易用性。其次,由于生物大數據都是位于不同的研究機構的,因此可以建立相關的通信協議,在通信協議的支持下可以實現同一界面對異地數據的可視化。最后,生物大數據的多樣性與海量性給數據挖掘帶來了巨大的困難,為了提升生物大數據的挖掘,在實現生物大數據可視化的過程中要在保證實用性的基礎上提升軟件的人性化水平,兼顧到使用者的體驗感,提供更加友好的人機交互界面。

          五、結束語

          生物大數據可視化工作種類多樣,針對不同需求有不同的工具來實現可視化。基于更徹底、更好的挖掘有效數據,生物大數據可視化工具的開發趨勢已經朝著擁有統計分析功能的一站式集成軟件發展。伴隨著科技的進步,未來的生物大數據可視化工具將會更加人性化、更加美觀、更加實用。

          參 考 文 獻

          [1]周琳 , 孔雷 , 趙方慶.生物大數據可視化的現狀及挑戰[J].Science Bulletin, 2015, (Z1):547-557.

          數據可視化范文第5篇

          在對社會、經濟、技術系統的認識過程中,都需要收集和分析大量表現系統特征和運行狀態的指標數據信息。例如,要衡量一個地區的經濟發展,需要觀測的指標有:地區生產總值、勞動生產率、稅收、人均GDP等;要衡量一個城市的綜合發展水平也需要觀測很多指標,如:工業總產值、非農業人口數、人均住房面積、工資總額、城鄉居民儲蓄率等等,在科研、生產、日常生活中,受多種指標共同影響和作用的現象是大量存在的,舉不勝舉。

          這類原始數據集合往往由于樣本數量巨大,刻畫系統特征的指標變量眾多,并且帶有動態特性,形成規模宏大、復雜難辨的數據海洋。如何分析和認識高維數據集合中的內在規律性,簡明扼要地把握系統的本質特征;如何對高維數據集合進行最佳綜合,迅速將隱沒在其中的重要信息集中提取出來;如何充分發掘數據中的豐富內涵,清晰地展示系統結構,準確地認識系統元素的內在聯系,以及直觀地描繪系統的運行歷程,這些是科學決策和決策支持系統建立的基礎,是決策者做出科學決策的根據。

          在數據信息的分析過程中,對直觀圖像的觀察是一種重要的分析手段,它可以更好地協助系統分析人員思維與判斷,及時發現大規模復雜數據群中的普遍規律與特殊現象,大大提高數據信息的分析效率。在當今的決策支持系統理論與方法的研究中,將抽象空間或高維不可見空間中的信息以及一些更復雜的現象轉換成直觀的平面圖示,這種面思維的工作方式,能夠極大地提高決策人員的洞察能力和增加決策者的知識,是實現決策支持系統高效率的最佳途徑之一。

          ■ 可視化方法改進后的優長

          在統計分析過程中,由于分析人員盡可能周到地選取有關指標,建立的指標體系中往往會出現信息重疊的現象。信息重疊的危害表現在:一方面會使傳統的最小二乘回歸分析失效,另一方面在分類或聚類過程中會過分地夸大某個指標在系統分析中的作用,出現“大數吃小數”現象,以致影響分析的客觀性,妨礙決策者的正確判斷。

          為了解決上述問題,往往對指標系統進行簡化處理,有一個特殊情況尤其引起人們的關注:如果能將一個p維指標系統有效地降至二維就可以在平面上描繪每一個樣本點,以直接觀察樣本點或指標之間的相互關系及樣本點間的分布特點和結構。所以主成分分析使高維數據點的可見性成為可能。概括地講,主成分分析是一種對多指標系統進行簡化的方法,它能夠在保證數據信息損失最小的前提下,對高維數據集合進行降維處理,揭示系統的主要因素。特別是當高維數據降為二維時,可以在平面圖上描繪系統指標的相互關系,使高維復雜系統具有可見性,大大提高決策者的洞察能力和分析效率。提取的主成分指標盡管多于三個,但是主成分指標之間幾乎不相關,因此可以用雷達圖來彌補主成分可視化的不足,主成分分析及雷達圖內容多數教材都有詳細介紹,在此不予贅述。以提取的主成分指標代替原始指標繪制雷達圖,便可將高維數據降維可視化。

          下面的內容便是筆者科研項目的結果,從最終的結果來看,這種改進的可視化方法效果明顯改善。采用綜合評價指標對全國35個中心城市的綜合發展水平進行評價,選取了包括兩個方面的15個具體指標,分別是非農業人口、 工業總產值、貨運總量、批發零售貿易餐飲業網點數、批發零售貿易餐飲業人數、 財政收入、城鄉居民年底儲蓄余額、職工人數、工資總額、人均居住面積、城市煤氣普及率、人均公共綠地面積、人均擁有鋪裝道路面積、人均公共綠地面積和每萬人擁有公共廁所數,分別記為X1,X2,⋯,X15。其中前9個指標為社會經濟指標,后6個指標為城市公共設施水平指標。調用SPSS中因子分析程序,對15個指標的原始數據進行標準化、同趨化處理,最終得到四個主成分指標:F1 ――城市規模及經濟發展水平指標, F2――城市基礎設施水平指標,F3――煤氣公因子,F4――城市公共衛生指標(見下表)。

          從下圖看出,城市A幾乎在各個公因子上的得分都是最大值,A城市對應的雷達圖面積在全國城市中也位居前列,因此說明A城市的綜合發展水平在全國處于領先地位。B城市雖然在F1、F2、F3上的得分很高,其對應的雷達圖面積也較大,但B城市在城市基礎建設上的得分較低,因此B城市在城市建設時需要在基礎建設方面加強力度。C城市在各公因子上的取值、對應的雷達圖面積都處于中等地位,因此兩城市在全國屬于中等發達城市。為跨入全國發達城市行列,兩城市各方面都需加快發展。D城市的四個公因子取值都是35個城市中最小或者接近最小的,其對應的雷達圖面積也是最小的,因此可以認為D城市是不發達城市。D城市需在各方面加快發展才能趕上其它城市的發展速度,由于F1(城市規模及經濟發展水平公因子)的方差貢獻最大,F1是城市發展水平的主要代表方面,因此在經濟能力受限條件下,D城市應該集中主要精力加快城市規模及經濟方面的發展,從而帶動其他方面的發展,這也是抓住了工作的重心。

          ■ 需要注意把握的問題

          1.由于提取的主成分對原始數據信息的貢獻不同,因此可以根據方差貢獻率將雷達圖對應的圓按比例劃分。一般情況下不需要使用所有的主成分繪制雷達圖,只需選取前幾個方差貢獻較大的主成分即可,并結合因子分析對主成分重新命名。