版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
*
緒論1.1什麼是人機交互
*
資訊技術的高速發展對人類生產、生活帶來了廣泛而深刻的影響。“上網衝浪”、“數碼相機”、PDA、“優盤”、“彩屏手機”、“藍牙技術”等新產品、新概念層出不窮,不斷衝擊著人們的視聽。這些高科技成果為人們帶來便捷、快樂的同時,也促進著人機交互技術的發展。作為資訊技術的重要內容,人機交互技術比電腦硬體和軟體技術的發展要滯後許多,已成為人類運用資訊技術深入探索和認識客觀世界的瓶頸。因此,人機交互技術已成為21世紀資訊領域亟需解決的重大課題,引起了世界許多國家的高度重視。*
在美國21世紀資訊技術計畫中,將軟體、人機交互、網路、高性能計算列為基礎研究內容。美國國防關鍵技術計畫也把人機交互列為軟體技術發展的重要內容之一。 我國“973”計畫專案“虛擬現實的基礎理論、演算法及其實現”中,將虛擬環境的真實感知與自然交互理論與方法作為資訊技術中需要解決的關鍵科學問題。*
人機交互(Human-ComputerInteraction,HCI)是關於設計、評價和實現供人們使用的互動式電腦系統,且圍繞這些方面主要現象進行研究的科學(ACMSIGCHI,1992,第6頁)。狹義的講,人機交互技術主要是研究人與電腦之間的資訊交換,它主要包括人到電腦和電腦到人的資訊交換兩部分。
對於前者,人們可以借助鍵盤、滑鼠、操縱杆、數據服裝、眼動跟蹤器、位置跟蹤器、數據手套、壓力筆等設備,用手、腳、聲音、姿勢或身體的動作、眼睛甚至腦電波等向電腦傳遞資訊;對於後者,電腦通過印表機、繪圖儀、顯示器、頭盔式顯示器(HMD)、音箱等輸出或顯示設備給人提供資訊。*
它涉及到電腦科學、心理學、認知科學和社會學以及人類學等諸多學科,是資訊技術的一個重要組成部分,並將繼續對資訊技術的發展產生巨大的影響。
人機介面(Human-MachineInterface,HMI)作為電腦系統的重要組成部分,主要是指人類與電腦系統之間的通信方式,它是人機雙向資訊交換的支持軟體和硬體。交互設計(InteractionDesign)指的是“設計支持人們日常工作與生活的交互產品”,具體的講就是關於創建新的用戶體驗的問題,其目的是增強和擴充人們工作、通訊及交互的方式。
*1.2人機交互與其他學科的關係人機交互技術與認知心理學、人機工程學、多媒體技術和虛擬現實技術密切相關。其中,認知心理學與人機工程學是人機交互技術的理論基礎,而多媒體技術和虛擬現實技術與人機交互技術相互交叉和滲透,其關係如圖1-1所示。*多媒體技術虛擬現實技術認知心理學人機工程學圖1-1人機交互與其他相關學科的關係人機交互技術*1.2.1認知心理學認知心理學(CognitivePsychology)是20世紀50年代中期在西方興起的一種心理學思潮,在20世紀70年代成為西方心理學的一個主要研究方向。它研究人的高級心理過程,主要是認識過程,如注意、知覺、表像、記憶、思維和語言等,從心理學的觀點研究人機交互的原理。該領域研究包括如何通過視覺、聽覺等接受和理解來自周圍環境的資訊的感知過程,以及通過人腦進行記憶、思維、推理、學習和解決問題等人的心理活動的認識過程。其中人腦的認知模型——神經元網路及其模型,已經成為新一代電腦、人工智慧等領域中最熱門的研究課題之一。認知心理學在人機介面設計方面具有非常重要作用,是人機交互技術的重要理論基礎。*1.2.2人機工程學人機工程學是運用生理學、心理學和醫學等有關知識,研究人、機器、環境相互間的合理關係,以保證人們安全、健康、舒適地工作,從而提高整個系統工效的新興邊緣科學。在人機介面學處於初創和奠基階段的時候,人機工程學是最活躍、最主要的分支,曾經對人機介面學的發展做出過很大的貢獻。經典的人機工程學稱為硬體人機工程學,主要集中在對人體能力、人體限制及其他與設計相關的人體特性資訊的應用,以滿足設計、分析、測試與評價、標準化,以及系統控制的要求。軟體人機工程學(SoftwareErgonomics)研究軟體和軟體介面,側重於運用和擴充軟體工程的理論和原理,對軟體人機介面進行分析、描述、設計和評估等。*
主要解決有關人類思維與資訊處理的有關問題,包括設計理論、標準化、增強軟體的可用性的方法等,使軟體(電腦)與人的對話能夠滿足人的思維模式與數據處理的要求,實現軟體的高可用性。同認知心理學一樣,人機工程學也是人機交互技術的重要理論基礎。*1.2.3多媒體技術一般的,多媒體技術是指將正文、聲音、圖形、靜止圖像、動態圖像等與計算集成在一起的技術。多媒體技術通過引入動畫、音頻、視頻等動態媒體,大大豐富了電腦表現資訊的形式,拓寬了電腦輸出的帶寬,提高了用戶接受資訊的效率,使人們可以得到更直觀的資訊,從而簡化了用戶的操作,擴展了應用範圍。多媒體資訊在人機交互中的巨大潛力主要在於它能提高人對資訊表現形式的選擇和控制能力,同時也能提高資訊表現形式與人的邏輯和創造能力的結合程度,在串行、符號資訊以及並行、聯想資訊方面擴展人的資訊處理能力。多媒體資訊比單一媒體資訊對人具有更大的吸引力,有利於人對資訊的主動探索而不是被動接受。*
另外,由於多媒體所帶來的資訊冗餘性,重複使用別的媒體或並行使用多種媒體可消除人機通信過程中的多義性及雜訊。多媒體技術豐富了資訊的表現形式,不過目前多媒體技術的研究基本上限於資訊的存儲和傳輸方面,而對於媒體資訊理解的研究並不充分。與人工智慧技術結合,開展媒體理解和推理研究將改變這種現狀。另一方面,多通道人機交互研究的興起,將進一步提高電腦的資訊識別、理解能力,提高人機交互的效率和用戶友好性,將人機交互技術和用戶介面設計引向更高境界。多通道和多媒體都蘊含了多種通信通道的使用,區別在於系統內部資訊所處的抽象層次的不同。多通道系統力求對語義的理解。*
它對用戶的原始輸入在較高的層次上進行解釋、分析和綜合,提取語義內容,達到對用戶的某種理解。然後,從較高的表現層次上傳達給用戶最恰當的回饋,它側重於資訊的理解和解釋。而多媒體系統則側重於資訊的表現,表現為在電腦的控制下產生、操縱、表現、存儲和傳送—些獨立的資訊,這些資訊至少是通過一種連續或離散媒體進行編碼的。*1.2.4虛擬現實技術虛擬現實(VirtualReality,VR)就是借助於電腦技術及硬體設備,建立高度真實感的虛擬環境,使人們通過視覺、聽覺、觸覺、味覺、嗅覺等感官在其中看、聽、觸、聞起來像真實的,以產生身臨其境的感覺的一種技術。虛擬現實技術有別於其他電腦應用技術的三個鮮明特徵:真實感、沉浸感和交互性。其中,自然和諧的交互方式是虛擬現實技術的一個重要研究內容,其目的是使人能以聲音、動作、表情等自然方式與虛擬世界中的對象進行交互。*
目前,人們除了致力於研究開發友好的用戶介面,還發明了大量的三維交互設備,如立體眼鏡、WorkBench、頭盔式顯示器、洞穴式立體顯示器(CAVE)、牆式大螢幕立體顯示器、數據服裝、位置跟蹤器、眼動跟蹤器、觸覺和力回饋裝置、三維掃描設備、三維滑鼠、三維跟蹤球、三維遊戲杆、數據手套等。虛擬現實中的交互是虛擬現實核心研究內容之一,但人機交互並不是虛擬現實的全部,複雜場景的建模、繪製等技術,也是虛擬現實非常重要的研究內容。虛擬現實為人機交互的研究提供了很好的契機和媒介,但並不是唯一的媒介,手機、PDA、筆記本電腦等移動設備,也需要更方便、快捷、人性化的交互手段。*1.3人機交互的研究內容人機交互的研究內容十分廣泛,涵蓋了建模、設計、評估等理論和方法以及在Web、移動計算、虛擬現實等方面的應用研究與開發,主要包括:1.
人機交互介面表示模型與設計方法(ModelandMethodology)一個交互介面的好壞,直接影響到軟體開發的成敗。友好人機交互介面的開發離不開好的交互模型與設計方法。因此,研究人機交互介面的表示模型與設計方法,是人機交互的重要研究內容之一。*圖1-2人機交互三元素*
2.可用性分析與評估(UsabilityandEvaluation)可用性是人機交互系統的重要內容,它關係到人機交互能否達到用戶期待的目標,以及實現這一目標的效率與便捷性。人機交互系統的可用性分析與評估的研究主要涉及到支持可用性的設計原則和可用性的評估方法等。3.多通道交互技術(Multi-Modal)在多通道交互中,用戶可以使用語音、手勢、眼神、表情等自然的交互方式與電腦系統進行通信。多通道交互主要研究多通道交互介面的表示模型、多通道交互介面的評估方法以及多通道資訊的融合等。其中,多通道整合是多通道用戶介面研究的重點和難點。*4.認知與智能用戶介面(RecognitionandIntelligentUserInterface)智能用戶介面(IntelligentUserInterface,IUI)的最終目標是使人機交互和人-人交互一樣自然、方便。上下文感知、眼動跟蹤、手勢識別、三維輸入、語音識別、表情識別、手寫識別、自然語言理解等都是認知與智能用戶介面需要解決的重要問題。5.
虛擬環境(VirtualEnvironment)中的人機交互“以人為本”的、自然和諧的人機交互理論和方法是虛擬現實的主要研究內容之一。通過研究視覺、聽覺、觸覺等多通道資訊融合的理論和方法、協同交互技術以及三維交互技術等,建立具有高度真實感的虛擬環境,使人產生“身臨其境”的感覺。*6.
Web設計(Web-Interaction)重點研究Web介面的資訊交互模型和結構,Web介面設計的基本思想和原則,Web介面設計的工具和技術,以及Web介面設計的可用性分析與評估方法等內容。7.
移動介面設計(MobileandUbicomp)移動計算(MobileComputing)、普適計算(UbiquitousComputing)等對人機交互技術提出了更高的要求,面向移動應用的介面設計問題已成為人機交互技術研究的一個重要應用領域。針對移動設備的便攜性、位置不固定性和計算能力有限性以及無線網路的低帶寬高延遲等諸多的限制,研究移動介面的設計方法,移動介面可用性與評估原則,移動介面導航技術,以及移動介面的實現技術和開發工具,是當前的人機交互技術的研究熱點之一。*
8.群件(Groupware)群件是指幫助群組協同工作的電腦支持的協作環境,主要涉及個人或群組間的資訊傳遞、群組中的資訊共用、業務過程自動化與協調,以及人和過程之間的交互活動等。目前與人機交互技術相關的研究主要包括:群件系統的體系結構、電腦支持交流與共享資訊的方式、交流中的決策支持工具、應用程式共用以及同步實現方法等內容。*1.4人機交互的發展歷史及趨勢1.4.1發展歷史作為電腦系統的一個重要組成部分,人機交互一直伴隨著電腦的發展而發展。人機交互的發展過程,也是人適應電腦到電腦不斷地適應人的發展過程。它經歷了幾個階段:1.語言命令交互階段電腦語言經歷了由最初的機器語言,而後是組合語言,直至高級語言的發展過程。這個過程也可以看作早期的人機交互的一個發展過程。*
早期的人機交互是通過命令語言進行的,人機之間通過語言中的輸入輸出功能完成交互。最初,人機交互的方式是採用手工操作輸入機器語言指令(二進位機器代碼)來控制電腦。這種形式很不符合人的習慣,既耗費時間,又容易出錯,只有非常專業的專家才能做到。後來,出現了FORTRAN、PASCAL、COBOL等語言,使人們可以用比較習慣的符號形式描述計算過程,交互操作由受過一定訓練的程式員即可完成。這一時期,程式員可採用批處理作業語言或交互命令語言的方式和電腦打交道,雖然要記憶許多命令和熟練地敲鍵盤,但已可用較方便的手段來調試程式、瞭解電腦執行情況。*60年代中期,命令行介面(CommandLineInterface,CLI)開始出現,通過這種人機介面,人們可以通過問答式對話、文本菜單或命令語言等方式來進行人機交互。命令行介面可以看作第一代人機介面。在這種介面中,人被看成操作員,機器只做出被動的反應,人只能用手操作鍵盤的方式輸入數據和命令資訊,介面輸出只能為靜態字元。因此,這種人機介面交互的自然性較差。
圖1-3命令行介面概念模型*
2.圖形用戶介面(GUI)交互階段圖形用戶介面(GraphicalUserInterface,GUI)的出現,使人機交互方式發生了巨大變化。GUI的主要特點是桌面隱喻、WIMP(Windows、Icon、Menu、PointingDevice)技術、直接操縱和“所見即所得(WhatYouSeeIsWhatYouGet,WYSIWYG)”。由於GUI簡單易學、減少了鍵盤操作,因而使不懂電腦的普通用戶也可以熟練地使用,開拓了用戶人群,使電腦技術得到了廣泛普及。
GUI技術的起源可以追溯到60年代美國麻省理工學院的Sutherland(電腦圖形學的奠基人)的工作。其發明的Sketchpad首次引入了菜單、不可重疊的瓦片式窗口、圖示,並採用光筆進行繪圖操作。*圖1-4WIMP介面概念模型
*1964年美國科學家道格拉斯·恩格爾巴特(DouglasEnglebart)在加利福尼亞製作了第一只滑鼠器——只有一個按鍵,外殼用木頭精心雕刻而成,底部有金屬滾輪,當時並不被重視。直到1979年12月,施樂PRAC研究中心的科學家拉瑞·泰斯勒(L.Tesler)演示了窗口、圖示、菜單,還有隨著”滑鼠器“移動的游標,滑鼠的重大歷史意義在這一刻才真正得到顯示。
70年代施樂公司在Alto電腦上首次開發了位映像圖形顯示技術,為開發可重疊窗口、彈出式菜單、菜單條等提供了可能。這些工作奠定了目前圖形用戶介面的基礎,形成了以窗口(Windows)、圖示(Icon)、菜單(Menu)和指點裝置(PointingDevice)為基礎的第二代人機介面,即WIMP介面。*
1984年Apple公司仿照施樂PRAC研究中心的技術開發出了新型Macintosh個人電腦,將WIMP技術引入到微機領域,這種全部基於滑鼠及下拉式菜單的操作方式和直觀的圖形介面引發了微機人機介面的歷史性變革。
與命令行介面相比,圖形用戶介面的人機交互自然性和效率都有較大的提高。圖形用戶介面很大程度上依賴於菜單選擇和交互小組件(Widget)。經常使用的命令大都通過滑鼠來實現。滑鼠驅動的人機介面使得初學者易於使用,但重複性的菜單選擇會給有經驗的用戶造成不方便,他們有時傾向使用命令鍵而不是選擇菜單,且在輸入資訊時用戶只能使用手這一種輸入通道。另外,圖形用戶介面需要佔用較多的螢幕空間,並且難以表達和支持非空間性的抽象資訊的交互。
*
3.自然和諧的人機交互階段當前,虛擬現實、移動計算、普適計算等技術的飛速發展,對人機交互技術提出了新的挑戰和更高的要求,同時也提供了許多新的機遇。在這一階段,自然和諧的人機交互方式得到了一定的發展。基於語音、手寫體、姿勢、視線跟蹤、表情等輸入手段的多通道交互是其主要特點,其目的是使人能以聲音、動作、表情等自然方式進行交互操作。在自然和諧的人機交互的發展過程中,人們除了致力於研究開發友好的逼真的三維用戶介面,基於聲音、動作、表情等多種通道的自然交互方式,還發明了大量的新交互設備,如電腦圖形學的先驅、美國麻省理工學院的Sutherland早在1968年開發了頭盔式立體顯示器,成為現代虛擬現實技術的重要基礎。*圖1-5多通道人機介面概念模型*1982美國加州VPL公司開發出了第一副數據手套,用於指示等簡單手勢的輸入;該公司在1992年還推出了Eyephone液晶顯示器;同樣在1992年,Defanti等提出了一種四面的沉浸式虛擬現實環境——CAVE系統等。目前,對於人類重要的自然交互方式——語音和筆的交互技術,包括手寫識別、筆式交互、語音識別、語音合成、數字墨水(DigitalInk)等,其發展已經有了很大的成效,如中國科學院自動化研究所開發了“漢王筆”手寫漢字識別系統;微軟亞洲研究院發明了數字墨水技術;中國科學院人機交互技術與智能資訊處理實驗室研製的筆式交互軟體開發平臺等工作;IBM公司的ViaVoice,把語音技術應用到PDA、智能汽車上。*
微軟也把語音識別技術集成到了多個領軍產品中,包括Office和WindowsXP,其最新的語音識別伺服器軟體SpeechServer準備在2004年上半年發佈。其中不少已經商品化,市場前景廣闊。另外,20世紀90年代,美國麻省理工學院Negroponte(尼葛洛龐蒂)領導的媒體實驗室在新一代多通道用戶介面方面做了大量開創性的工作。*1.4.2發展趨勢在未來的電腦系統中,將更加強調“以人為本”、“自然、和諧”的交互方式,以實現人機高效合作。概括的講,新一代的人機交互技術的發展將主要圍繞以下幾個方面:1.
集成化人機交互將呈現出多樣化、多通道交互的特點。桌面和非桌面介面,可見和不可見介面,二維與三維輸入,直接與間接操縱,語音、手勢、表情、眼動、唇動、頭動、肢體姿勢、觸覺、嗅覺、味覺以及鍵盤、滑鼠等交互手段將集成在一起,是新一代自然、高效的交互技術的一個發展方向。*2002年2月,W3C(WorldWideWebConsortium)國際組織成立了“多通道交互”工作小組(MultimodalInteractionWorkingGroup),開發W3C新的一類支持移動設備MMI的協議標準。目前已有42家大型IT企業或單位參加該小組,參與制定“多通道交互”的相關協議標準。該小組成員覆蓋了幾乎所有電腦軟硬體、移動通信、家電的大型廠商。*
卡耐基-梅隆大學INTERACTIVESYSTEMLABSINTERACT專案包括如下子課題*
2.網路化無線互聯網、移動通信網的快速發展,對人機交互技術提出了更高的要求。新一代的人機交互技術需要考慮在不同設備、不同網路、不同平臺之間的無縫過渡和擴展,支持人們通過跨地域的網路(有線與無線、電信網與互聯網等)在世界上任何地方用多種簡單的自然方式進行人機交互,而且包括支持多個用戶之間以協作的方式進行交互。另外,網格技術的發展也為人機交互技術的發展提供了很好的機遇。*
3.智能化目前,用戶使用鍵盤和滑鼠等設備進行的交互輸入都是精確的輸入,但人們的動作或思想等往往並不很精確,人類語言本身也具有高度模糊性,人們在生活中常常習慣於使用大量的非精確的資訊交流。因此,在人機交互中,使電腦更好地自動捕捉人的姿態、手勢、語音和上下文等資訊,瞭解人的意圖,並做出合適的回饋或動作,提高交互活動的自然性和高效性,使人-機之間的交互像人-人交互一樣自然、方便,是電腦科學家正在積極探索的新一代交互技術的一個重要內容。*4.
標準化目前,在人機交互領域,ISO已正式發佈了許多的國際標準,以指導產品設計、測試和可用性評估等。但人機交互標準的設定是一項長期而艱巨的任務,並隨著社會需求的變化而不斷變化。*
習題.1.1什麼是人機交互技術?1.1.2簡單介紹人機交互技術的發展歷史。1.1.3簡單介紹人機交互技術與其它相關學科的關係。
1.4簡單介紹人機交互技術的研究內容。
交互設備*主要內容輸入設備:文本輸入設備;圖像輸入設備;指點輸入設備等;輸出設備:顯示器;聲音的輸出;數字紙等虛擬現實系統中的交互設備*3.1文本輸入設備文本輸入是人與電腦交互的一個重要組成部分,同時也是一項繁重的工作。鍵盤輸入是最常見、最主要的文本輸入方式。手寫以及語音等一些更自然的交互方式也可為文本輸入提供輔助手段。*3.1.1鍵盤鍵盤是文本輸入的最重要手段,而鍵盤佈局對於文本輸入的速度和準確性至關重要。為了提高鍵盤在某些場合下的使用舒適度,許多鍵盤在設計的過程中還加入了更多人性化的考慮。*1.鍵盤的佈局
QWERTY鍵盤佈局19世紀70年代,Sholes發明了QWERTY鍵盤佈局,其名稱來源於該佈局方式最上行前6個英文字母,最常用的幾個字母安置在相反方向,最大限度放慢敲鍵速度以避免卡鍵。這種佈局方式依然是今天最為常見的排列方式,成為一種事實上的標準。DUORAK鍵盤佈局20世紀20年代的DUORAK鍵盤佈局,據推測可以大大減少手指移動距離,從而大大提高輸入速度,但由於受到傳統QWERTY佈局的影響,沒有成為主流的鍵盤佈局。*2.人性化設計的鍵盤
(1)人體工程學鍵盤是在標準鍵盤基礎上將指法規定的左手鍵區和右手鍵區這兩大板塊左右分開,並形成一定角度,這樣可使操作者不必有意識的夾緊雙臂,從而保持一種比較自然的形態,這種設計的鍵盤被微軟公司命名為自然鍵盤(NaturalKeyboard)。*(1)人體工程學鍵盤(圖例1)*圖3-1人體工程學鍵盤:固定於椅子上的鍵盤(1)人體工程學鍵盤(圖例2)*圖3-1人體工程學鍵盤:固定於桌面上的鍵盤2.人性化設計的鍵盤
(2)多功能集成鍵盤這類鍵盤集成了滑鼠、無線等功能,在鍵盤佈局以及外觀設計方面,針對遊戲、上網流覽等常用娛樂功能做了改進。鍵盤正上方設計的快捷鍵,包括
“IE主頁”、“打開檔夾”、“查找檔”和“進入信箱”等12個,許多操作可以一鍵完成。鍵盤的無線接收器採用USB介面,安裝使用也非常方便。
*2.人性化設計的鍵盤
*圖3-2BTC9019URF無線遊戲鍵盤*圖3-2BTC9019URF無線遊戲鍵盤2.人性化設計的鍵盤3.1.2手寫設備手寫筆板+手寫筆:是手寫系統中一個很重要的部分。有線筆:手寫筆尾部均有一根電纜與手寫板相連,從手寫板上輸入電源。無線筆:借助於一些特殊技術而不需要任何電源。無線筆的優點是攜帶和使用起來非常方便,同時也較少出現故障。手寫筆一般還帶有兩個或三個按鍵,其功能相當於滑鼠按鍵,這樣在操作時不需要在手寫筆和滑鼠之間來回切換。*3.1.2手寫設備*圖3-3漢王筆手寫系統3.1.2手寫設備手寫板主要分類:電阻式壓力手寫板:幾乎已經被淘汰電磁式感應手寫板:目前市場主流產品電容式觸控手寫板:市場的新生力量,具有耐磨損、使用簡便、敏感度高等優點,是今後手寫板的發展趨勢。*3.1.2手寫設備手寫板的一些通用的評測指標壓感級數:手寫板可以感應到筆在手寫板上的力度的級別,最高為512級。精度:精度又稱解析度,指的是單位長度上所分佈的感應點數,精度越高對手寫的反映越靈敏,對手寫板的要求也越高書寫面積:是手寫板一個很直觀的指標,手寫板區域越大,書寫的迴旋餘地就越大,運筆也就更加靈活方便,輸入速度往往會更快,當然其價格也相應更高。書寫面板的尺寸大體有以下幾種:76mm×51mm、76mm×114mm、10mm×13mm和11mm×15mm*3.1.2手寫設備手寫漢字識別軟體除了硬體外,手寫筆和手寫板的另一項核心技術是手寫漢字識別軟體,目前各類手寫筆的識別技術都已相當成熟,識別率和識別速度也能夠滿足實際應用的要求。*3.1.3語音輸入設備語音輸入為文本輸入提供了更加自然的交互手段,也許在將來,我們能夠真正拋棄鍵盤,實現和電腦的“對話”。在語音錄入過程中所涉及的設備主要麥克風和聲卡(見3.5節)*3.2圖像輸入設備圖像輸入是人與電腦交互的另外一個重要組成部分。掃描器可以快速地實現圖像輸入,且經過對圖像的分析與識別,可以得到文字、圖形等內容;而攝像頭則是捕捉動態場景最常用的工具。*3.2.1掃描器掃描器作為光電、機械一體化的高科技產品,自問世以來憑藉其獨特的數位化“圖像”採集能力,低廉的價格以及優良的性能,得到了迅速的發展和廣泛的應用,目前已成為電腦不可缺少的圖文輸入工具之一,被廣泛地應用於圖形、圖像處理的各個領域。*1.掃描器的簡單工作原理
*
掃描器對圖像畫面進行掃描時,光源將光線照射到待掃描的圖像原稿上,產生反射光或透射光,然後經反光鏡組反射到線性光電轉換的電荷耦合器件(ChargeCoupledDevice,CCD)。中。CCD圖像感測器根據反射光線強弱的不同轉換成不同大小的電流,經模擬/數字轉換處理,將電信號轉換成數字信號,即產生一行圖像數據。 同時,在控制電路的控制下,步進電機旋轉帶動驅動皮帶,從而驅動光學系統和CCD掃描裝置在傳動導軌上與待掃原稿做相對平行移動,將待掃圖像原稿逐條線掃入,最終完成全部原稿圖像的掃描。對於彩色圖像,掃描器在掃描時,首先生成分別對應於紅(R)、綠(G)、藍(B)三基色的三幅圖像,然後將這三幅圖像合成。*圖3-4掃描器掃描過程簡圖2.掃描器的性能指標(1)解析度:掃描器的解析度決定了最高掃描精度
;在掃描圖像時,掃描解析度設得越高,生成的圖像的效果就越精細,生成的圖像檔也越大。DPI是指用掃描器輸入圖像時,在每英寸上得到的像素點個數。掃描器的解析度等於其光學部件的解析度加上其自身通過硬體及軟體進行處理分析所得到的解析度;解析度為1200DPI的掃描器,往往其光學部分的解析度只占400~600DPI。擴充部分的解析度由硬體和軟體聯合生成,這個過程是通過電腦對圖像進行分析,對空白部分進行插值處理所產生的;*2.掃描器的性能指標(2)掃描速度:掃描速度決定了掃描器的工作效率.一般而言,以300DPI的解析度掃描一幅A4幅面的黑白二值圖像,時間少於10秒鐘,相同情況下,掃描灰度圖,約需10秒左右,而如果使用三次掃描成像的彩色掃描器,則要2~3分鐘。*3.平板式掃描器的結構目前大部分的掃描器都屬於平板式掃描器,主要由上蓋、原稿臺、光學成像部分、光電轉換部分、機械傳動部分組成(如圖3-5)。*機蓋導軌滑杆稿臺齒輪鏈條步進電機圖3-5平板式掃描器結構3.2.2數碼攝像頭1.數碼攝像頭的用途數碼攝像頭可以直接捕捉影像,然後通過電腦的串口、並口或者USB介面傳送到電腦裏。數碼攝像頭沒有存儲裝置和其他附加控制裝置,只有一個感光部件、簡單的鏡頭和不太複雜的數據傳輸線路,造價低廉。*3.2.2數碼攝像頭2.衡量數碼攝像頭的關鍵因素感光元器件大多為CCD,CCD的成像往往通透性、明銳度都很好,色彩還原、曝光可以保證基本準確;應用在攝像、圖像掃描等對於圖像品質要求較高的應用中,價格高附加金屬氧化物半導體組件(ComplementaryMetal-OxideSemiconductor,CMOS)大多應用在一些低端視頻應用中,價格低像素數:像素數是影響圖像品質的重要指標,也是判斷攝像頭性能優劣的重要條件。早期產品以10萬像素的居多,目前則以35萬像素為主*3.2.2數碼攝像頭2.衡量數碼攝像頭的關鍵因素解析度:分為照像解析度和視頻解析度
:有352×288、320×240、176×144、160×120等規格一般產品的最高解析度可以達到640×480視頻速度:視頻速度和視頻解析度是直接相關的,基本成反比關係如640×480解析度可達12.5幀/秒(FramesPerSecond,FPS),
352×288的解析度可得到30FPS,真正獲取流暢的視頻
鏡頭:鏡頭性能的重要條件是它的調焦範圍以及靈敏性等因素,好的攝像頭,應該有較為寬廣的調焦範圍和較高的靈敏性*數碼攝像頭產品如圖3-6所示的攝像頭(創新VideoBlasterWebCam),可以用16.7兆顏色進行即時視頻捕捉;解析度為352×288時速度最快達30幀每秒,解析度為640×480時達15幀每秒;支持160×120、176×144、320×240、352×288、和640×480解析度的靜態圖像捕捉;鏡頭免調焦距。**圖3-6創新VideoBlasterWebCam及其控制介面3.3指點輸入設備指點設備常用於完成一些定位和選擇物體的交互任務。物體可能處於一維、二維、三維或更高維的空間中,而選擇與定位的方式可以是直接選擇,或通過操作螢幕上的游標來完成。*3.3.1滑鼠1963年,美國科學家DouglasEnglebart發明了滑鼠器(如圖3-7左)。他最初的想法是為了讓電腦輸入操作變得更簡單、容易。第一只滑鼠器的外殼是用木頭精心雕刻而成的,整個滑鼠器只有一個按鍵,在底部安裝有金屬滾輪,用以控制游標的移動。1984年,蘋果公司把經過改進的滑鼠器安裝在Lisa微電腦上,從而使滑鼠器聲名顯赫,它與鍵盤一道成為電腦系統中必備的輸入裝置。*1.最初的滑鼠和現在常用的滑鼠*2.滑鼠的分類1)機械式滑鼠(半光學滑鼠)工作原理:在機械式滑鼠底部有一個可以自由滾動的球,在球的前方及右方裝置兩個支成90度角的編碼器滾軸,移動滑鼠時小球隨之滾動,便會帶動旁邊的滾軸,前方的滾軸記錄前後滑動,右方的滾軸記錄左右滑動,兩軸一起移動則代表非垂直及水準方向的滑動。編碼器由此識別滑鼠移動的距離和方位,產生相應的電信號傳給電腦,以確定游標在螢幕上的正確位置。
*2.滑鼠的分類2)光電式滑鼠
工作原理:利用一塊特製的光柵板作為位移檢測元件,光柵板上方格之間的距離為0.5mm。滑鼠器內部有一個發光元件和兩個聚焦透鏡,發射光經過透鏡聚焦後從底部的小孔向下射出,照在滑鼠器下麵的光柵板上,再反射回滑鼠器內。當在光柵板上移動滑鼠器時,由於光柵板上明暗相間的條紋反射光有強弱變化,滑鼠器內部將強弱變化的反射光變成電脈衝,對電脈衝進行計數即可測出滑鼠器移動的距離。
*3.滑鼠與電腦的介面串行介面設計(梯形9針介面);隨著PC機器上串口設備的逐漸增多,串口滑鼠逐漸被採用新技術的PS/2介面滑鼠所取代(小圓形介面);隨著即插即用概念的提出,使得採用USB介面的滑鼠成為主流;而對於一些有專業要求的用戶而言,採用紅外線信號來與電腦傳遞資訊的無線滑鼠也成為一種專業時尚。*4.滑鼠的按鍵從按鍵而言,依次經歷了兩鍵、三鍵時代。隨著INTERNET的普及,人們發現,在滑鼠上加上一個小小的輪軸更便於流覽網頁,這樣,又出現了滾輪滑鼠,目前的滑鼠以三鍵滾輪滑鼠為主(如圖3-7右)。雖然滑鼠的發展速度和其他輸入設備相比似乎慢了許多,但是滑鼠對電腦操作帶來的巨大便利,決定了其在短時間內是難以被完全替代的。*3.3.2觸摸板(Touchpad)
觸摸板能夠在一定的區域內(通常是50~75毫米長度)感應接觸,將這種接觸信號轉發給電腦處理。目前,觸摸板已應用到筆記本電腦上,可以替代滑鼠。觸摸板通過電容感應來獲知用戶的手指移動情況,對手指熱量並不敏感。
同滑鼠相比,觸摸板的使用更加靈活,在使用過程中,通過更多的配置,可以得到更強的功能。
*觸摸板以及觸摸板的配置
*圖3-8觸摸板以及觸摸板的配置3.3.3控制杆
控制杆很適宜於跟蹤目的(即追隨螢幕上一個移動的目標)的原因是移動對應的游標所需的位移相對較小,同時易於變換方向。
控制杆的移動導致螢幕上游標的移動。根據兩者移動的關係,可以將其分為兩大類:位移定位和壓力定位。對於位移定位的遊戲杆,螢幕上的游標依據遊戲杆的位移而移動,
**3.3.4光筆
光筆是一種較早用於繪圖系統的交互輸入設備,它能使用戶在螢幕上指點某個點以執行選擇、定位或其他任務。光筆和圖形軟體相配合,可以在顯示器上完成繪圖,修改圖形和變換圖形等複雜功能(如圖3-10)。
光筆的形狀和普通鋼筆相似,它由透鏡、光導纖維、光電元件、放大整形電路和接觸開關組成(如圖3-11)。**圖3-10光筆的使用光筆的的原理圖*光筆的優缺點
光筆的優點不需要特殊的顯示幕幕,與觸摸屏的設備相比較,價格便宜許多;在一些不適宜使用滑鼠的地方,可以起到替代作用。光筆的缺點手和筆跡可能將遮擋螢幕圖像的一部分;會造成手腕的疲勞;光筆不能檢測黑暗區域內的位置;會因房間背景光的影響,光筆產生誤讀現象。*3.3.5觸摸屏
觸摸屏作為一種特殊的電腦外設,提供了一種簡單、方便、自然的人機交互方式,在某些應用中,可以代替滑鼠或鍵盤。觸摸屏目前主要應用於公共資訊的查詢,如電信、稅務、銀行、電力等部門的業務查詢,城市街頭的資訊查詢。此外還可以應用於工業控制、軍事指揮、電子遊戲、點歌點菜、多媒體教學等方面。*觸摸屏的分類可以把觸摸屏分為四種:電阻式電容感應式紅外線式(圖3-12)表面聲波式。每一類觸摸屏都有其各自的優缺點。
*紅外線式觸摸屏及相關技術參數*原理:紅外線螢幕類型:平面解析度(dpi):1600×1200尺寸(英寸):19透光率:>92%感應力度:可感知100g觸摸力圖3-12觸摸屏及相關技術參數3.3.6手寫液晶屏
手寫液晶屏是液晶矩陣顯示技術和高靈敏度電磁壓感技術的完美結合,可以在螢幕上直接用壓感筆實現高精度的選取、繪圖、設計製作。液晶螢幕上除了具備一般的液晶顯示幕的特徵以外,在最上面還附有一層特製保護層,確保在書寫過程中,螢幕保持平整不變形,液晶原來的畫質毫不受損,同時具有高耐久性。
*手寫液晶屏*3.3.7眼動跟蹤系統
眼動跟蹤系統允許用戶僅僅通過凝視的手段來控制電腦選擇物體。目前來看,眼動跟蹤系統需要利用較為複雜的硬體設備以及軟體演算法。
*一個眼動跟蹤系統示例*圖3-14眼動跟蹤系統眼動跟蹤系統工作原理首先,用四個L形的紅外線發光器,在眼睛裏產生一些亮點;然後利用一個廣角攝像頭獲取臉部圖像,快速確定眼睛的位置,再利用一個視野較小,解析度較高的攝像頭拍攝眼睛的高解析度圖像;最後,分析眼睛的圖像,計算瞳孔中心和亮點的位置,通過計算瞳孔中心和亮點確定的向量,確定視線方向。*3.3.8游標鍵--非連續定位裝置
選擇菜單或者編輯文本過程中游標移動時,只需要上、下、左、右幾個方向的控制,這時候僅需要簡單的游標鍵就可以了。鍵盤上都有光標鍵,在windows等圖形用戶介面和滑鼠出現之前,游標鍵是一般字元介面最重要的定位方式。目前,在一些應用中,特別是一些簡單交互介面或一些文本編輯系統中,游標鍵作為一種簡單、自然的方式,仍然發揮著重要的作用。
*3.4顯示設備
顯示器是電腦的重要輸出設備,是人機對話的重要工具。它的主要功能是接收主機發出的資訊,經過一系列的變換,最後以光的形式將文字和圖形顯示出來。在交互的電腦系統中,沒有顯示器的情況是非常少見的,只出現在某些非傳統的應用中。
*3.4.1位圖顯示
光柵掃描型(Rasterscan)顯示器,以點陣形式表示圖形,採用專門的幀緩衝區存放點陣,緩衝區按照矩形網格排列,每個網格點對應顯示器上的一個象素。由視頻控制器負責刷新掃描,當掃描到顯像管表面時,根據對應的緩衝區中的值,顯示不同的灰度和顏色(如圖3-15),此類顯示技術稱為位圖(Bitmap)顯示。
*1.位圖與光柵顯示
*螢幕坐標系光柵顯示器的圖形表現能力,是通過光柵圖形元素來實現的。為此建立了以螢幕解析度為基礎的二維圖形整數坐標系,稱為螢幕坐標系。它的垂直方向為Y軸,水準方向為X軸,原點在螢幕的左上角,單位為象素的直徑(即點距)。
*3.4.2顯示技術
1.陰極射線管(CRT)顯示器
結構*3.4.2顯示技術工作方式電子束從左向右,從上向下掃描螢光屏,產生一幅幅光柵,每一條從左向右的直線稱為掃描線,每一幅光柵稱為一幀。掃描方式分逐行和隔行掃描方式。隔行掃描方式把一幀光柵分為兩次掃描:先掃偶數行掃描線,再掃奇數行掃描線。逐行掃描比隔行掃描擁有更穩定顯示效果。
*液晶顯示器2.液晶-等離子顯示器在充電條件下,液晶能改變分子排列,繼而造成光線的扭曲或折射液晶顯示器工作原理是通過能阻塞或傳遞光的液晶材料,傳遞來自周圍的或內部光源的偏振光。
LCD比CRT顯示器具有更好的圖像清晰度,畫面穩定性和更低的功率消耗,但液晶材質粘滯性比較大,圖像更新需要較長回應時間,因此不適合顯示動態圖象*等離子顯示器等離子顯示器誕生於二十世紀60年代,它採用等離子管作為發光材料,1個等離子管負責一個像素的顯示:等離子管內的氖氙混合氣體在高壓電極的刺激下產生紫外線,紫外線照射塗有三色螢光粉的玻璃板,螢光粉受激發出可見光。*3.4.3數字紙
數字紙是一種仍處於試驗階段的顯示技術。數字紙是一種薄的,柔軟的介質,如同一般的電腦螢幕一樣,可以利用電子儀器在上面書寫,不同的是,即使沒有了能量,它也能保存已經書寫的內容。
有若干技術應用於數字紙的研究。其中之一是將介質的表面佈滿小的球體,一面是黑色的,另一面是白色的。電子進入介質後,會使得小球旋轉,呈現出黑色或白色。當電子信號消失後,小球保持其最後的朝向。目前的數字紙的解析度可以到達100dpi,並可以顯示不同的灰度和顏色。
*3.5語音交互設備
語音作為一種重要的交互手段,日益受到人們的重視。人們可以使用固定電話或移動電話以及PC、PDA和其他智能設備通過語音識別、語音合成等交互技術,以及語音流覽、智能資訊處理技術等實現訪問互聯網,實現個人服務和商業服務的語音應用。在美國、日本,語音互聯已成為簡易終端接入互聯網的主要方式之一。對於語音的交互,耳機、麥克風以及聲卡是最基本的設備。
*3.5.1耳麥
1.耳機及指標耳機結構:耳機結構可以分為封閉式、開放式、半開放式三種頻響範圍:耳機能夠放送出的頻帶的寬度,國際電工委員會IEC581-10標準中高保真耳機的頻響範圍應當能夠包括50Hz到12500Hz之間
靈敏度指在同樣響度的情況下,需要輸入功率的大小,靈敏度越高所需要的輸入功率越小*3.5.1耳麥1.耳機及指標阻抗是耳機交流阻抗的簡稱,臺式機或功放、VCD、DVD、電視等器械上,常用到的是高阻抗耳機,各種可攜式隨身聽,例如CD、MD或MP3,一般會使用低阻抗耳機
諧波失真是一種波形失真,在耳機指標中有標示,失真越小,音質也就越好。一般的耳機應當小於或略等於0.5%。*3.5.1耳麥2.麥克風及指標耳機佩戴有麥克風。為了過濾背景雜音,達到更好的識別效果,許多麥克風採用了NCAT(NoiseCancelingAmplificationTechnology)專利技術。NCAT技術結合特殊機構及電子回路設計以達到消除背景噪音,強化單一方向聲音(只從配戴者嘴部方向)的收錄效果,是專為各種語音識別和語音交互軟體設計的,提供精確音頻輸入的技術,採用NCAT/NCAT2技術的麥克風會著重採集處於正常語音頻段(介於350Hz7000Hz)的音頻信號,從而降低環境噪音的干擾。*3.5.1耳麥微軟設計的GameVoice可以方便地實現同時與多個人對話,與不同的個人對話,以及通過語音命令控制遊戲的功能。*圖3-17GameVoice3.5.2聲音合成設備-聲卡
1.聲卡的功能是一種安裝在電腦中的最基本的聲音合成設備,是實現聲波/數字信號相互轉換的硬體,可把來自話筒、磁帶、光碟的原始聲音信號加以轉換,輸出到耳機、揚聲器、擴音機、答錄機等聲響設備,完成對聲音資訊進行錄製與回放。2.聲卡的結構聲卡可分為模數、數模轉換電路兩部分:模數轉換電路負責將麥克風等聲音輸入設備採集到的模擬聲音信號轉換為電腦能處理的數字信號;而數模轉換電路負責將電腦使用的數字聲音信號轉換為耳機、音箱等設備能使用的模擬信號。
*3.5.2聲音合成設備-聲卡3.聲卡擁有的介面:LINEOUT(或者SPKOUT)用於連接音箱耳機等外部揚聲設備,實現聲音回放;MICINOUTMICIN用於連接麥克風,實現錄音功能;LINEINLINEIN則是把外部設備的聲音輸入到聲卡中遊戲杆(外部MIDI設備介面)*3.5.2聲音合成設備-聲卡4.與聲卡相關的重要概念
聲音的採樣採樣的位數決定了聲音採集的品質。採樣位數可以理解為聲卡處理聲音的解析度,這個數值越大,解析度就越高,錄製和回放的聲音也越真實。16位聲卡能將聲音分為64K個精度單位進行處理,而8位聲卡只能處理256個精度單位,造成較大的信號損失採樣的頻率採樣頻率是指錄音設備在一秒鐘內對聲音信號的採樣次數,採樣頻率越高則聲音的還原就越真實越自然。在當今的主流聲卡上,採樣頻率一般分為22.05KHz、44.1KHz、48KHz三個等級*3.5.2聲音合成設備-聲卡聲道數聲音在錄製過程中被分配到兩個獨立的聲道,從而達到了很好的聲音定位效果,用戶可以清晰地分辨出各種樂器來自的方向,從而使音樂更富想像力,更加接近於臨場感受。四聲道環繞音頻技術較好實現了三維音效,四聲道環繞規定了4個發音點:前左、前右,後左、後右,聽眾則被包圍在這中間。MIDI(MusicalInstrumentDigitalInterface)檔MIDI檔是一種描述性的“音樂語言”,非常小巧,它將所要演奏的樂曲資訊用字節描述,例如“在某一時刻,使用什麼樂器,以什麼音符開始,以什麼音調結束,加以什麼伴奏”等等。MIDI檔只是一種對樂曲的描述,本身不包含任何可供回放的聲音資訊。*3.5.2聲音合成設備-聲卡波表合成波表(WAVETABLE)將各種真實樂器所能發出的所有聲音(包括各個音域、聲調)錄製下來,存貯為一個波表檔。播放時,根據MIDI檔記錄的樂曲資訊向波表發出指令,從“表格
”中逐一找出對應的聲音資訊,經過合成、加工後回放出來。採用真實樂器的採樣,所以效果較好。一般波表的樂器聲音資訊都以44.1KHz、16Bit的精度錄製,以達到最真實回放效果。理論上,波表容量越大合成效果越好。
*3.6虛擬現實系統中的交互設備
虛擬現實系統要求電腦可以即時顯示一個三維場景,用戶可以在其中自由的漫遊,並能操縱虛擬世界中一些虛擬物體。因此,除了一些傳統的控制和顯示設備,虛擬現實系統還需要一些特殊的設備和交互手段,來滿足虛擬系統中的顯示、漫遊以及物體操縱等任務。*3.6.1三維空間定位設備
三維交互設備最基本的特點是具有六個自由度。常見的三維輸入設備主要有以下幾種:1.空間跟蹤定位器2.數據手套(DataGlove)3.三維滑鼠4.觸覺和力回饋器
*3.6.1三維空間定位設備1.空間跟蹤定位器空間跟蹤定位器或稱三維空間感測器(如圖3-18)是一種能即時地檢測物體空間運動的裝置,可以得到物體在六個自由度上相對於某個固定物體的位移,包括:X、Y、Z座標上的位置值,以及圍繞X、Y、Z軸的旋轉值(轉動,俯仰、搖擺)。這種三維空間感測器對被檢測的物體必須是無干擾的,也就是說,不論這種感測器是基於何種原理或使用何種技術,它都不應當影響被測物體的運動,因而稱為“非接觸式感測器”。**圖3-18空間跟蹤定位器空間跟蹤定位器的主要的性能指標:定位精度:指感測器所測出的位置與實際位置的差異位置修改速率:指感測器在一秒鐘內所能完成的測量次數延時:指被檢測物體的某個動作與感測器測出該動作時間的間隔需要解決的關鍵問題如何減少顫抖、漂移、噪音在虛擬現實技術中廣泛使用的感測器類型:低頻磁場式:在虛擬現實環境中,這種感測器常被用來安裝在數據手套和頭盔顯示器上。超聲式:*3.6.1三維空間定位設備2.數據手套(DataGlove)數據手套一般由很輕的彈性材料構成,緊貼在手上。整個系統包括位置、方向感測器和沿每個手指背部安裝的一組有保護套的光纖導線,它們檢測手指和手的運動。數據手套將人手的各種姿勢、動作通過手套上所帶的光導纖維感測器,輸入電腦中進行分析。這種手勢可以是一些符號表示或命令,也可以是動作。手勢所表示的含義可由用戶加以定義。在虛擬環境中,操作者通過數據手套可以用手去抓或推動虛擬物體,以及做出各種手勢命令。
**圖3-19數據手套3.6.1三維空間定位設備3.三維滑鼠三維滑鼠能夠感受用戶在六個自由度的運動,包括三個平移參數和三個旋轉參數。其裝置比較簡單:一個蓋帽放在帶有一系列開關的底座上。轉動這個小球或側方向推動這個小球時,如向上拉它、向下壓它,使它向前或向後等。三維滑鼠將用戶的這些動作傳送給電腦,從而進一步控制虛擬環境中的物體的運動。*3.6.1三維空間定位設備*圖3-20三維滑鼠Logitech公司的Magellan3DController,它可提供x,y,z,a,b,c六個自由度,並附有九個按鈕。Magellan的外觀設計充分考慮了功效學的原則,用戶長時間操作不容易感到疲勞,用戶只要輕輕搓動其上的蓋帽便可在螢幕上平移和旋轉三維物體,鬆手後蓋帽會自動恢復到初始位置。3.6.1三維空間定位設備4.觸覺和力回饋器(振動觸感式回饋器)*圖3-21VirtualTechnology公司的觸覺回饋手套3.6.1三維空間定位設備虛擬現實系統必須提供觸覺回饋,以便使用戶感覺到仿佛真的摸到了物體。但是由於人的觸覺非常敏感,精度一般的裝置根本無法滿足要求。
另外,對於觸覺和力回饋器,還要考慮到模擬力的真實性、施加到人手上是否安全以及裝置是否便於攜帶並讓用戶感到舒適等問題。目前已經有一些關於力學回饋手套、力學回饋操縱杆、力學回饋筆、力學回饋表面等裝置的研究
*3.6.1三維空間定位設備手指觸覺回饋器的實現主要通過視覺、氣壓感、振動觸覺、電子觸覺和神經肌肉模擬等方法。
其中電子觸覺回饋器是向皮膚回饋寬度和頻率可變的電脈衝,而神經肌肉模擬回饋是直接刺激皮層,這些方法都很不安全,較安全的方法是氣壓式和振動觸感式的回饋器。
*3.6.2沉浸感顯示設備
1.立體視覺
由於人類從客觀世界獲得的資訊80%(60%視覺,聽覺20%,其他20%)以上來自視覺,因而視覺溝通就成為多感知虛擬現實系統中最重要的環節,立體視覺技術也就成為虛擬現實的一種極重要的支撐技術。
人是通過右眼和左眼所看到物體的細微差異來感知物體的深度,從而識別出立體圖像的。立體影像生成技術主要有兩種:主動式立體模式和被動式立體模式。
*3.6.2沉浸感顯示設備顯示模式主動式模式:用戶的左右眼影像將按照順序交替顯示,用戶使用LCD立體眼鏡保持與立體影像的同步,這種模式可以產生高質量的立體效果。被動式系統需要使用兩套顯示設備以及投影設備分別生成左右眼影像並進行投影,不同的投影分別使用不同角度的偏振光來區別左右眼影像,用戶使用偏振光眼鏡保持立體影像的同步。*3.6.2沉浸感顯示設備2.立體顯示系統頭盔式顯示器(HeadMountedDisplay,HMD,)是一種立體圖形顯示設備,可單獨與主機相連以接受來自主機的三維虛擬現實場景資訊。
目前最常用的頭盔顯示器是基於液晶顯示原理的,最早如美國VPL公司於1992年推出的Eyephone,它在頭上裝有一個解析度為360×240象素的液晶顯示器,其視野為水準100度。
**圖3-22頭盔式顯示器3.6.2沉浸感顯示設備頭盔分單通道和雙通道兩種:單通道的頭盔顯示器上裝有一個液晶顯示器並顯示同一幅圖像;雙通道的頭盔顯示器上裝有兩個液晶顯示器,左邊的液晶屏顯示來自主控電腦生成的左眼圖像,右邊的液晶顯示幕顯示來自主控電腦生成的右眼圖像,每一幅的圖像的顯示刷新速度都在60Hz以上,兩幅圖像在兩個液晶屏之間快速切換顯示,根據立體成像原理,觀察者就可以看到立體圖像
*3.6.2沉浸感顯示設備頭盔式顯示器使用方式為頭戴式,輔以空間跟蹤定位器可進行虛擬場景輸出效果的觀察,同時觀察者可做空間上的移動,如自由行走、旋轉等。兩個顯示幕幕處於用戶佩戴的頭盔中,分別覆蓋用戶雙眼的視野,使得用戶只能夠感知來自電腦所生成的圖像,沉浸感極強。*3.6.2沉浸感顯示設備改進的沉浸式虛擬現實環境:吊杆式雙筒全方位監視器(BinocularOmni-OrientationMonitor,BOOM)BOOM把兩個獨立的CRT顯示器捆綁在一起,用戶可以用手操縱顯示器的位置,以觀察一個可移動、寬視角的虛擬空間。BOOM的顯著優點是解析度較高,高端產品的解析度是1280×1024像素。BOOM的另外優點包括:沒有延遲和雜訊,對用戶無佩戴重量方面的負擔。**圖3-23BOOM顯示系統洞穴式顯示環境
(CaveAutomaticVirtualEnvironment,CAVE)這是一種四面的沉浸式虛擬現實環境。系統在支持多用戶的同時,給用戶提供了前所未有的,帶有震撼性的沉浸感對於處在系統內的用戶來說,投影螢幕將分別覆蓋用戶的正面、左右以及底面視野,構成一個邊長為10英尺的立方體。可以允許多人走進CAVE中,用戶戴上立體眼鏡便能從空間中任何方向看到立體的圖像。CAVE實現了大視角、全景、立體、且支持5~10人共用的一個虛擬環境。
**
圖
3-24CAVE顯示環境
*
圖
3-24CAVE顯示原理
洞穴式顯示環境l
它可提供180o的寬視域和2000×2000以上的高解析度;l
它允許用戶在虛擬空間中走動,而不用佩戴笨重的設備;l
它允許在同一個環境中存在多個用戶,而且用戶間可以自然地交互;l
一次能顯示大型模型,如汽車、房屋等,而HMD則需要頭部運動才能看到完整的模型。*Cave系統示例Workbench是一種單投影面的系統,立體影像通過鏡子的折射投影到一個水準的投影平面,用戶在此工作平面上與虛擬物體進行交互*多投影面系統
相對於單投影面系統來說,多投影面系統能夠涵蓋更多的用戶視野範圍,提供更好的沉浸感,所以多投影面系統也成為沉浸式虛擬環境的主要發展方向。對原來單投影面的Workbench進行雙投影面的改進,在水準投影面的基礎上增加額外的垂直投影面,可以進一步增加用戶的虛擬視野範圍。
*PowerWall系統
Minnesota大學在1994年提出的PowerWall系統是由多個投影面層疊或並排形成單個面積較大的投影平面,它能提供高解析度大面積範圍的影像,主要被應用於科學數據可視化,或面向多用戶展示工作(圖3-25左)。
**圖3-25PowerWall*圖3-25WORKBENCH6個投影面的CAVE系統能夠完全覆蓋用戶的視野範圍,使用戶能夠完全沉浸於所生成的虛擬環境。另外,也有投影到圓柱狀或環繞投影面的系統,主要應用於虛擬劇場,提供對多用戶的支持。*3.6.3虛擬現實系統
山東大學考古數字博物館綜合利用前面介紹的各種虛擬設備,可以在此基礎上完成一些較為複雜的應用。山東大學構建了一套基於桌面的虛擬現實平臺,並用於山東大學考古數字博物館(圖3-26)
**圖3-26山東大學考古數字博物館的場景與交互*用戶漫遊系統跟蹤器立體眼鏡/頭盔音箱手勢位置語音命令傳統命令通道理解整合立體圖像三維音效麥克風滑鼠/鍵盤數據手套圖3-27數字博物館的系統架構圖3-27展示了該系統的整體結構。兩個跟蹤器分別固定在用戶的手套和身體上固定在身體上的跟蹤器跟蹤用戶的轉動,控制用戶在場景中漫遊的方向;附著在手套上的跟蹤器跟蹤手相對於身體的相對位置。如果手與虛擬空間中的物體發生碰撞,則利用數據手套檢測用戶的手勢命令,判斷用戶是否要抓取物體。語音命令可以輔助用戶在虛擬場景中進行漫遊。
*協同工作的虛擬現實場景Michigan大學的支持異地用戶協同工作的虛擬現實場景利用多種顯示環境,構建了如圖3-28所示,三個網路用戶分別使用BOOM(左上),CAVE(右上),以及HMD(右下)系統在同一個場景中進行交互,每個用戶看到的虛擬場景都是根據自己的視點計算得到的,用戶通過自己在虛擬環境中的替身(avatar)同其他用戶交互。每個用戶同時可以使用不同的交互設備同其他用戶自由的交流與協作。
**圖3-28支持異地協同工作的虛擬現實環境
人機交互技術*4.1人機交互技術概述
人機交互技術發生的歷史及發展趨勢
根據用戶介面的具體形式分為批處理聯機終端(命令介面)文本菜單WIMP介面多媒體用戶介面多通道用戶介面和虛擬現實用戶介面*4.1人機交互技術概述人機交互技術發生的歷史及發展趨勢
根據根據用戶介面中資訊載體的類型文本為主的字元用戶介面(CUI)二維圖形為主的圖形用戶介面(GUI)多媒體用戶介面*4.1人機交互技術概述人機交互技術發生的歷史及發展趨勢根據電腦輸出資訊的形式以符號為主的字元介面以視覺感知為主的圖形用戶介面兼顧聽覺感知的多媒體用戶介面綜合運用多種感觀(包括觸覺等)的虛擬現實技術*4.1人機交互技術概述人機交互技術發生的歷史及發展趨勢根據人機介面中的資訊維度,人機交互技術可以分為:一維資訊(主要指文本流,如早期電傳式終端)二維資訊(主要是二維圖形技術,利用了色彩、形狀、紋理等資訊)三維資訊(主要是三維圖形技術,但顯示技術仍利用二維平面為主)和多維資訊(多通道的多維資訊)空間*4.1人機交互技術概述人機交互技術發生的歷史及發展趨勢根據人機交互中採用的語言形式語言:形式語言是一種人工語言,特點是簡潔、嚴密、高效。類自然語言:類自然語言則是介於電腦語言和自然語言之間。自然語言:自然語言的語法成分有更多的規則,具有多義性、微妙、豐富、靈活的特點。*4.2命令行和文本菜單技術
4.2.1命令行
真正意義上的人機交互開始於聯機終端的出現。用戶輸入文本命令,系統也以文本的形式表示對命令的回應。這種人機介面稱為命令行介面。
**
圖4-1命令行介面概念模型命令行交互介面操作系統MS-DOS是文本命令行交互介面。
例如,需要將所有擴展名為“.AAA”的檔替換為擴展名為“.BBB”,如果在“我的電腦”或“WINDOWS資源管理器”中,需要一個一個地去查找、改名,操作的局限性是顯而易見的。利用命令rename[drive:][path]filename1filename2或ren[drive:][path]filename1filename2,使用通配符“*”或“?”,就可以方便地更改一組檔案名或擴展名。
*命令行交互介面不同的操作系統要用不同的命令進入命令行介面。在Win9x/Me的開始菜單中的運行程式中鍵入“command”命令,可進入命令行介面。在Win2000/NT的開始菜單中的運行程式中鍵入“cmd”命令,可進入命令行介面。
批處理檔(也稱為批處理程式或腳本)。批處理檔是無格式的文本檔,包含一條或多條命令,檔擴展名為
bat或cmd。
*4.2.2文本菜單
字元介面下的菜單方式:在菜單方式下用戶必須在有限的一組選項中進行識別和選擇,更多的是回應而不是發出命令。用戶不必記憶功能命令,縮短了用戶的培訓時間,減少用戶的擊鍵次數,錯誤處理能力也有了顯著提高。
在這種介面中,人還是被看成操作員,機器做出被動的反應,人只能使用手這一交互通道用鍵盤輸入選擇資訊,通過視覺通道獲取資訊,介面輸出只能為靜態的文本字元。
*文本菜單的設計設計基於文本菜單的系統主要包括兩方面的工作:菜單的生成和顯示,內部流程的控制及錯誤處理。【例4-2】圖書管理程式的主菜單的Java語言代碼。*importjava.io.*;publicclassMenuDemo{staticvoiddisplay_maintenace_menu(){System.out.print(“\n\n\t\t<<維護子菜單>>\n\n”);System.out.println(“\t1--註冊借書者”);System.out.println(“\t2--註冊圖書”);
…….System.out.println(“\t0--返回主菜單”);}publicstaticvoidmain(Stringargs[])throwsException{booleanquit=false;charch;do{display_mainmenu();ch=(char)System.in.read();switch(ch) {…….//調用相應的處理函數
}}while(!quit);Sytem.in.read();}}*4.3圖形用戶介面
圖形用戶介面又稱為WIMP介面,由窗口(windows)、圖示(icons)、菜單m)、指點設備(pointingdevice)四位一體,形成桌面(desktop)
,如圖4-2所示。圖形用戶介面是當前用戶介面的主流,廣泛應用於各檔臺式微機和圖形工作站。比較成熟的商品化系統有Apple的Macintosh、IBM的PM(PresentationManager)、Microsoft的Windows和運行於Unix環境的X-Window、OpenLook和OSF/Motif等。**圖4-2WIMP介面概念模型
4.3圖形用戶介面圖形用戶介面的共同特點是以窗口管理系統為核心,使用鍵盤和滑鼠器作為輸入設備。窗口管理系統除了基於可重疊多窗口管理技術外,廣泛採用的另一核心技術是事件驅動(event-driven)技術。*4.3圖形用戶介面WIMP介面可看作是第二代人機介面,是基於圖形方式的人機介面。在WIMP介面中,人被稱為用戶,人機通過對話進行工作。用戶只能使用手這一種交互通道輸入資訊,通過視覺通道獲取資訊。在WIMP介面中,介面的輸出可以為靜態或動態的二維圖形或圖像等資訊。*4.3圖形用戶介面這種方式能同時輸出不同種類的資訊,用戶也可以在幾個工作環境中切換而不丟失幾個工作之間的聯繫,通過菜單可以執行控制型和對話型任務。由於引入了圖示、按鈕和滾動條技術,大大減少鍵盤輸入,提高了交互效率。基於滑鼠和圖形用戶介面的交互技術極大地推動了電腦技術的普及。
*4.3.1圖形用戶介面的主要思想圖形用戶介面的三個重要思想1.桌面隱喻(desktopmetaphor)2.所見即所得(WhatYouSeeIsWhatYouGet,WYSIWYG)
3.直接操縱(directmanipulation)*1.桌面隱喻(desktopmetaphor)
桌面隱喻是指在用戶介面中用人們熟悉的桌面上的圖例清楚地表示電腦可以處理的能力。圖形具有一定的文化和語言獨立性,可以提高搜索目標的效率。圖形用戶介面中的圖例可以代表對象、動作、屬性或其他概念。
隱喻的表現方法:靜態圖示動畫視頻
*隱喻的分類:直接隱喻:隱喻本身就帶有操縱的對象如Word繪圖工具中的圖示,每種圖示分別代表不同的圖形繪製操作。工具隱喻:代表所使用的工具如用磁片圖示隱喻存盤操作、用印表機圖示隱喻列印操作等,這種隱喻設計簡單、形象直觀,應用也最為普遍。過程隱喻:其通過描述操作的過程來暗示該操作如Word中的撤銷和恢復圖示。*晦澀的隱喻不僅不能增加可用性,反而會弄巧成拙。隱喻的主要缺點:需要佔用螢幕空間難以表達和支持比較抽象的資訊。
*2.所見即所得(WYSIWYG)在WYSIWYG交互介面中顯示的用戶交互行為與應用程式最終產生的結果是一致的。
非WYSIWYG的編輯器,用戶只能看到文本的控制代碼,對於最後的輸出結果缺乏直觀的認識。
WYSIWYG的一些弊端:如果螢幕的空間或顏色的配置方案與硬體設備所提供的配置不一樣,在兩者之間就很難產生正確的匹配。文本處理器都提供了定義章、節、小節等的標記,這些標記顯式地標明瞭對象的屬性,但並不是用戶最終輸出結果的一部分。
*3.直接操縱(directanipulation)
直接操縱是指可以把操作的對象、屬性、關係顯式地表示出來,用光筆、滑鼠、觸摸屏或數據手套等指點設備直接從螢幕上獲取形象化命令與數據的過程。直接操縱的對象是命令、數據或是對數據的某種操作。
*直接操縱的特性
1.
直接操縱的對象是動作或數據的形象隱喻形象隱喻應該與其實際內容相近,使用戶能通過螢幕上的隱喻直接想像或感知其內容。2.
用指點和選擇代替鍵盤輸入用指點和選擇代替鍵盤輸入有兩個優點,一是操作簡便,速度快捷。3.
操作結果立即可見操作結果立即可見,用戶可以及時
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年高考生物一轮复习必修二第五单元遗传的基本规律试题
- 单位管理制度集粹汇编职员管理篇十篇
- 单位管理制度分享汇编【员工管理】十篇
- 单位管理制度呈现合集【员工管理】十篇
- 《团队建设与发展》课件
- 《文言文实词》综合检测汇编
- 《工作总结汇报》课件
- 第4单元 民族团结与祖国统一(A卷·知识通关练)(解析版)
- 《空冷岛技术讲解》课件
- 《汽车的磨合维护》课件
- 2024-2025学年上学期深圳初中地理七年级期末模拟卷3
- 中国马克思主义与当代思考题(附答案)
- 旅游者对鼓浪屿旅游产品的满意度调查问卷
- 人教版初二数学下册《第十七章小结与复习》课件
- 科技水晶质感产品推广PPT模板
- 化工仪表及自动化第六版-课后-答案
- 老化箱点检表A3版本
- 消防设施验收移交单
- 光伏发电项目并网调试方案
- 教师教学质量评估表(学生用)
- 2022年自考4月英语真题带解析
评论
0/150
提交评论