让电脑听话课件_第1页
让电脑听话课件_第2页
让电脑听话课件_第3页
让电脑听话课件_第4页
让电脑听话课件_第5页
已阅读5页,还剩32页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、讓電腦聽話報告組別;電腦組小組成員:林育丞 、許耕敏 、施智翔 、吳泰羽指導老師:郭人豪老師 讓電腦聽話報告組別;電腦組報告大綱導論研究目的名詞解釋及相關知識探討研究過程研究結論報告大綱導論導論 語音辨識的應用範圍很廣,例如語音輸入與聲紋之身份辨識即是,語音輸入的最大好處是它非常合乎人的自然行為習慣,對於不習慣使用鍵盤輸入電腦資料的人,特別是中文輸入,有了語音輸入的方法之後,就不必辛苦地學習各種中文輸入法來迎合電腦。 導論 語音辨識的應用範圍很廣,例如語音輸入與聲紋之身份辨識即研究目的 研讀相關資料,使我們能了解電腦如何儲存聲音及辨識聲音,並透過實際操作了解語音辨識的過程。 研究目的 研讀相關

2、資料,使我們能了解電腦如何儲存聲音及辨識聲名詞解釋及相關知識探討 聲音的本質聲音數位化取樣頻率解析度消除靜音 音框 語音辨識的原理語音辨識的方法名詞解釋及相關知識探討 聲音的本質聲音的本質聲音,是泛指任何我們耳朵所能聽見的聲音。 任何聲音都以波的形式表示,而聲音訊號的波形,可在不同的時間區段上找到不同的週期。非固定式訊號。聲音的本質聲音,是泛指任何我們耳朵所能聽見的聲音。 數位化透過麥克風我們把聲音傳到電腦裡面,這中間的過程稱為數位化。原來連續的訊號,經過數位化的處理,變成一種不連續的訊號。數位化透過麥克風我們把聲音傳到電腦裡面,這中間的過程稱為數位取樣頻率定義:每分鐘取樣的次數。取樣的頻率越

3、高,所需的儲存記憶體就越大,這會導致辨識的時間過長,因此本研究中取樣皆以8000HZ(每分鐘8000次)為基準,這樣就不會花太多時間在辨識也不會讓聲音失真。取樣頻率定義:每分鐘取樣的次數。取樣失真所得的聲音取樣值便不能代表原來訊號。取樣頻率需大於兩倍聲音頻率,否則會造成取樣失真。對語音訊號取樣時,語音最高頻率不會超過4000Hz,所以取樣頻率定在 8000Hz以上,就保證取樣失真不發生。取樣失真所得的聲音取樣值便不能代表原來訊號。取樣頻率需大於兩解析度定義:每個取樣點用多少bit(位元,一個0或1稱為1個bit。)來表示聲音。經過電腦取樣後,聲音檔案就出現了頻率(HZ)及(BIT)兩個單位HZ

4、=1分鐘取樣的次數 BIT=每次取樣所用的值大小解析度定義:每個取樣點用多少bit(位元,一個0或1稱為1個消除靜音為何要消除靜音?如何消除靜音? 能量量測法: 1.找出所有音框能量總和的平均值,設定為門檻值 2.以門檻值來區分有聲或無聲區域 3.刪除無聲區域 消除靜音為何要消除靜音?音框音框是語音處理的最小單位大小沒有一定標準,使用者自訂一個音框可以計算出一個語音特徵值音框音框是語音處理的最小單位為何要取音框(frame)處理語音訊號這種不固定週期式的訊號時,最好先將其分段處理,把每一段當成一個固定的訊號,而這一小段部份就被稱為“音框”。為何要取音框(frame)處理語音訊號這種不固定週期式

5、的訊號如何取音框如何取音框語音辨識的原理步驟如下:類比到數位的轉換 聲音樣本與測試樣本進行比對工作 找出最相似的語音輸出結果語音辨識的原理步驟如下:語音辨識的方法相似度比較法 測試樣本參照樣本集輸入比對找出最相似辨識結果範例:輸入測試樣本;2參照樣本集:1、2、320比對後找出最相似結果:2範例:輸入測試樣本;a參照樣本集:1、2、320比對後找出最相似結果:2語音辨識的方法相似度比較法 測試樣本參照樣本集輸入找出最相似如何計算相似度設待測音框為a1、a2、a3an, (n=音框數)設參照音框為b1、b2、b3bn, (n=音框數)語音相似度=a1與b1的相似度 + a2與b2的相似度 + +

6、an與bn的相似度音框相似度的計算則需使用到多變數的高思機率密度函數,因其中數學理論過於深奧,超過國中生所能理解的程度,所以我們僅使用不予以探討 如何計算相似度設待測音框為a1、a2、a3an, (n=音研究過程 提出問題提出假設及驗證假設的方法錄製聲音語音處理去除靜音調整聲音格式(8000HZ、16bit及單聲道) 訓練對照組,取得聲音特徵值進行待測聲音與對照組的語音辨識數據分析及驗證假設研究過程 提出問題問題與假設如何判斷電腦辨別聲音成功?假設存在有一門檻值來判別是否為辨識成功是否能正確辨別同性別及不同性別的聲音(以正常語調)?假設同性別聲音的相似度會較高是否能正確辨別不同年紀(不分男女)

7、的聲音?假設同年齡的相似度會較高問題與假設如何判斷電腦辨別聲音成功?錄製聲音名單陳品軒徐靖洋鍾博全馮育瑋王俊立15歲男15歲男15歲男15歲男15歲男董子瑜呂孟錡柳科竹黃冠維吳俊毅15歲男15歲男15歲男15歲男15歲男吳家成歐光哲吳旻軒李采臻王思亭15歲男15歲男15歲男15歲女15歲女李穎俐吳家瑩盧奐蓁伍曼妮黃婉婷15歲女15歲女15歲女15歲女15歲女屈于翔顏大凱郭人豪林勁曄黃俞菁15歲女30歲男30歲男30歲男30歲女朱芳儀王佳慧張雲雄李龍輝翁秋蘭30歲女30歲女50歲男50歲男40歲女張帶金40歲女錄製聲音名單陳品軒徐靖洋鍾博全馮育瑋王俊立15歲男15歲男1如何判斷電腦辨別聲音成功?

8、假設:訂定辨別的語音(NO)後錄製足夠的聲音樣本進行語音處理(靜音及儲存格式)取得判別成功門檻相似度超過門檻值則代表此聲音與對照聲音同,反之則否如何判斷電腦辨別聲音成功?假設:對照組聲音名單姓名陳品軒徐靖洋鍾博全李采臻王思亭李穎俐聲音編號15-1-115-1-215-1-315-2-115-2-215-2-3姓名顏大凱郭人豪林勁曄黃俞菁朱芳儀王佳慧聲音編號30-1-130-1-230-1-330-2-130-2-230-2-3姓名張雲雄李龍輝翁秋蘭張帶金聲音編號50-1-150-1-250-2-150-2-2編碼方法:年齡-性別-編號對照組聲音名單姓名陳品軒徐靖洋鍾博全李采臻王思亭李穎俐聲音編

9、語音處理步驟如下:去除靜音調整聲音格式(8000HZ、16bit及單聲道) 語音處理步驟如下:訓練對照組,取得特徵值1.選擇聲音2.加入聲音3.開始訓練4.訓練完成, 取得特徵參數訓練對照組,取得特徵值1.選擇聲音2.加入聲音3.開始訓練4對照組訓練結果對照組訓練完畢後,我們會取得16組的特徵參數接下來將16組聲音(NO)與對照組作語音辨識,使用VB程式計算其相似度對照組訓練結果對照組訓練完畢後,我們會取得16組的特徵參數語音辨識1.將對照組讀入2.開始辨識語音辨識1.將對照組讀入2.開始辨識如何判斷電腦辨別聲音成功?驗證:16組語音與對照組相似度,如下表如何判斷電腦辨別聲音成功?驗證:如何判

10、斷電腦辨別聲音成功?失敗的原因分析聲音大小不一有的聲音唸太快 改善做法利用GoldenWave將音量統一為0db,並且更替唸太快的聲音重新辨識 (db,分貝,為聲音的音量,0db並非無音量,且可使雜音影響最小)如何判斷電腦辨別聲音成功?失敗的原因分析如何判斷電腦辨別聲音成功?重新取得對照組相似度:門檻值定為836如何判斷電腦辨別聲音成功?重新取得對照組相似度:門檻值定為8如何判斷電腦辨別聲音成功?以作為待測聲音取得跟的相似度:很明顯的發現很多組相似度都超過了門檻值,與假設不合如何判斷電腦辨別聲音成功?以作為待測聲音如何判斷電腦辨別聲音成功?檢討失敗原因討論後的結果是:或許不該用相似度最低值來當

11、做辨別成功門檻值,應該以相似度平均值的最低值 (平均最低值為1983)來作為辨別門檻會較為可信 如何判斷電腦辨別聲音成功?檢討失敗原因如何判斷電腦辨別聲音成功?驗證:三組相似度平均值的確皆小於1983結論:電腦可以成功辨別不同聲音如何判斷電腦辨別聲音成功?驗證:是否能正確辨別男女的聲音?(黃同性別比對分數,灰異性別比對分數) 是否能正確辨別男女的聲音?(黃同性別比對分數,灰異性別比是否能正確辨別同性別及不同性別的聲音?分析以上數據,可以明顯發現,同性別的相似度平均值高於不同性別的相似度平均值高,由此證明電腦能正確辨別同性別及不同性別的聲音(以正常語調)。是否能正確辨別同性別及不同性別的聲音?是否能正確辨別不同年紀的聲音?根據下表數據可得知:15歲組不合乎假設,同年齡層的相似度為最低。各組分數十分接近因此得知電腦無法正確辨別不同年紀(不分男女)的聲音。 是否能正確辨別不同年紀的聲音?根據下表數據可得知:研究結論1.發現聲音音量會影響到相似度辨識結果 Example: 30-2-1 原音量太大聲 造成分數都是負數,因此減低音量 得到分數749為正常2.聲音唸太快電腦無法辨識3

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论