IBM語音識別輸入系統(tǒng)_第1頁
IBM語音識別輸入系統(tǒng)_第2頁
IBM語音識別輸入系統(tǒng)_第3頁
IBM語音識別輸入系統(tǒng)_第4頁
IBM語音識別輸入系統(tǒng)_第5頁
已閱讀5頁,還剩6頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、IBM語音識別輸入系統(tǒng)(ViaVioce) V9.1 簡體中文光盤版  軟件大?。?76.08MB 軟件語言:多國語言  軟件類別:國外軟件 / 漢字輸入  運行環(huán)境:Win9x/NT/2000/XP/軟件介紹: 該系統(tǒng)可用于聲控打字和語音導(dǎo)航。只要對著微機講話,不用敲鍵盤即可打漢字,每分鐘可輸入150個漢字,是鍵盤輸入的兩倍,是普通手寫輸入的六倍。該系統(tǒng)識別率可達95%以上。并配備了高性能的麥克風(fēng),使用便利,特別適合于起草文稿、撰寫文章、和準(zhǔn)備教案,是文職人員、作家和教育工作者的良好助手。 IBM潛心研究26年,他領(lǐng)導(dǎo)了世界的語音識

2、別技術(shù),其語音識別產(chǎn)品在全球銷售已達一百萬套以上。使用語音輸入方式,您的工作空間更加自由舒暢: *即使您不會打字,也可迅速準(zhǔn)備好文稿; *只要集中精力思考問題,無須琢磨怎樣拼音,怎樣拆字; *當(dāng)您疲勞時,閉上眼、伸伸腰,雙手方在腦后,然后輕松地說:開始聽寫吧. . 注:價值超數(shù)千元的IBM的中文語音錄入工具,有耳麥的朋友可以試一試,也可以當(dāng)作學(xué)習(xí)普通話的工具,沒有理由不下載使用它。 IBM ViaVoice語音輸入系統(tǒng)詳解 作者: 艾寒出處: 天極網(wǎng)  目前漢字輸入的方式主要有四種:鍵盤輸入,手寫輸入,掃描輸入和我們現(xiàn)在要談到的語音輸入。讓我們先來了解一下這四種輸入方式。&

3、#160; 鍵盤輸入:鍵盤輸入基本上是基于各種輸入法,主要又分為字形輸入法和拼音輸入法。實際上字形輸入法是不符合人的寫作思維習(xí)慣,因為人們在措辭時,頭腦中首先反映出的是即將這個詞語的語音,所以字形輸入法更適合專業(yè)錄入人員使用。拼音輸入法也分兩種,一種以詞語為輸入單位,另一種以語句為輸入單位,而后者不符合寫作的思維習(xí)慣,因為人們在寫作時是以詞為思考單位。鍵盤輸入法在輸入速度有要求的情況下對于鍵盤操作、指法要求比較高;  手寫輸入:手寫輸入是最容易上手的輸入方法,但是同樣由于手寫輸入的先天不足,很難達到較高的輸入速度;  掃描輸入:掃描輸入對于硬件

4、要求比較高,主要是適用于資料的整理;  語音輸入:語音輸入對輸入人員的鍵盤操作能力、指法要求很低,幾乎可以說你只要會說漢語,就可以進行語音輸入。  語音輸入尤其是漢字語音輸入經(jīng)歷了很長時間的研究和應(yīng)用,到目前已經(jīng)達到了一個相當(dāng)?shù)母叨?,所以為了讓更多的人、更多不是非常熟悉電腦的人來使用電腦進行漢字輸入,我把多年以來使用IBM VIAVOICE語音輸入系統(tǒng)的心得體會寫下來,使得語音輸入這種新的漢字輸入方法能得到更廣泛的應(yīng)用。  語音輸入是基于語音模型的一種輸入方法,涉及大量運算,所以它對CPU和內(nèi)存有一定的要求,CPU頻率越高、內(nèi)存越大,

5、語音輸入就能更好地工作。不過也不需要太擔(dān)心這個問題,我使用的CPU是賽揚433,內(nèi)存96MB,基本上能很好的進行語音輸入。自然,我們還需要一個耳麥。通過使用IBM VIAVOICE,我們發(fā)現(xiàn)這個系統(tǒng)對于耳麥要求并不高,我所用的就是十塊錢買來的耳麥,當(dāng)然性能良好的耳麥對于語音輸入也有很大的幫助。  -安裝完IBM VIAVOICE后,系統(tǒng)會默認(rèn)增加一個自啟動項IBM VIAVOICE語音中心,我們可以在“開始”“程序”菜單找到它,另外在菜單中我們還可以看到一個IBM VIAVOICE文件夾。(見圖1)  圖1  一、新建用戶,建立自己的

6、語音模型  第一次打開ViaVoice時會出現(xiàn)以下界面。(如圖2)  圖2  相應(yīng)的設(shè)置很簡單,每個界面都有詳細(xì)的說明,后面的操作按照提示可以一路點“下一步”完成即可。(如圖3、4)  圖3圖4  完成以上操作之后,進入麥克風(fēng)設(shè)置完畢后,出現(xiàn)以下界面。下面我們要為自己建立語音模型,這對我們之后的語音輸入效果非常重要。(如圖5) 圖5  語音模型的建立共有五個階段:  1.在圖5中選擇“下一步”,這時會出現(xiàn)一個文本框,提示你讀出文本框中所列出的一段話。讀完后

7、,系統(tǒng)會進行語音訓(xùn)練,訓(xùn)練完畢后,最簡單的語音模型就建立完畢了,當(dāng)然可以想像得到,這樣輕松建立起來的模型效果并不是很好。然后你會看到如下界面。(如圖6)  圖6  四個部分的訓(xùn)練內(nèi)容中A是最基本的,四個部分總共有500多句話,全部訓(xùn)練完需要兩個多小時,所以要是想一勞永逸,嗓子可是要受罪,我試過,口干舌燥的,但是就我使用感覺來看,經(jīng)過A部分的訓(xùn)練,已經(jīng)可以進行基本的使用了,所以大家可以化整為零,免得一下子說傷了,失去興趣。IBM ViaVoice系統(tǒng)有自行學(xué)習(xí)的功能,所以使用時間越長,識別率越高!如同歌里唱的:越來越好,來來來  到此,

8、個人用戶(語音模型)建立完畢,我們可以正式開始使用語音輸入了。  二、語音輸入  啟動IBM ViaVoice語音中心,在屏幕上方會出現(xiàn)一個工具條。(如圖7)  圖7  在正式輸入前,需要進行音頻設(shè)置。(如圖8) 圖8  這也是影響輸入效果一個至關(guān)重要的因素,出現(xiàn)的界面是我們提到過的圖3、4及隨后的帶有提示的對話框,因為前邊已經(jīng)做過,不再累述。建議在設(shè)置完以后,最好不要改動你帶耳麥的方式,以保證麥克風(fēng)相對嘴的位置保持不變,如輸入過程中曾經(jīng)摘下、挪動過耳麥,建議最好重新進行音頻設(shè)置,當(dāng)然可以視輸入

9、效果是否明顯變化而定。  音頻設(shè)置完畢后,進入用戶選項,點擊ViaVoice選項。(如圖9) 圖9  通過“用戶名”下拉菜單選擇相應(yīng)的用戶。(如圖10)  圖10  其中“語音”、“聽寫”、“直接聽寫”和“糾錯”涉及一些比較高級的設(shè)置,推薦使用默認(rèn)設(shè)置,不要改動,當(dāng)使用比較熟練后可以做相應(yīng)調(diào)整。(如圖11)  圖11  這兩項工作(音頻設(shè)置和用戶選項)做好以后,單擊工具欄上的麥克風(fēng)圖標(biāo),圖標(biāo)變?yōu)榫G色時,就可以開始正常工作了。(如圖12)  圖12 

10、; 這個時候,你就要出言謹(jǐn)慎了,你所說的每一句話系統(tǒng)可能都有反應(yīng),你可以對它說:“幫助”,它會調(diào)出幫助內(nèi)容;你可以說“關(guān)閉”,它會關(guān)閉當(dāng)前的任務(wù);你打哈欠,它會顯示“沒聽清您說什么,能再說一遍嗎?”;你說“格式化”,(沒有反應(yīng),開玩笑的)  ViaVoice可以嵌入Word里,但是推薦使用其自帶的語音板,您可以對著麥克風(fēng)說:“聽寫到語音板”,也可以通過菜單調(diào)出。(如圖13)  圖13  出現(xiàn)一個類似“寫字板”的編輯界面,其操作很簡單,不多說,唯一需要說明的就是“糾錯”,  使用語音輸入不可避免的會出現(xiàn)系統(tǒng)

11、的“理解”錯誤,這個時候糾錯對于調(diào)整語音模型、編輯文檔就格外重要,選中輸入錯誤的詞,在下面這個例子中,筆者想輸入的是“越應(yīng)”,而輸出的是“也因”,選中后點“糾錯”按鈕,或者對麥克風(fēng)說“糾錯”,會出現(xiàn)以下界面,如果候選詞中沒有待選詞,可以用其他輸入法輸入,系統(tǒng)將把這個詞作為“新詞”加入。(如圖14) 圖14  其他一般菜單指令如“全選”“復(fù)制”“粘貼”“刪除”“格式”“保存”“退出”等都可以通過語音控制,大家可以在熟悉語音輸入后加強運用,完全可能用嘴來進行這些編輯操作。  在完成聽寫、關(guān)閉聽寫文檔以后,IBM ViaVoice系統(tǒng)會依據(jù)需要提示用戶是否學(xué)習(xí)

12、剛才輸入的文章,并將其中涉及的新詞提取出來由用戶確定是否學(xué)習(xí)并加入詞匯庫中;在完成一定量的語音輸入后,系統(tǒng)會適時進行語音訓(xùn)練,以期更好的在日后的輸入工作中為用戶服務(wù)。  是使用Word還是聽寫板可以視用戶習(xí)慣而定,所謂“當(dāng)前應(yīng)用程序”,比如你用QQ聊天,只要選擇“聽寫到當(dāng)前應(yīng)用程序”,就可以在聊天對話框中進行語音輸入,當(dāng)然這個時候無法享受“糾錯”服務(wù)了,但是輸入速度肯定比手打要快多了。  你也可以打開FOXMAIL,選擇“聽寫到當(dāng)前應(yīng)用程序”說一句“新建郵件”,然后說“收件人”,F(xiàn)OXMAIL就會調(diào)出地址簿,選好后(這個時候手選可能還是比嘴好使一些),說

13、“主題”,光標(biāo)會在主題欄中閃,總而言之,你盡可以用嘴來撰寫郵件;其他應(yīng)用,不一而足,你會發(fā)現(xiàn)一旦IBM ViaVoice工作步入正軌,給我們帶來的方便是巨大的。  三、更好的發(fā)揮IBM ViaVoice的作用  1.堅持使用  量的積累會導(dǎo)致質(zhì)的飛躍,系統(tǒng)所建立的個人語音模型會越來越完備,這一點尤其適合有一定口音的用戶。  2.勿忘設(shè)置  每次進行輸入前,最好進行“音頻設(shè)置”,這對于提高識別率有很大的作用,所謂“磨刀不誤砍柴工”。  3.注意文體  這一點

14、是我的使用體會,在IBM ViaVoice使用手冊中沒有提到這一點,IBM ViaVoice語音系統(tǒng)一是準(zhǔn)確辨認(rèn)你的實際發(fā)音,二是根據(jù)語音模型根據(jù)上下文推測你實際說的那個詞語(同音詞畢竟很多),所以其實IBM ViaVoice系統(tǒng)更適合具有一定規(guī)范行文格式的文章,如公文、新聞報道、社論、論文等等,如果你試圖用這個系統(tǒng)輸入散文、詩歌、文言文,會非常困難。  4.充分開發(fā)  如前文所述,IBM ViaVoice語音輸入系統(tǒng)還有一些高級設(shè)置,等大家使用得較為得心應(yīng)手時,可以逐步發(fā)掘,讓IBM ViaVoice系統(tǒng)更好的發(fā)揮作用。  5.加強備份  隨時備份個人用戶檔案,必要時,可以將你的模型移植到別人的機器上,這樣你不用再重頭來過了,這樣也擴大了其應(yīng)用范圍。  四、IBM ViaVoice不

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論