




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、IBM語音識別輸入系統(tǒng)(ViaVioce) V9.1 簡體中文光盤版 軟件大?。?76.08MB 軟件語言:多國語言 軟件類別:國外軟件 / 漢字輸入 運行環(huán)境:Win9x/NT/2000/XP/軟件介紹: 該系統(tǒng)可用于聲控打字和語音導(dǎo)航。只要對著微機講話,不用敲鍵盤即可打漢字,每分鐘可輸入150個漢字,是鍵盤輸入的兩倍,是普通手寫輸入的六倍。該系統(tǒng)識別率可達95%以上。并配備了高性能的麥克風(fēng),使用便利,特別適合于起草文稿、撰寫文章、和準(zhǔn)備教案,是文職人員、作家和教育工作者的良好助手。 IBM潛心研究26年,他領(lǐng)導(dǎo)了世界的語音識
2、別技術(shù),其語音識別產(chǎn)品在全球銷售已達一百萬套以上。使用語音輸入方式,您的工作空間更加自由舒暢: *即使您不會打字,也可迅速準(zhǔn)備好文稿; *只要集中精力思考問題,無須琢磨怎樣拼音,怎樣拆字; *當(dāng)您疲勞時,閉上眼、伸伸腰,雙手方在腦后,然后輕松地說:開始聽寫吧. . 注:價值超數(shù)千元的IBM的中文語音錄入工具,有耳麥的朋友可以試一試,也可以當(dāng)作學(xué)習(xí)普通話的工具,沒有理由不下載使用它。 IBM ViaVoice語音輸入系統(tǒng)詳解 作者: 艾寒出處: 天極網(wǎng) 目前漢字輸入的方式主要有四種:鍵盤輸入,手寫輸入,掃描輸入和我們現(xiàn)在要談到的語音輸入。讓我們先來了解一下這四種輸入方式。&
3、#160; 鍵盤輸入:鍵盤輸入基本上是基于各種輸入法,主要又分為字形輸入法和拼音輸入法。實際上字形輸入法是不符合人的寫作思維習(xí)慣,因為人們在措辭時,頭腦中首先反映出的是即將這個詞語的語音,所以字形輸入法更適合專業(yè)錄入人員使用。拼音輸入法也分兩種,一種以詞語為輸入單位,另一種以語句為輸入單位,而后者不符合寫作的思維習(xí)慣,因為人們在寫作時是以詞為思考單位。鍵盤輸入法在輸入速度有要求的情況下對于鍵盤操作、指法要求比較高; 手寫輸入:手寫輸入是最容易上手的輸入方法,但是同樣由于手寫輸入的先天不足,很難達到較高的輸入速度; 掃描輸入:掃描輸入對于硬件
4、要求比較高,主要是適用于資料的整理; 語音輸入:語音輸入對輸入人員的鍵盤操作能力、指法要求很低,幾乎可以說你只要會說漢語,就可以進行語音輸入。 語音輸入尤其是漢字語音輸入經(jīng)歷了很長時間的研究和應(yīng)用,到目前已經(jīng)達到了一個相當(dāng)?shù)母叨?,所以為了讓更多的人、更多不是非常熟悉電腦的人來使用電腦進行漢字輸入,我把多年以來使用IBM VIAVOICE語音輸入系統(tǒng)的心得體會寫下來,使得語音輸入這種新的漢字輸入方法能得到更廣泛的應(yīng)用。 語音輸入是基于語音模型的一種輸入方法,涉及大量運算,所以它對CPU和內(nèi)存有一定的要求,CPU頻率越高、內(nèi)存越大,
5、語音輸入就能更好地工作。不過也不需要太擔(dān)心這個問題,我使用的CPU是賽揚433,內(nèi)存96MB,基本上能很好的進行語音輸入。自然,我們還需要一個耳麥。通過使用IBM VIAVOICE,我們發(fā)現(xiàn)這個系統(tǒng)對于耳麥要求并不高,我所用的就是十塊錢買來的耳麥,當(dāng)然性能良好的耳麥對于語音輸入也有很大的幫助。 -安裝完IBM VIAVOICE后,系統(tǒng)會默認(rèn)增加一個自啟動項IBM VIAVOICE語音中心,我們可以在“開始”“程序”菜單找到它,另外在菜單中我們還可以看到一個IBM VIAVOICE文件夾。(見圖1) 圖1 一、新建用戶,建立自己的
6、語音模型 第一次打開ViaVoice時會出現(xiàn)以下界面。(如圖2) 圖2 相應(yīng)的設(shè)置很簡單,每個界面都有詳細(xì)的說明,后面的操作按照提示可以一路點“下一步”完成即可。(如圖3、4) 圖3圖4 完成以上操作之后,進入麥克風(fēng)設(shè)置完畢后,出現(xiàn)以下界面。下面我們要為自己建立語音模型,這對我們之后的語音輸入效果非常重要。(如圖5) 圖5 語音模型的建立共有五個階段: 1.在圖5中選擇“下一步”,這時會出現(xiàn)一個文本框,提示你讀出文本框中所列出的一段話。讀完后
7、,系統(tǒng)會進行語音訓(xùn)練,訓(xùn)練完畢后,最簡單的語音模型就建立完畢了,當(dāng)然可以想像得到,這樣輕松建立起來的模型效果并不是很好。然后你會看到如下界面。(如圖6) 圖6 四個部分的訓(xùn)練內(nèi)容中A是最基本的,四個部分總共有500多句話,全部訓(xùn)練完需要兩個多小時,所以要是想一勞永逸,嗓子可是要受罪,我試過,口干舌燥的,但是就我使用感覺來看,經(jīng)過A部分的訓(xùn)練,已經(jīng)可以進行基本的使用了,所以大家可以化整為零,免得一下子說傷了,失去興趣。IBM ViaVoice系統(tǒng)有自行學(xué)習(xí)的功能,所以使用時間越長,識別率越高!如同歌里唱的:越來越好,來來來 到此,
8、個人用戶(語音模型)建立完畢,我們可以正式開始使用語音輸入了。 二、語音輸入 啟動IBM ViaVoice語音中心,在屏幕上方會出現(xiàn)一個工具條。(如圖7) 圖7 在正式輸入前,需要進行音頻設(shè)置。(如圖8) 圖8 這也是影響輸入效果一個至關(guān)重要的因素,出現(xiàn)的界面是我們提到過的圖3、4及隨后的帶有提示的對話框,因為前邊已經(jīng)做過,不再累述。建議在設(shè)置完以后,最好不要改動你帶耳麥的方式,以保證麥克風(fēng)相對嘴的位置保持不變,如輸入過程中曾經(jīng)摘下、挪動過耳麥,建議最好重新進行音頻設(shè)置,當(dāng)然可以視輸入
9、效果是否明顯變化而定。 音頻設(shè)置完畢后,進入用戶選項,點擊ViaVoice選項。(如圖9) 圖9 通過“用戶名”下拉菜單選擇相應(yīng)的用戶。(如圖10) 圖10 其中“語音”、“聽寫”、“直接聽寫”和“糾錯”涉及一些比較高級的設(shè)置,推薦使用默認(rèn)設(shè)置,不要改動,當(dāng)使用比較熟練后可以做相應(yīng)調(diào)整。(如圖11) 圖11 這兩項工作(音頻設(shè)置和用戶選項)做好以后,單擊工具欄上的麥克風(fēng)圖標(biāo),圖標(biāo)變?yōu)榫G色時,就可以開始正常工作了。(如圖12) 圖12
10、; 這個時候,你就要出言謹(jǐn)慎了,你所說的每一句話系統(tǒng)可能都有反應(yīng),你可以對它說:“幫助”,它會調(diào)出幫助內(nèi)容;你可以說“關(guān)閉”,它會關(guān)閉當(dāng)前的任務(wù);你打哈欠,它會顯示“沒聽清您說什么,能再說一遍嗎?”;你說“格式化”,(沒有反應(yīng),開玩笑的) ViaVoice可以嵌入Word里,但是推薦使用其自帶的語音板,您可以對著麥克風(fēng)說:“聽寫到語音板”,也可以通過菜單調(diào)出。(如圖13) 圖13 出現(xiàn)一個類似“寫字板”的編輯界面,其操作很簡單,不多說,唯一需要說明的就是“糾錯”, 使用語音輸入不可避免的會出現(xiàn)系統(tǒng)
11、的“理解”錯誤,這個時候糾錯對于調(diào)整語音模型、編輯文檔就格外重要,選中輸入錯誤的詞,在下面這個例子中,筆者想輸入的是“越應(yīng)”,而輸出的是“也因”,選中后點“糾錯”按鈕,或者對麥克風(fēng)說“糾錯”,會出現(xiàn)以下界面,如果候選詞中沒有待選詞,可以用其他輸入法輸入,系統(tǒng)將把這個詞作為“新詞”加入。(如圖14) 圖14 其他一般菜單指令如“全選”“復(fù)制”“粘貼”“刪除”“格式”“保存”“退出”等都可以通過語音控制,大家可以在熟悉語音輸入后加強運用,完全可能用嘴來進行這些編輯操作。 在完成聽寫、關(guān)閉聽寫文檔以后,IBM ViaVoice系統(tǒng)會依據(jù)需要提示用戶是否學(xué)習(xí)
12、剛才輸入的文章,并將其中涉及的新詞提取出來由用戶確定是否學(xué)習(xí)并加入詞匯庫中;在完成一定量的語音輸入后,系統(tǒng)會適時進行語音訓(xùn)練,以期更好的在日后的輸入工作中為用戶服務(wù)。 是使用Word還是聽寫板可以視用戶習(xí)慣而定,所謂“當(dāng)前應(yīng)用程序”,比如你用QQ聊天,只要選擇“聽寫到當(dāng)前應(yīng)用程序”,就可以在聊天對話框中進行語音輸入,當(dāng)然這個時候無法享受“糾錯”服務(wù)了,但是輸入速度肯定比手打要快多了。 你也可以打開FOXMAIL,選擇“聽寫到當(dāng)前應(yīng)用程序”說一句“新建郵件”,然后說“收件人”,F(xiàn)OXMAIL就會調(diào)出地址簿,選好后(這個時候手選可能還是比嘴好使一些),說
13、“主題”,光標(biāo)會在主題欄中閃,總而言之,你盡可以用嘴來撰寫郵件;其他應(yīng)用,不一而足,你會發(fā)現(xiàn)一旦IBM ViaVoice工作步入正軌,給我們帶來的方便是巨大的。 三、更好的發(fā)揮IBM ViaVoice的作用 1.堅持使用 量的積累會導(dǎo)致質(zhì)的飛躍,系統(tǒng)所建立的個人語音模型會越來越完備,這一點尤其適合有一定口音的用戶。 2.勿忘設(shè)置 每次進行輸入前,最好進行“音頻設(shè)置”,這對于提高識別率有很大的作用,所謂“磨刀不誤砍柴工”。 3.注意文體 這一點
14、是我的使用體會,在IBM ViaVoice使用手冊中沒有提到這一點,IBM ViaVoice語音系統(tǒng)一是準(zhǔn)確辨認(rèn)你的實際發(fā)音,二是根據(jù)語音模型根據(jù)上下文推測你實際說的那個詞語(同音詞畢竟很多),所以其實IBM ViaVoice系統(tǒng)更適合具有一定規(guī)范行文格式的文章,如公文、新聞報道、社論、論文等等,如果你試圖用這個系統(tǒng)輸入散文、詩歌、文言文,會非常困難。 4.充分開發(fā) 如前文所述,IBM ViaVoice語音輸入系統(tǒng)還有一些高級設(shè)置,等大家使用得較為得心應(yīng)手時,可以逐步發(fā)掘,讓IBM ViaVoice系統(tǒng)更好的發(fā)揮作用。 5.加強備份 隨時備份個人用戶檔案,必要時,可以將你的模型移植到別人的機器上,這樣你不用再重頭來過了,這樣也擴大了其應(yīng)用范圍。 四、IBM ViaVoice不
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 藥庫設(shè)備維護管理制度
- 藥店獎罰規(guī)章管理制度
- 藥店設(shè)備投放管理制度
- 營林防火安全管理制度
- 設(shè)備公司營銷管理制度
- 設(shè)備安全細(xì)節(jié)管理制度
- 設(shè)備現(xiàn)場施工管理制度
- 設(shè)施權(quán)屬清冊管理制度
- 設(shè)計單位員工管理制度
- 詐騙公司經(jīng)營管理制度
- 項目部內(nèi)審檢查表
- 森林計測學(xué)(測樹學(xué))智慧樹知到答案章節(jié)測試2023年浙江農(nóng)林大學(xué)
- 對外漢語教學(xué)法智慧樹知到答案章節(jié)測試2023年西北師范大學(xué)
- 春雨計劃患教指南-高血壓治療與合理用藥
- jgj113-2015建筑玻璃技術(shù)規(guī)范
- 陜西延長石油四海煤化工有限公司金屬鎂廠1萬噸-年金屬鎂生產(chǎn)項目環(huán)評報告
- 學(xué)校校本課程開辟匯報材料
- GB/T 42103-2022游樂園安全風(fēng)險識別與評估
- YY 0780-2018電針治療儀
- 棒球運動主題教育PPT模板
- GA/T 1556-2019道路交通執(zhí)法人體血液采集技術(shù)規(guī)范
評論
0/150
提交評論