人工智能語音交互報告_第1頁
人工智能語音交互報告_第2頁
人工智能語音交互報告_第3頁
人工智能語音交互報告_第4頁
人工智能語音交互報告_第5頁
已閱讀5頁,還剩2頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、人工智能課程報告課程名稱 人工智能報告時間學(xué)生姓名學(xué) 號專 業(yè)計算機科學(xué)與技術(shù)任課教師一、人工智能簡介1二、人工智能的分類1三、人工智能技術(shù)一語咅交互1四、語咅交互的主要應(yīng)用3五、語咅交互的難點41、技術(shù)層面:與硬件整合42、智能化:整合產(chǎn)業(yè)鏈,形成知識庫4六、語咅交互的未來5一、人工智能簡介人工智能(artificial intelligence),英文縮寫為人工智能。它是研究、開發(fā)用 于模擬、延伸和擴展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門新的技術(shù)科學(xué)。人 工智能是計算機科學(xué)的一個分支,它企圖了解智能的實質(zhì),并生產(chǎn)出一種新的能以人類 智能相似的方式做出反應(yīng)的智能機器,該領(lǐng)域的研究包括機

2、器人、語言識別、圖像識別、 口然語言處理和專家系統(tǒng)等。人工智能從誕生以來,理論和技術(shù)日益成熟,應(yīng)用領(lǐng)域也 不斷擴大,可以設(shè)想,未來人工智能帶來的科技產(chǎn)品,將會是人類智慧的“容器”。人工智能是對人的意識、思維的信息過程的模擬。人工智能不是人的智能,但能像 人那樣思考、也可能超過人的智能。二、人工智能的分類總體來講,目前對人工智能的定義大多可劃分為四類,即機器“像人一樣思考”、 “像人一樣行動”、“理性地思考”和“理性地行動”。這里“行動”應(yīng)廣義地理解為 采取行動,或制定行動的決策,而不是肢體動作。主流科研集中在弱人工智能上,并且 一般認為這一研究領(lǐng)域已經(jīng)取得可觀的成就。當(dāng)然,還有一種說法將人工智

3、能分為弱人工智能,強人工智能,超人工智能三種。首先弱人工智能是指不可能制造岀能真正地推理和解決問題的智能機器,這些機器 只不過看起來像是智能的,但是并不真正擁有智能,也不會有自主意識。其次,強人工智能是指有可能制造出真正能推理和解決問題的智能機器,并且,這 樣的機器能將被認為是有知覺的,有自我意識的。強人工智能可以有兩類:1 類人的人工智能,即機器的思考和推理就像人的思維一樣。2 非類人的人工智能,即機器產(chǎn)生了和人完全不一樣的知覺和意識,使用和人完全不 一樣的推理方式。而所謂的超人工智能,現(xiàn)在其實還沒冇出現(xiàn)過,因為這個超人工智能是通過自我改 進來達成強人工智能的人工智能,會把“人類水平的智能”

4、當(dāng)作一個重要的里程碑,但 是介于在強人工智能的表現(xiàn),我們冇理出相信它會人幅度地甩開人類,成為一個全能的 “上帝”,這樣的場景其實很多人都不會愿意看到。三、人工智能技術(shù)一語音交互大數(shù)據(jù)的不斷豐富,計算速度的日益捉高再加上人機交互的重大突破,三個條件都 已經(jīng)具備,弱人工智能向強人工智能的進化呼z欲岀。這個時候,google 2008年開始做語音搜索(voice search), apple 2009年收購 siri,將語音交互推到了實用;2014年11月,亞馬遜推出的家居虛擬助手設(shè)備echo 廣受關(guān)注。這一切的一切,都說明了一件事個名為“語音交互”的新技術(shù)正在以意想不到的速度發(fā)展著。基于語音的智能

5、人機交互是當(dāng)前人機交互技術(shù)的主要表現(xiàn)形式,語音人機交互過程 包括信息輸入和輸出的交互、語音處理、語義分析、智能邏輯處理以及知識和內(nèi)容的整交互界面(電腦或各種設(shè)備)信息輸入(文本、語音等)/信息輸出(多媒體)/本地切能調(diào)用知識和內(nèi)容整合(知識體系和開發(fā)框架)知識庫/對話庫/垂直搜素/信息0箱/數(shù)據(jù)挖掘合。圖2智能語音人機交互過程結(jié)合語咅人機交互過程,可以看出智能語咅人機交互關(guān)鍵技術(shù)主耍如f:(-)門然語言處理包括中文分詞、詞性標(biāo)注、實體識別、句法分析、動文本分類等技術(shù)。(-)語義分析和理解包括知識表示、本體理論、分領(lǐng)域的語義網(wǎng)絡(luò)、機器推理等。(三)知識構(gòu)建和學(xué)習(xí)體系包括搜索技術(shù)、網(wǎng)絡(luò)爬蟲、數(shù)據(jù)挖

6、掘、知識獲取、機器學(xué)習(xí)等技術(shù)。(四)語咅技術(shù)包括語咅識別、語咅合成和聲紋識別等。(五) 整合通信技術(shù)包括跨平臺即時通訊整合技術(shù)、超大負載消息集群處理技術(shù)、移動客戶端開發(fā)技術(shù)。(六) 云計算基礎(chǔ)技術(shù)包括海量數(shù)據(jù)分布式存儲、統(tǒng)計和分析技術(shù)。四. 語音交互的主要應(yīng)用語音交互方式替代文本交互方式,可以增強信息輸入方式,能和更多的設(shè)備進行整 合,市場前景廣闊。目前,智能語音人機交互技術(shù)已經(jīng)廣泛應(yīng)用到智能客服、智能終端 等領(lǐng)域,切實深入到人們的生活。()智能客服智能客服是以自然語言處理和智能人機交互等多種人工智能技術(shù)為基礎(chǔ),通過即時 通訊、網(wǎng)頁、短信等形式,以擬人化方式與用戶進行實吋交互的軟件系統(tǒng),能夠?qū)?/p>

7、現(xiàn)智 能客服咨詢和產(chǎn)品營銷推廣等功能。如果在智能客服的交互前端接入經(jīng)過領(lǐng)域語料訓(xùn)練 的語音識別能力,智能客服機器人就可以順利的接入到目前的電話呼叫中心。傳統(tǒng)的客戶服務(wù)中心以屯話呼叫中心為主,并且很多大型服務(wù)企業(yè)在不斷拓展更為經(jīng)濟 高效的屯子渠道,如網(wǎng)上在線客服、短信、智能手機應(yīng)用等。而以領(lǐng)域客戶化知識庫建 設(shè)為核心工作,并通過文本或語音等方式交互的智能客服系統(tǒng)則町以有效地和多渠道的 客戶服務(wù)中心做整合。在大幅縮減客服成本的同時,能夠冇效減少人工成本,增強用戶 體驗,從而提升服務(wù)的質(zhì)量和企業(yè)創(chuàng)新的品牌形象。第二代(2g)第四代(4g)基于faq簡單通用分詞關(guān)鍵詞匹配元上下文記憶無渠道舷faq.j

8、g具有一走結(jié)構(gòu)的嘗 戶咖識庫采用搜素技術(shù),進 行相1姬計算處理過程中領(lǐng)域待 征明顯有簡單上下文記憶軸多題第三代(3g) 語義、本體、交互引入本體持征形成領(lǐng)域內(nèi)語義網(wǎng)絡(luò)交互持征明顯智能處 牡下墳聯(lián)己憶誌昨憶.并彩咆交互支持語音全渠道整合自發(fā)育謬記憶能力.更k智能化的上下:發(fā)育皆走方向上自我核心能力標(biāo)準(zhǔn)化.平臺實驗室商業(yè)化產(chǎn)品化圖3客服系統(tǒng)技術(shù)和產(chǎn)業(yè)化路徑國外的智能客服系統(tǒng)市場發(fā)展較早,信息系統(tǒng)發(fā)展相對完善(尤其是crm系統(tǒng)), 人工服務(wù)的成本較高,促使企業(yè)有較人的動力采用智能客服系統(tǒng),智能客服技術(shù)提供商 和客戶較多。而在國內(nèi),rfr丁企業(yè)的信息系統(tǒng)發(fā)展相對滯后,人力成本相對較低,企業(yè)采用智能 客

9、服系統(tǒng)的動力嚴(yán)重不足。近幾年,隨著犬家對智能客服的認知的提高,對新技術(shù)采用 相對比較積極的屯信運營商、金融領(lǐng)域已有多家采用了智能客服系統(tǒng)。隨著人們對智能客服系統(tǒng)服務(wù)價值的認知度的提高,以及交互習(xí)慣的形成,智能客服系 統(tǒng)的社會價值和經(jīng)濟價值將會進一步顯現(xiàn)。以中國移動的客服機器人測算,目前移動集 團在全國的人工客服坐席以io萬計,一個坐席一年的運營平均成本為10萬,采用智能 客服可以節(jié)約20%的開銷,僅移動行業(yè)一年就可以節(jié)約成木20億。據(jù)gartner預(yù)計,到 2013年全球1000強公司中至少有15%會采用智能客服系統(tǒng)來提高服務(wù)水平。(二)智能終端以智能手機、平板屯腦、智能屯視、智能車載為代表的

10、智能終端是智能語音人機交 互技術(shù)最廣泛的應(yīng)用。在蘋果siri的帶動下,包括android. wp以及采用這些操作系 統(tǒng)的平板屯腦,都有采用類似si門的智能應(yīng)用的強烈需求。谷歌預(yù)計目前犬約有25% 的android設(shè)備通過語音進行搜索odatamoni tor預(yù)計到2014年語音識別系統(tǒng)在全球移 動終端市場的份額將達到2009年的3倍,移動終端有望成為智能語音技術(shù)的一個快速 增長市場。五. 語音交互的難點1、技術(shù)層面:與硬件整合從音頻輸入的角度來講,語音容易受到環(huán)境、人以及設(shè)備本身的影響,要掌控輸入, 那么進入麥克風(fēng)的聲音就要符合預(yù)期,這就需要碩件制造廠商的設(shè)備能夠保持聲源、降 低噪音;與此同時

11、,輸入的音頻叮能存在失真的問題,這時技術(shù)團隊就要進行適配,這 方面的技術(shù)門檻很高,需要花費大量時間才能保證聲音都能被準(zhǔn)確識別和計算。2、智能化:整合產(chǎn)業(yè)鏈,形成知識庫在智能電視上,語咅脫離了鍵盤、觸屏的輔助,需要獨立使用,對智能性的要求更 高,語咅交互體驗?zāi)懿荒軡M足用戶的需求,能不能在一兩個回合里解決用戶的問題至關(guān) 重耍,因為用戶嘗試的次數(shù)多了還未解決問題,就會放棄語咅交互。六、語音交互的未來隨著人類對智能設(shè)備的依賴和人機之間的交互日益頻繁,原有的操控方式變得越來 越復(fù)朵、效率低下,迫切需要誕生一種新的更簡便的操作方式;而語音一旦成為主流的 交互手段,可以做到各種設(shè)備指令統(tǒng)一、簡潔,大大降低人類對智能設(shè)備操作的要求、 節(jié)省人機互動的時間。哪些人群會在語音交互的這股浪潮中得到益處?語音交互的智能化又能給行業(yè)帶來什 么樣的新動向?首先,隨著智能設(shè)備和應(yīng)用的影響逐漸擴大,用戶群逐步向老齡人群、低齡人群、 身體殘障人群滲透擴散的趨勢非常明顯,而對這些新進入人群而言,原有的觸控交互方 式或許并不太適合,用戶習(xí)慣也未形成,例如老年人視力下降、手指也不夠靈活;低齡 兒童還不能掌握手寫等能力也不適合長吋間看電子屏幕;弱視/盲人更希望接受語音信 息和發(fā)出語音指令,等等,因此語音交互也更適合拓展智能設(shè)備新的用戶人群。其次,語音交互可能會成為繼搜索引擎、瀏覽器、智能手

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論