自然語言及語音處理項(xiàng)目式教程 課件7.3.2-1數(shù)據(jù)預(yù)處理_第1頁
自然語言及語音處理項(xiàng)目式教程 課件7.3.2-1數(shù)據(jù)預(yù)處理_第2頁
自然語言及語音處理項(xiàng)目式教程 課件7.3.2-1數(shù)據(jù)預(yù)處理_第3頁
自然語言及語音處理項(xiàng)目式教程 課件7.3.2-1數(shù)據(jù)預(yù)處理_第4頁
自然語言及語音處理項(xiàng)目式教程 課件7.3.2-1數(shù)據(jù)預(yù)處理_第5頁
已閱讀5頁,還剩10頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

基于PaddleSpeech實(shí)現(xiàn)新聞自動(dòng)播報(bào)文本前端處理合成聲學(xué)模型聲碼器合成結(jié)果評(píng)測(cè)文本前端處理了解CSMSC數(shù)據(jù)集的相關(guān)內(nèi)容奠定基礎(chǔ)文本前端處理流程CSMSC數(shù)據(jù)集由專業(yè)播報(bào)員錄制的,具有較高的語音質(zhì)量,適用于訓(xùn)練高質(zhì)量的語音合成系統(tǒng)。專業(yè)播報(bào)員錄制數(shù)據(jù)集包含拼音和漢字文本,便于訓(xùn)練和評(píng)估各種基于拼音或漢字的語音合成和語音識(shí)別模型。數(shù)據(jù)標(biāo)簽數(shù)據(jù)集包含各種主題和領(lǐng)域的文本,有助于訓(xùn)練出更具泛化能力的模型。多樣化文本內(nèi)容CSMSC數(shù)據(jù)集已經(jīng)開源,對(duì)學(xué)術(shù)研究和商業(yè)應(yīng)用具有較高的價(jià)值。開源可用特點(diǎn)CSMSC數(shù)據(jù)集CSMSC數(shù)據(jù)集是一個(gè)有價(jià)值的中文普通話語音數(shù)據(jù)集,適用于訓(xùn)練和評(píng)估各種中文TTS和ASR系統(tǒng)。文本前端處理流程構(gòu)建文本前端文本前端模塊文本正則化字音轉(zhuǎn)換構(gòu)建文本前端的類使用Frontend類構(gòu)造文本前端對(duì)象,該類的常用參數(shù)說明。參數(shù)名稱參數(shù)說明phone_vocab_path接收str,表示指定音素詞典文件的路徑或位置。默認(rèn)為PaddleSpeech中提供的中文音素詞典文件的位置字音轉(zhuǎn)換的函數(shù)Frontend類的frontend.get_input_ids函數(shù)可以將文本轉(zhuǎn)換為音素ID序列,其常用參數(shù)說明。參數(shù)名稱參數(shù)說明text接收str,表示待轉(zhuǎn)換的文本序列,以字符串形式傳入。無默認(rèn)值merge_sentences接收bool,表示是否將多個(gè)句子合并為一個(gè)句子。默認(rèn)為Trueprint_info接收bool,表示是否打印調(diào)試信息。默認(rèn)為False文本前端處理合成聲學(xué)模型聲碼器合成結(jié)果評(píng)測(cè)合成聲學(xué)模型01聲學(xué)模型自回歸模型預(yù)測(cè)過程相對(duì)較慢,但音質(zhì)表現(xiàn)較好02非自回歸模型預(yù)測(cè)速度快,但音質(zhì)可能稍遜色一些合成聲學(xué)模型使用自回歸模型中的FastSpeech2作為聲學(xué)模型,在分句的基礎(chǔ)上構(gòu)建FastSpeech2模型。構(gòu)建FastSpeech2模型輸出Mel頻譜構(gòu)建FastSpeech2模型使用PaddleSpeech中的FastSpeech2類構(gòu)建聲學(xué)模型,該類的常用參數(shù)說明。參數(shù)名稱參數(shù)說明idim接收int,表示輸入維度,即詞表大小。無默認(rèn)值odim接收int,表示輸出維度,即音頻特征維度。無默認(rèn)值**FastSpee

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論