zh

數據解決方案

請填寫姓名

手機號碼格式錯誤

請填寫手機號碼

請填寫公司全稱

請填寫企業郵箱

需求描述不能為空

提交成功!感謝您支持數據堂。

填寫格式錯誤請重新填寫

確定

需求描述格式錯誤且最少輸入5個字符

暫無數據

語音合成

首頁 > 新聞列表 > 通用場景語音合成數據集推薦

通用場景語音合成數據集推薦

來源:數據堂2022-06-17

語音合成,通常又稱文語轉換(Text To Speech,TTS),是一種可以將任意輸入文本轉換成相應語音的技術,是人機語音交互中不可或缺的模塊之一。


傳統語音合成

傳統的語音合成系統通常包含前端和后端兩個模塊。前端模塊主要是對輸入文本進行分析,提取后端模塊所需要的語言學信息。對中文合成系統來說,前端模塊一般包含文本正則化(Text Normalization,簡稱TN)、多音字消歧、韻律預測等子模塊。后端模塊根據前端分析結果,通過一定的方法生成語音波形。


前端技術的背后需要大量的TN標注、多音字標注、韻律標注等基礎數據作為支撐,幫助前端技術輸出準確的結果。


后端技術的背后需專業發音人錄制的高質量音庫,為了應對多種場景,需要音色多樣、語種多樣的大量音庫。


個性化語音合成

個性化語音合成,通常指使用少量并且可能低質量的目標說話人語音,使用遷移學習等方法,訓練一個能夠合成目標說話人語音的語音合成模型。通常做法是基于大量不同發音人訓練一個通用語音合成模型,然后使用少量目標說話人語音進行fine-tune。


個性化語音合成的應用日趨成熟,百度地圖支持用戶僅需錄制9句話,便能生成一套完整的個人語音包,并在地圖全場景進行使用。



個性化語音合成技術的背后需要多發音人平均模型庫作為重要的數據支撐。數據堂面向通用場景的語音合成數據分為三類:


一、單發音人合成庫

由單個發音人,在專業錄音棚內錄制的音庫。

1

24小時中文女聲通用合成庫

溫柔親切的年青女性錄制,語料涵蓋日??谡Z、有聲讀物、新聞、廣告、客服、電影解說,文字標注的字準確率不低于99.9%,韻律標注的句準確率不低于98%。


2

13.3小時中文女聲情感合成庫

溫柔親切的年青女性錄制,六種情感文本,語料音素覆蓋均衡,專業語音學家參與標注,文字標注的字準確率不低于99.9%,音素標注的句準確率不低于99%,韻律標注的句準確率不低于98%。



3

6.78小時中文女聲模仿童聲合成庫

活潑甜美的成人女性模仿兒童錄制,語料覆蓋K12練習題、閱讀繪本、教輔內容、問候語、導讀內容,文字標注的字準確率不低于99%。



4

19.46小時美國英語女聲合成庫

溫柔親切的年青女性錄制,語料涵蓋通用陳述句、通用疑問句等類別,標注了文字、詞性、音素邊界、4級重音、4級韻律。



5

20小時美國英語男聲合成庫

年輕積極的成人男性錄制,語料涵蓋通用陳述句、通用疑問句等類別,文字標注的字準確率不低于99.9%,韻律標注的句準確率不低于98%。


6

10小時日語女聲合成庫

活潑甜美的年輕女性錄制,語料覆蓋新聞、口語,文字標注的字準確率不低于99%。


7

10小時韓語女聲合成庫

活潑甜美的年輕女性錄制,語料覆蓋新聞、口語,文字標注的字準確率不低于99%。


二、多發音人平均模型庫

由多個發音人,在專業錄音棚內錄制的音庫。

1

100人中文通用平均音色合成庫

涵蓋新聞、日??谡Z、有聲讀物、詩詞、廣告、消息播送、娛樂等類別,語種涵蓋中文、英文、中英混讀,發音人男女各50人,涵蓋不同年齡段(成人70人、兒童20人、老人10人),每人錄制600到700個句子。標注了文字、音素、4級韻律、音素邊界。


2

50人中文三風格平均音色合成庫

每人錄制客服類、播音類、故事類三種風格的數據,語料音素覆蓋均衡,發音人男女各25人,每人錄制600個句子。專業語音學家參與標注,句準確率不低于99%。


三、前端文本

1

199,652句TN數據

涵蓋小說、文章、新聞等類別,將句子中包含的特定的特殊符號及阿拉伯數字標注為漢字寫法,共計199,652條句子、454,638條標注。


2

319,977條漢語多音字語料數據

涵蓋新聞、口語等類別,包含266個多音字的603個字音,共計319,977條句子。


3

200,955條中文文本韻律標注語料數據

文本來自新聞和日常聊天,進行了4級韻律標注。



作為全球領先的人工智能數據服務商,數據堂豐富的樣音資源、突出的技術優勢和數據處理經驗,支持按語言、音色、年齡、性別個性化定制的采集服務。同時還支持音頻切分、音素邊界切分(切分精度0.01秒)、音字標注、韻律標注、詞性標注、音準校對、聲韻標注、樂譜制作等數據定制服務,全面滿足多樣化語音合成需求。使合成聲音更有感情,使人工智能呈現更為真實的電腦語音,使人工智能語音助手在聲音互動中更有親和力。



關于數據堂

數據堂現擁有豐富的訓練數據集產品,同時提供數據定制服務,旗下數加加標注平臺通過集成 自動化標注工具可以快速降低數據處理成本。

憑借高質量訓練數據服務,數據堂已成功幫助全球上千家企業提升AI模型性能。

官方網站:www.sxsjwl.cn

客服熱線:13051623904

客服郵箱:services@datatang.com


語音合成(TTS)_數據堂 免费高清av一区二区三区-午夜爱爱爱爱爽爽爽视频网站-3D无遮挡H肉动漫在线播放-小泽玛利亚一区二区免费-欧洲A片-亚洲中文字幕一二区精品自拍