
-
20,000小時中文普通話語音數據集
數據堂自有版權的中文普通話語音數據集全部由來自中國本土發音人進行錄制。覆蓋不同年齡段,如低幼兒童、青少年、成年人、老年人等;覆蓋不同地域發音人的不同習慣,如重口音普通話、臺灣普通話、中英混讀語音數據等;同時,中文普通話也覆蓋室內室外不同場景,如家居、車載等場景的喚醒詞、命令詞等普通話語音數據。
更多數據
-
245小時車載環境普通話手機采集語音數據
-
1,505小時普通話手機采集語音數據
-
1,420小時普通話自然語音手機采集數據
-
849小時普通話交互類手機采集語音數據
-
1,351小時普通話自然對話語音數據(手機+錄音筆)
-
521人普通話聲紋識別手機采集語音數據

-
10,000小時中國地區方言語音數據集
數據堂自有版權的中國地區方言語音數據集涵蓋了來自八大方言區本土發音人參與錄制的語音數據,包括粵語語音數據集、上海話語音數據集、閩南話語音數據集、昆明方言語音數據集、武漢方言語音數據集、長沙方言語音數據集、四川方言語音數據集等多個地區的方言語音數據,同時由本地人參與質檢校對,文本轉寫更精確。
更多數據
-
176小時蘇州方言手機語音采集語音數據
-
249小時杭州方言手機采集語音數據
-
110小時河南方言手機采集語音數據
-
67小時東北方言手機采集語音數據
-
1,000小時武漢方言手機采集語音數據
-
1,002小時長沙方言手機采集語音數據

-
10,000小時各國人說英語語音數據集
數據堂自有版權的各國人說英語語音數據集包含了美國、英國、中國、德國、法國、加拿大等各國人說英語的語音數據集。錄音文本由語言專家參與設計,貼合客戶應用場景,涵蓋通用、交互、車載、家居等多類別,內容豐富且文本經過人工校對,準確率高。
更多數據
-
593小時中國人說英語手機采集語音數據
-
535小時德國人說英語手機采集語音數據
-
520小時法國人說英語手機采集語音數據
-
388小時西班牙人說英語手機采集語音數據
-
203小時中國兒童說英語手機采集語音數據
-
227小時意大利人說英語手機采集語音數據

-
6,000小時亞洲語系語音數據集
數據堂自有版權的亞洲語系語音數據集包含了來自印尼、日本、韓國、越南、馬來、泰國等國家的本土發言人參加錄制。錄音內容豐富,所有文本均有專業人員人工轉寫,準確率高。
更多數據
-
292小時泰語手機采集數據_朗讀
-
490人泰語手機采集語音數據_引導
-
360小時印尼語手機采集語音數據_朗讀
-
496人印尼語手機采集語音數據_引導
-
156人馬來西亞語手機采集數據_朗讀
-
240小時印地語手機采集語音數據_朗讀

-
10,000小時歐洲語系語音數據集
數據堂自有版權的歐洲語系語音數據集包含了來自德國、法國、俄羅斯、西班牙、意大利等國家本土發音人參與錄制。錄音內容豐富,所有文本均有專業人員人工轉寫,準確率高。
更多數據
-
232小時法語手機采集語音數據_朗讀
-
405人法語手機采集語音數據_引導
-
227小時西班牙語手機采集語音數據_朗讀
-
343人西班牙語手機采集語音數據_引導
-
338小時西班牙語手機采集語音數據
-
435小時西班牙語手機采集語音數據

-
2,500小時其他語系語音數據集
數據堂自有版權的其他語系語音數據集主要包括巴西人錄制的巴西葡萄牙語數據集、以色列人錄制的希伯來語數據集。該系列仍在不斷擴建中。
更多數據
-
1,044小時巴西葡萄牙語手機采集語音數據