【1,505小時 中文普通話語音數據集】數據時長1505小時,是數據堂中文普通話語音數據庫中的一部分。采集區域覆蓋全國34個省級行政區域,參與錄音人數達6408人,錄音內容超30萬條口語化句子。經過專業語音校對人員轉寫標注,并通過嚴格質量檢驗,句標注準確率達98%以上,是行業內句準確率的最高標準。(僅支持學術研究,未經允許禁止商用)
格式 | 16kHz 16bit,wav,單聲道 | ||||||||||||||||||||||||||||||
錄音環境 | 安靜的室內,噪音不影響語音識別 | ||||||||||||||||||||||||||||||
錄音內容 | 30萬條口語化句子 | ||||||||||||||||||||||||||||||
錄音人員 |
6,408 人 男性 2,999 人,女性 3,301 人 ≤20 歲 1,481 人,21~30 歲 4,412 人,31~40 歲 244 人,40 歲以上 163 人 錄音人員分布于廣東、福建、山東、江蘇、北京、湖南、江西、香港、澳門等 34個省級行政區域 |
||||||||||||||||||||||||||||||
設備 | 安卓:iOS=9:1 | ||||||||||||||||||||||||||||||
語音 | 普通話;有口音的普通話 | ||||||||||||||||||||||||||||||
應用場景 | 語音識別 機器翻譯 聲紋識別 |
||||||||||||||||||||||||||||||
準確率 | 句標注準確率不低于98% | ||||||||||||||||||||||||||||||
使用效果 |
基于aidatatang_200zh數據集的語音識別模型訓練效果,測評結果:
基于aidatatang_1,505zh數據集的語音識別模型訓練效果,測評結果:
|
||||||||||||||||||||||||||||||
訓練方法 |
基于aidatatang_200zh數據集的訓練方法點擊查看 (說明:aidatatang_200zh數據集是aidatatang_1,505zh數據集中的一部分) |
獲取方式
開源數據【1,505小時 中文普通話語音數據】,我們提供以下獲取方式:
提交成功!感謝您支持數據堂。
確定提交成功!下載《數據使用許可協議-數據堂-中文普通話語音數據》
確定并下載