zh

數據解決方案

請填寫姓名

手機號碼格式錯誤

請填寫手機號碼

請填寫公司全稱

請填寫企業郵箱

需求描述不能為空

提交成功!感謝您支持數據堂。

填寫格式錯誤請重新填寫

確定

需求描述格式錯誤且最少輸入5個字符

暫無數據

語音合成

助研數據

  • 22000張多國語言OCR數據

    22000張多國語言OCR數據

    該數據涵蓋法文、韓文、日文、西班牙文、德文、意大利文、葡萄牙文、俄文8種語言的會議場景PPT,以及中英文自然場景的海報、路標、包裝說明、菜單等。自然場景為行級矩形框標注,PPT場景為四邊形框標注,且都進行內容轉寫。

  • 5000人人臉識別數據

    5000人人臉識別數據

    該數據規模5000人,其中,監控人臉識別數據500人,人臉多姿態數據3000人,跨年齡人臉數據1000人,遮擋人臉識別數據500人。以青年人為主,男女比例均為1:1。除人臉多姿態數據中黃種人、黑人、白人和印度人均勻分布,其他數據均為中國人。采集環境為室內、室外兩個場景,采集設備有手機、相機。圖像的數據格式為jpg。

  • 3000人多人種7種表情識別數據

    3000人多人種7種表情識別數據

    該數據共3000人,每人分別采集正常、高興、驚奇、悲傷、憤怒、厭惡、恐懼七種表情。涵蓋黃種人、白人、黑人、棕色人(墨西哥人)四種膚色人種,以中青年為主,男女比例1:1。采集環境包括室內、室外??捎糜诒砬樽R別算法研究。

  • 10000張人臉106關鍵點標注數據

    10000張人臉106關鍵點標注數據

    該數據共10000張。以青年人為主,男女各5000人,包含黃種人4822人、白種人454人、黑種人2224人、印度人2500人。每人一張人臉圖片,每張圖片標注106人臉關鍵點,10種人臉屬性。

  • 10000張人臉語義分割數據

    10000張人臉語義分割數據

    該數據由黃種人、白人、黑人三種膚色的青年人在純色、室內、室外場景下進行采集。男女比例均勻,涵蓋了自然景觀、街景、廣場等多種場景;人臉傾斜、閉眼、瞪眼、抿嘴、張嘴等多種表情。對人臉、五官、身體和附屬物進行摳圖標注。

  • 48000條手勢識別數據

    48000條手勢識別數據

    該數據包含室內外不同場景的18種靜態手勢及50種動態手勢,從正視、斜視、俯視、仰視四個角度進行拍攝,對靜態手勢圖像標注21關鍵點,手勢的類別和屬性;對動態手勢的屬性,相機的位置,采集的環境進行了標注。

  • 1505小時普通話手機采集語音數據

    1505小時普通話手機采集語音數據

    該數據集由全國33個省市6278名發音人使用手機錄制,錄音環境為安靜的室內,包含不影響語音辨識的背景噪音,錄音內容包括30萬條口語化句子,覆蓋通用領域,數據格式為16kHz 16bit,wav單聲道,句準確率不低于98%,可廣泛應用于語音識別、聲紋識別、機器翻譯。

  • 300小時普通話自然對話手機采集語音數據

    300小時普通話自然對話手機采集語音數據

    該數據由440人較年輕的采集人在不指定話題、以自然說話隨意交談的情況下錄制,性別比例均衡,在相對安靜的室內環境,環境底噪不超過50db,并標注了文本、說話人及有效句子的起止時間。該數據格式為16kHz或22.05kHz,16bit,單聲道wav,句準確率不低于97%。

  • 200小時中國兒童手機采集語音數據

    200小時中國兒童手機采集語音數據

    相對安靜無回聲的室內環境下,通過手機采集557名6-12歲兒童發音,錄音內容來自兒童作文故事、人機交互、家居命令、數字及其他通用領域。該數據格式為16kHz、22.05kHz或44.1kHz,16bit,單聲道wav,句準確率不低于97%??蓱糜谡Z音識別、聲紋識別等方向。

  • 200小時中英混讀手機采集語音數據

    200小時中英混讀手機采集語音數據

    在相對安靜無回聲的室內,由701名采集人錄制的中英混雜語音數據,其中男女比例均衡,在噪音符號等附加項不計入的情況下句準確率不低于97%。數據有效時長200小時,該數據格式為16kHz 16bit,單聲道wav。

  • 300小時十門方言手機采集語音數據

    300小時十門方言手機采集語音數據

    該數據包括粵語、上海話、四川話、閩南話、武漢話、長沙話、昆明話、杭州話、蘇州話、河南話各30小時,錄音內容以口語化句子為主。在相對安靜的室內通過手機采集錄制,16kHz 16bit,wav,單聲道,可廣泛應用于語音識別、方言語種識別等場景。

  • 200小時十國人說英語手機采集語音數據

    200小時十國人說英語手機采集語音數據

    該數據由來自俄羅斯、韓國、加拿大、美國、葡萄牙、日本、西班牙、印度、英國、中國的528人錄制,每個國家男女比例均衡。在相對安靜無回聲的室內環境下,通用類語料,部分語言含有交互類、家居類、車載類和數字。數據格式為16kHz,16bit,無壓縮wav,單聲道,錄音人員均使用英語進行錄制,句錯誤率(SER)低于5%。

  • 50人遠場家居采集語音數據

    50人遠場家居采集語音數據

    該數據由50人,每人80句家居類語句在真實家居場景下錄制,每人同時采集37個通道,數據格式:麥克風陣列 48kHz 32bit(浮點);手機 48kHz 16bit,麥克風陣型為6+1麥環形??蓱糜诩揖訄鼍跋碌恼Z音增強、語音識別等。

  • 200小時十門外語手機采集語音數據

    200小時十門外語手機采集語音數據

    該數據包括日語、韓語、印地語、越南語、俄語、法語、德語、意大利語、西班牙語、葡萄牙語各20小時,每個人錄制數百句話。錄音人覆蓋各個年齡段,以年輕人為主,男女比例均衡。語音數據格式:16kHz 16bit,wav,單聲道,標注結果為txt,數據標簽格式:metadata??捎糜谡Z音識別聲學、語種識別研究、語言模型訓練或算法研究。

合作機構

  • 西南科大
  • 國防科技大學
  • 武漢理工大學
  • 電子工程與光電
  • 中科院自動化
  • 北京交通
  • 語言國家工程實驗室
  • 鄭州信大
  • 北方工業
  • 北京工商
  • 上海理工大
  • hefei
  • 中科院深圳
  • 廈門大學
  • 天津大學
  • 閩江學院
  • 中科院聲學
  • 華中科技

申請流程

  • 點擊下方數據申請按鈕,填寫表單并下載 《數據使用許可協議-數據堂助研數據》 請您如實填寫協議內容并蓋章。
  • 掃描蓋章協議發送至數據堂客服郵箱 services@datatang.com。同時請您將兩份蓋好章的合同原件快遞至我司。
  • 我們將在收到您郵件的3個工作日內進行審核并回復結果。審核通過之后,將會給您寄回一份我司蓋章的合同原件。
  • 在收到合同原件后,您將收到我們通過郵件發送的數據下載鏈接。

注:郵寄地址請咨詢在線客服或打客服電話13051623904

數據申請
最終解釋權歸數據堂(北京)科技股份有限公司所有
數據堂_datatang 免费高清av一区二区三区-午夜爱爱爱爱爽爽爽视频网站-3D无遮挡H肉动漫在线播放-小泽玛利亚一区二区免费-欧洲A片-亚洲中文字幕一二区精品自拍