欧美性爱怡红院|亚洲 日韩 欧美 在线 无码|黄色视频免费网站观看|欧美国产在线视频|理论片高清免费理论片

首頁 >> 產品中心 >> 嬰幼兒語料庫
??

 

AVS-H  嬰幼兒語料庫

 

人類嬰兒由于出生時過于虛弱,不具備主動接近成人的行為能力,因此在9個月之前,其主要通過哭聲吸引成人的注意,并向成人表達他的需求。嬰幼兒語料庫是按照一定采樣標準采集的電子數據集合,隨著大數據時代的到來,語音智能產品已經滲透到移動通信、智能家居、工業生產等很多領域。語音識別技術逐漸趨于成熟,然而,語音識別產品所依賴的語音數據價值變得更加顯著,語料庫成為重要的基礎資源。獨有核心技術,讓AI更進一步。

本語料庫采集了近十六萬條語音。錄音采集人來自中國大陸各地,錄制人數300多人,錄制家庭300多家,采取0-14個月跟蹤家庭錄制,男女比例均衡,音頻總時長1275小時,采集方式為單麥設備。每條音頻單獨存儲為一個文件,并由專業標注人員手工進行兩級標注。所有標注數據都是全檢后再交付,以保證交付數據的質量。

 

技術背景介紹

隨著以深度神經網絡為代表的人工智能技術的發展,新一輪的人機交互技術熱潮正在興起。在機器視覺領域,由于海量圖像和視覺場景數據庫的誕生,催生了人臉識別、姿態識別、自動駕駛、無人機等領域的技術革新。目前世界上已有的典型的大規模海量圖像和視覺場景數據庫包括,ImageNet、MSCOCO等業界知名的數據庫。

在聲音場景和聲音事件的識別領域,技術的發展已經成熟,然而商業應用滯后于機器視覺領域的應用。在聲音領域,目前世界上最著名的音頻數據庫包括:歐洲的DCASE(聲音場景和事件數據庫)和谷歌的Audio Set(包括各類層次結構化的音頻分類數據)等。

在家庭環境領域,能夠用來服務于AI應用的聲音數據極為缺乏,本產品旨在填補這一空白,為全球的智能家庭環境的AI應用落地做出貢獻。

聲音場景(Acoustic Scene)指的是室內、室外、火車站、餐廳、看電影、聽音樂等實際生活中人們的有聲的生活場景,通過聲音信號的識別來辨識這類場景,就是聲音場景識別;聲音事件(Acoustic Event)指的是根據短時聲學特征,利用統計學習的建模方法,對不同的聲源所關聯的事件,進行類別的分類。例如,對哭聲、咳嗽聲、腳步聲,能夠通過聲音頻率特征的分布規律,進行實時的檢測,發現家居環境中的突發性事件、嬰幼兒的行為事件、家庭成員的異?;顒拥?。

 

數據應用場景

【家庭環境嬰幼兒聲音場景和聲音事件數據庫】作為豐富的數據資源,可用于哭聲及家庭環境聲音頻率和特征的分析學習,研究聲環境及其同人類活動的相互作用,更好的滿足了多種場景的人工智能研發數據支撐。也為嬰幼兒智能產品的創新和研發,尤其為互聯網行業、母嬰行業、智能家居行業提供了更詳細的數據和更全面的信息支持。

產品優勢

l   領先的語音采集處理技術及專業標注團隊;

l   同時支持科研和教學;

l   支持可視化操作;

l   支持基于機器學習的智能分析;

l   支持科研需求定制開發;

l  人工校對、多層級語音數據標注;

數據規格

數據規格

符合 LDCLinguistic Data Consortium)國際語義數據聯盟推薦規范

采集內容

家庭環境嬰幼兒聲音場景和聲音事件

音頻參數

Wave PCM signed 16 bit,16000Hz,256kbps,單聲

標注內容A

哭聲

嬰純強哭

嬰純中哭

嬰純弱哭

嬰混音哭

嬰模糊哭

非嬰哭

笑聲

咳嗽聲

噴嚏聲

尖叫聲

嬰其他聲

公共聲音

標注內容B

嬰兒聲

純人聲

純兒歌聲

純環境聲

其它公共

采集設備

單麥設備

產品特點

0-14個月齡段錄音,男、女標注

存儲方式

文件格式

Lf0 二進制數據文件

文件時長

1275小時

數據脫敏

數據敏感項

脫敏操作

志愿者家庭隱私免責協議

產品應用

適用領域

聲信號識別,聲音事件分析,人工智能應用

版權歸屬

版權所有者

深圳聲聯網科技有限公司

 

資料下載:點擊進入相關頁面

??
收縮