注冊(cè) | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)人工智能人與機(jī)器聽覺:聽見聲音的意義

人與機(jī)器聽覺:聽見聲音的意義

人與機(jī)器聽覺:聽見聲音的意義

定 價(jià):¥169.00

作 者: (美)理查德·F.里昂(Richard F.Lyon)
出版社: 機(jī)械工業(yè)出版社
叢編項(xiàng):
標(biāo) 簽: 暫缺

ISBN: 9787111684534 出版時(shí)間: 2021-08-01 包裝:
開本: 16開 頁數(shù): 415 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  《人與機(jī)器聽覺:聽見聲音的意義》由谷歌首席科學(xué)家Lyon撰寫,是一部關(guān)于聽覺研究的系統(tǒng)性學(xué)術(shù)著作?!度伺c機(jī)器聽覺:聽見聲音的意義》中提出利用CARFAC模型模擬耳蝸對(duì)聲音信號(hào)的分析,利用帶有精細(xì)時(shí)序結(jié)構(gòu)的SAI表征聽覺神經(jīng)模式,明確反對(duì)將耳蝸視作傅里葉頻率分析器的做法?!度伺c機(jī)器聽覺:聽見聲音的意義》內(nèi)容系統(tǒng)且全面,涵蓋人類聽覺原理、機(jī)器聽覺理論、精密聽覺模型建模和機(jī)器聽覺應(yīng)用實(shí)例,還包括對(duì)聽覺研究史上的標(biāo)志性人物及事例的介紹?!度伺c機(jī)器聽覺:聽見聲音的意義》對(duì)數(shù)學(xué)原理的闡釋脈絡(luò)清晰,并配有算法源碼,適合相關(guān)領(lǐng)域的技術(shù)人員和研究人員參考,也適合作為高等院校相關(guān)研究生課程的教材。《人與機(jī)器聽覺:聽見聲音的意義》構(gòu)建了一套完整的聽覺理論框架,具有鮮明的學(xué)術(shù)觀點(diǎn)和創(chuàng)作特色:創(chuàng)造性地提出利用CARFAC模型模擬耳蝸對(duì)聲音信號(hào)的分析,利用帶有精細(xì)時(shí)序結(jié)構(gòu)的SAI表征聽覺神經(jīng)模式,強(qiáng)調(diào)將聽覺模型引入機(jī)器聽覺應(yīng)用,反對(duì)將耳蝸視作傅里葉頻率分析器的做法。將聽覺系統(tǒng)劃分為四層,在底層聽覺過程模擬的基礎(chǔ)上探索高層信息處理機(jī)制并驗(yàn)證模型的有效性,為遠(yuǎn)近場(chǎng)模型等問題的解決以及CASA等技術(shù)的落地提供理論支撐,同時(shí)拓展了研究思路。全面涵蓋人類聽覺原理、機(jī)器聽覺理論、精密聽覺模型建模方法以及利用機(jī)器學(xué)習(xí)方法構(gòu)建的應(yīng)用實(shí)例,不僅對(duì)研究現(xiàn)狀進(jìn)行了系統(tǒng)梳理,而且穿插著對(duì)聽覺研究史上標(biāo)志性人物和事例的介紹。對(duì)聽覺問題的闡釋直擊本質(zhì),對(duì)相關(guān)數(shù)學(xué)表述及推導(dǎo)過程的講解尤為清晰明了,無須復(fù)雜的專業(yè)知識(shí)也能逐步理解。此外,所有聽覺處理算法均配有可免費(fèi)下載的源代碼,便于讀者實(shí)踐。

作者簡(jiǎn)介

  理查德·F.里昂(Richard F.Lyon),谷歌公司首席科學(xué)家,IEEE Fellow,ACM Fellow。他目前主要負(fù)責(zé)谷歌機(jī)器聽覺方向的研發(fā)工作,其團(tuán)隊(duì)開發(fā)了用于谷歌街景的相機(jī)系統(tǒng)。他的研究興趣包括用于聲音分析及可視化的耳蝸模型和聽覺相關(guān)譜圖,以及這些模型的模擬電路及VLSI數(shù)字實(shí)現(xiàn)。在加入谷歌之前,他曾在施樂公司、斯倫貝謝公司和蘋果公司從事相關(guān)研發(fā)工作。此外,他還擁有包括光電鼠標(biāo)在內(nèi)的58項(xiàng)美國(guó)發(fā)明專利授權(quán)。朱維彬,博士,北京交通大學(xué)信息科學(xué)研究所副教授,主要從事言語信息處理理論及應(yīng)用研究,涉及語義的言語表現(xiàn)及計(jì)算、言語情感分析及建模。曾在IBM中國(guó)研究中心任研究員,從事語音聲學(xué)模型、韻律建模和言語數(shù)據(jù)庫(kù)的研究。高瑩瑩,博士,畢業(yè)于北京交通大學(xué)信息科學(xué)研究所,研究方向?yàn)檠哉Z情感生成建模?,F(xiàn)就職于中國(guó)移動(dòng)研究院人工智能與智慧運(yùn)營(yíng)中心,主要從事語音識(shí)別、端到端一體化建模的研究。

圖書目錄

譯者序
序言
前言
關(guān)于作者
第一部分 聲音分析與表征概述
第1章 引言
1.1 DavidMarr論視覺與聽覺
1.2 自上而下與自下而上分析
1.3 神經(jīng)模擬方法
1.4 聽覺圖像
1.5 耳朵是頻率分析器嗎
1.6 第三音
1.7 聲音理解與意義提取
1.8 機(jī)器視覺與機(jī)器學(xué)習(xí)技術(shù)的利用
1.9 本書的內(nèi)容安排
第2章 聽覺理論
2.1 一種“新”的聽覺理論
2.2 更新的聽覺理論
2.3 主動(dòng)與非線性聽覺理論
2.4 聽覺三元理論
2.5 聽覺圖像理論
第3章 對(duì)數(shù)及冪律聽覺
3.1 對(duì)數(shù)與冪律
3.2 對(duì)數(shù)頻率
3.3 對(duì)數(shù)功率
3.4 Bode圖
3.5 感知映射
3.6 恒Q值分析
3.7 對(duì)數(shù)應(yīng)用注意事項(xiàng)
第4章 人類聽覺概述
4.1 人機(jī)對(duì)比
4.2 聽覺生理學(xué)
4.3 聽覺中的關(guān)鍵問題
4.4 響度
4.5 臨界頻帶、掩蔽與抑制
4.6 音高感知
4.7 音色
4.8 協(xié)和與不協(xié)和
4.9 語音感知
4.10 雙耳聽覺
4.11 聽覺流
4.12 非線性
4.13 后續(xù)建議
第5章 聲學(xué)方法與聽覺修正
5.1 聲音、語音與音樂建模
5.2 短時(shí)譜分析
5.3 譜的平滑與變換
5.4 源一濾波器模型與同態(tài)信號(hào)處理
5.5 擺脫對(duì)數(shù)
5.6 聽覺頻率尺度
5.7 mel頻率倒譜
5.8 線性預(yù)測(cè)編碼
5.9 PLP與RASTA
5.10 自動(dòng)語音識(shí)別中的聽覺技術(shù)
5.11 必要的改進(jìn)
第二部分 聽覺的系統(tǒng)理論
第6章 線性系統(tǒng)引言
6.1 平滑:恰當(dāng)?shù)钠瘘c(diǎn)
6.2 線性時(shí)不變系統(tǒng)
6.3 濾波器與頻率
6.4 微分方程與齊次解
6.5 沖激響應(yīng)
6.6 因果性與穩(wěn)定性
6.7 卷積
6.8 本征函數(shù)與傳遞函數(shù)
6.9 頻率響應(yīng)
6.10 變換與運(yùn)算方法
6.11 有理函數(shù)及其零極點(diǎn)
6.12 傳遞函數(shù)增益與相位的圖解計(jì)算
6.13 卷積定理
6.14 級(jí)聯(lián)、并聯(lián)與反饋結(jié)構(gòu)中濾波器的互聯(lián)
6.15 總結(jié)及后續(xù)安排
第7章 離散時(shí)間與數(shù)字系統(tǒng)
7.1 計(jì)算機(jī)模擬系統(tǒng)
7.2 離散時(shí)間線性移不變系統(tǒng)
7.3 沖激響應(yīng)與卷積
7.4 離散時(shí)間系統(tǒng)中的頻率
7.5 Z變換及其逆變換
7.6 單位超前算子與單位延遲算子
7.7 濾波器與傳遞函數(shù)
7.8 采樣與混疊
7.9 自連續(xù)時(shí)間系統(tǒng)的映射
7.10 濾波器設(shè)計(jì)
7.11 數(shù)字濾波器
7.12 多輸入輸出
7.13 傅里葉分析與頻譜圖
7.14 觀點(diǎn)及拓展閱讀
第8章 諧振器
……
第三部分 聽覺外周
第四部分 聽神經(jīng)系統(tǒng)
第五部分 機(jī)器學(xué)習(xí)及應(yīng)用
中英文術(shù)語對(duì)照表
參考文獻(xiàn)

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) www.afriseller.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)