Audio Bandwidth Extension: Application of Psychoacoustics, Signal Processing and Loudspeaker Design
暫譯: 音頻頻寬擴展:心理聲學、信號處理與揚聲器設計的應用

Erik Larsen, Ronald M. Aarts

  • 出版商: Wiley
  • 出版日期: 2004-10-29
  • 售價: $1,102
  • 語言: 英文
  • 頁數: 312
  • 裝訂: Hardcover
  • ISBN: 0470858648
  • ISBN-13: 9780470858646
  • 相關分類: 數位訊號處理 Dsp
  • 無法訂購

買這商品的人也買了...

商品描述

Description:

Bandwidth extension of signals may be defined as the deliberate process of expanding the frequency range (bandwidth) of a signal in which it contains an appreciable and useful content, and/or the frequency range in which its effects are such. Its significant advancement in recent years has led to the technology being adopted commercially in several areas including psychacoustic bass enhancement of small loudspeakers and the high frequency enhancement of perceptually coded audio.

The increasing use of this technology in different areas creates a need for knowledge of the area. Written by an expert in the field, Signal Bandwidth Extension for Applications in Audio Signal Processing will consolidate the theories and applications surrounding signal bandwidth extension to help the reader develop a comprehensive knowledge of the area and its potential uses.

An ideal reference for academics and professionals alike, it will be most suited to researchers and developers in audio engineering. However, it will also be suitable for those studying or working in areas such as signal processing, communications, audio and video engineering and coding theory

 

 

Table of Contents:

Preface.

I Introduction.

I.1 Bandwidth Defined.

I.2 Historic Overview.

I.2.1 Electroacoustic Transducers.

I.2.2 Sound Quality.

I.3 Bandwidth Extension Framework.

I.3.1 Introduction.

I.3.2 The Framework.

1 From Physics to Psychophysics.

1.1 Signal Theory.

1.1.1 Linear and Non-linear Systems.

1.1.2 Continuous-time LTI (LTC) Systems.

1.1.3 Discrete-time LTI (LTD) Systems.

1.1.4 Other Properties of LTI Systems.

1.1.5 Digital Filters.

1.2 Statistics of Audio Signals.

1.2.1 Speech.

1.2.2 Music.

1.3 Loudspeakers.

1.3.1 Introduction to Acoustics.

1.3.2 Loudspeakers.

1.3.3 Bessel and Struve Functions.

1.4 Auditory Perception.

1.4.1 Physical Characteristics of the Peripheral Hearing System.

1.4.2 Non-linearity of the Basilar Membrane Response.

1.4.3 Frequency Selectivity and Auditory Filters.

1.4.4 Loudness and Masking.

1.4.5 Pitch.

1.4.6 Timbre.

1.4.7 Auditory Scene Analysis.

1.4.8 Perceptual Modelling – Auditory Image Model.

2 Psychoacoustic Bandwidth Extension for Low Frequencies.

2.1 Introduction.

2.2 Psychoacoustic Effects for Low-frequency Enhancement of Small Loudspeaker Reproduction.

2.2.1 Pitch (Harmonic Structure).

2.2.2 Timbre (Spectral Envelope).

2.2.3 Loudness (Amplitude) and Tone Duration.

2.3 Low-Frequency Psychoacoustic Bandwidth Extension Algorithms.

2.3.1 Overview.

2.3.2 Non-Linear Device.

2.3.3 Filtering.

2.3.4 Gain of Harmonics Signal.

2.4 Low-Frequency Psychoacoustic Bandwidth Extension with Frequency Tracking.

2.4.1 Non-Linear Device.

2.4.2 Frequency Tracking.

2.5 Subjective Performance of Low-Frequency Psychoacoustic Bandwidth Extension Algorithms.

2.5.1 ‘Virtual Bass’.

2.5.2 ‘Ultra Bass’.

2.6 Spectral Characteristics of Non-Linear Devices.

2.6.1 Output Spectrum of a Rectifier.

2.6.2 Output Spectrum of Integrator.

2.6.3 Output Spectra in Discrete Time.

2.6.4 Output Spectrum of Clipper.

3 Low-frequency Physical Bandwidth Extension.

3.1 Introduction.

3.2 Perceptual Considerations.

3.2.1 Pitch (Spectral Fine Structure).

3.2.2 Timbre (Spectral Envelope).

3.2.3 Loudness (Amplitude).

3.3 Low-frequency Physical Bandwidth Extension Algorithms.

3.3.1 Systems with Low-frequency Extension.

3.3.2 Non-linear Device.

3.3.3 Filtering.

3.3.4 Gain of Harmonics Signal.

3.4 Low-frequency Physical Bandwidth Extension Combined with Low-frequency Psychoacoustic Bandwidth Extension.

4 Special Loudspeaker Drivers for Low-frequency Bandwidth Extension.

4.1 The Force Factor.

4.2 High Force Factor Drivers.

4.3 Low Force Factor Drivers.

4.3.1 Optimal Force Factor.

4.4 Transient Response.

4.4.1 Gated Sinusoid Response.

4.4.2 Impulse Response.

4.5 Details of Lumped-element Parameters and Efficiency.

4.6 Discussion.

5 High-frequency Bandwidth Extension for Audio.

5.1 Introduction.

5.2 The Limits of Deconvolution.

5.3 Perceptual Considerations.

5.3.1 Pitch (Harmonic Structure).

5.3.2 Timbre (Spectral Envelope).

5.3.3 Loudness (Amplitude).

5.3.4 Effects of Hearing Loss.

5.3.5 Conclusions.

5.4 High-frequency Bandwidth Extension for Audio.

5.4.1 Non-linear Device.

5.4.2 Filtering.

5.4.3 Gain of Harmonics Signal.

5.5 Spectral Band Replication (SBR).

5.6 High-frequency Bandwidth Extension by Instantaneous Compression.

5.6.1 Introduction and Algorithm.

5.6.2 Analysis of Harmonics Generation.

5.6.3 Implementation.

5.6.4 Examples.

5.6.5 Approximation of the Function tanh(Z).

6 Bandwidth Extension for Speech.

6.1 Applications.

6.2 From a Speech Production Model to the Bandwidth Extension Algorithm.

6.2.1 Model of the Process of Speech Production.

6.2.2 Bandwidth Extension Algorithm.

6.2.3 Alternative Structures.

6.3 Extension of the Excitation Signal.

6.3.1 Explicit Signal Generation.

6.3.2 Non-linear Processing.

6.3.3 Modulation in the Time Domain.

6.3.4 Pitch Scaling.

6.3.5 Discussion.

6.4 Estimation of the Wideband Spectral Envelope.

6.4.1 Representations of the Estimated Spectral Envelope.

6.4.2 Instrumental Performance Measure.

6.4.3 Theoretical Performance Bound.

6.5 Feature Selection.

6.5.1 Mutual Information.

6.5.2 Separability.

6.5.3 Linear Discriminant Analysis.

6.5.4 Primary Features.

6.5.5 Evaluation.

6.6 Codebook Mapping.

6.6.1 Vector Quantization and Training of the Primary Codebook.

6.6.2 Training of the Shadow Codebook.

6.7 Linear Mapping.

6.7.1 Training Procedure.

6.7.2 Piecewise-linear Mapping.

6.8 Gaussian Mixture Model.

6.8.1 Minimum Mean Square Error Estimation.

6.8.2 Training by the Expectation-maximization Algorithm.

6.9 Hidden Markov Model.

6.9.1 Statistical Model of the Markov States.

6.9.2 Estimation Rules.

6.10 Discussion.

7 Noise Abatement.

7.1 A Special Kind of Noise Reduction.

7.2 The Noise Pollution Problem – Case Study.

7.3 The Application Low-frequency Psychoacoustic Bandwidth Extension to Noise Pollution.

8 Bandwidth Extension Patent Overview.

Appendix A Multidimensional Scaling.

A.1 Introduction.

A.2 Scaling.

A.3 Example.

A.4 Procedure.

A.5 Precautions Concerning the Solution.

A.6 Significance of Stress.

A.7 Univariate Scaling.

References.

Index.

商品描述(中文翻譯)

描述:
信號的頻寬擴展可以定義為故意擴展信號的頻率範圍(頻寬)的過程,其中包含可觀且有用的內容,和/或其效果的頻率範圍。近年來的顯著進展使得這項技術在多個領域商業化應用,包括小型揚聲器的心理聲學低音增強和感知編碼音頻的高頻增強。隨著這項技術在不同領域的日益使用,對該領域知識的需求也隨之增加。由該領域專家撰寫的《音頻信號處理中的信號頻寬擴展》將整合有關信號頻寬擴展的理論和應用,幫助讀者發展對該領域及其潛在用途的全面了解。這本書是學術界和專業人士的理想參考,最適合音頻工程的研究人員和開發者。然而,它也適合那些學習或從事信號處理、通信、音頻和視頻工程及編碼理論等領域的人士。

目錄:
前言。
I 引言。
I.1 頻寬定義。
I.2 歷史概述。
I.2.1 電聲換能器。
I.2.2 音質。
I.3 頻寬擴展框架。
I.3.1 介紹。
I.3.2 框架。
1 從物理學到心理物理學。
1.1 信號理論。
1.1.1 線性和非線性系統。
1.1.2 連續時間LTI(LTC)系統。
1.1.3 離散時間LTI(LTD)系統。
1.1.4 LTI系統的其他特性。
1.1.5 數位濾波器。
1.2 音頻信號的統計。
1.2.1 語音。
1.2.2 音樂。
1.3 揚聲器。
1.3.1 聲學簡介。
1.3.2 揚聲器。
1.3.3 貝塞爾和斯特魯維函數。
1.4 聽覺感知。
1.4.1 外周聽覺系統的物理特性。
1.4.2 基底膜反應的非線性。
1.4.3 頻率選擇性和聽覺濾波器。
1.4.4 音量和掩蔽。
1.4.5 音高。
1.4.6 音色。
1.4.7 聽覺場景分析。
1.4.8 感知建模 – 聽覺圖像模型。
2 低頻的心理聲學頻寬擴展。
2.1 介紹。
2.2 小型揚聲器再現的低頻增強的心理聲學效應。
2.2.1 音高(和聲結構)。
2.2.2 音色(頻譜包絡)。
2.2.3 音量(振幅)和音調持續時間。
2.3 低頻心理聲學頻寬擴展算法。
2.3.1 概述。
2.3.2 非線性裝置。
2.3.3 濾波。
2.3.4 和聲信號的增益。
2.4 具有頻率追蹤的低頻心理聲學頻寬擴展。
2.4.1 非線性裝置。
2.4.2 頻率追蹤。
2.5 低頻心理聲學頻寬擴展算法的主觀性能。
2.5.1 “虛擬低音”。
2.5.2 “超低音”。
2.6 非線性裝置的頻譜特性。
2.6.1 整流器的輸出頻譜。
2.6.2 積分器的輸出頻譜。
2.6.3 離散時間的輸出頻譜。
2.6.4 剪切器的輸出頻譜。
3 低頻物理頻寬擴展。
3.1 介紹。
3.2 感知考量。
3.2.1 音高(頻譜細結構)。
3.2.2 音色(頻譜包絡)。
3.2.3 音量(振幅)。
3.3 低頻物理頻寬擴展算法。
3.3.1 具有低頻擴展的系統。
3.3.2 非線性裝置。
3.3.3 濾波。
3.3.4 和聲信號的增益。
3.4 低頻物理頻寬擴展與低頻心理聲學頻寬擴展的結合。
4 用於低頻頻寬擴展的特殊揚聲器驅動器。
4.1 力因子。
4.2 高力因子驅動器。
4.3 低力因子驅動器。
4.3.1 最佳力因子。
4.4 瞬態響應。
4.4.1 閘控正弦波響應。
4.4.2 脈衝響應。
4.5 集總元件參數和效率的細節。
4.6 討論。
5 用於音頻的高頻頻寬擴展。
5.1 介紹。
5.2 去卷積的限制。
5.3 感知考量。
5.3.1 音高(和聲結構)。
5.3.2 音色(頻譜包絡)。
5.3.3 音量(振幅)。
5.3.4 聽力損失的影響。
5.3.5 結論。
5.4 用於音頻的高頻頻寬擴展。
5.4.1 非線性裝置。
5.4.2 濾波。
5.4.3 和聲信號的增益。
5.5 頻譜帶複製(SBR)。
5.6 通過瞬時壓縮的高頻頻寬擴展。
5.6.1 介紹和算法。
5.6.2 和聲生成的分析。
5.6.3 實現。
5.6.4 範例。
5.6.5 函數 tanh(Z) 的近似。
6 語音的頻寬擴展。
6.1 應用。
6.2 從語音產生模型到頻寬擴展算法。
6.2.1 語音產生過程的模型。
6.2.2 頻寬擴展算法。
6.2.3 替代結構。
6.3 激勵信號的擴展。
6.3.1 明確信號生成。
6.3.2 非線性處理。
6.3.3 時域調製。
6.3.4 音高縮放。
6.3.5 討論。
6.4 寬頻頻譜包絡的估計。
6.4.1 估計頻譜包絡的表示。
6.4.2 樂器性能測量。
6.4.3 理論性能界限。
6.5 特徵選擇。
6.5.1 互信息。
6.5.2 可分性。
6.5.3 線性判別分析。
6.5.4 主要特徵。
6.5.5 評估。
6.6 代碼本映射。
6.6.1 向量量化和主要代碼本的訓練。
6.6.2 陰影代碼本的訓練。
6.7 線性映射。
6.7.1 訓練程序。
6.7.2 分段線性映射。
6.8 高斯混合模型。
6.8.1 最小均方誤差估計。
6.8.2 通過期望最大化算法進行訓練。
6.9 隱馬可夫模型。
6.9.1 馬可夫狀態的統計模型。