AI 圖片增強 - 影像畫質演算法及深層視覺技術
賈壯 著
- 出版商: 深智數位
- 出版日期: 2024-11-19
- 定價: $980
- 售價: 7.9 折 $774
- 語言: 繁體中文
- 頁數: 480
- ISBN: 6267569225
- ISBN-13: 9786267569221
-
相關分類:
人工智慧、Algorithms-data-structures
尚未上市,歡迎預購
買這商品的人也買了...
-
$880$695
相關主題
商品描述
★影像處理和畫質演算法的基礎原理
★底層視覺任務及其與其他視覺任務的關係
★影像成像過程、顏色及影調的影響因素
★降噪演算法的雜訊生成機制及經典方法
★超解析度演算法的傳統插值與深度學習策略
★霧天成像模型、去霧任務解決方法
★HDR定義、任務設定、經典演算法
★深度學習影像合成、和諧化技術
★影像增強、修飾的經典演算法
★傳統方法與深度學習方法
隨著人工智慧和電腦視覺技術的進步,影像處理和畫質演算法技術正邁入新時期。底層視覺任務相較於檢測和辨識類視覺任務,較少受到關注,主要集中在影像的成像品質,如雜訊、顏色和清晰度等。深度學習模型的強大歸納和學習能力,使得基於此技術的底層視覺演算法在許多場景下能達成傳統演算法無法實現的效果。
本書將引導讀者深入了解影像畫質演算法及底層視覺技術的基本原理和應用,全面介紹該領域的經典方案與最新發展,並深入剖析不同任務的定義、挑戰及解決思路,涵蓋經典演算法。書中同時兼顧傳統方法與深度學習方法,因為傳統方法在實際應用中仍然發揮著重要作用,其設計理念通常與任務的先驗設定密切相關,而設計深度學習模型時也常參考傳統方法。因此,分析傳統方法對於深入理解底層視覺任務至關重要。
此外,書中還會介紹一些較新的基於深度學習的演算法,特別是那些具有啟發性的演算法,以幫助讀者在需要時明確演算法的設計和改進方向,從而在影像處理領域中獲得更深入的理解與應用。
作者簡介
賈 壯
電腦視覺演算法工程師,畢業於北京清華大學自動化系,模式識別與智慧系統方向碩士,曾在百度、華為等單位從事多項視覺相關演算法專案的研發與提交,在相關期刊和會議發表多篇論文,並在視覺相關國際競賽中獲得獎項,編著有《機器學習與深度學習算法基礎》等技術書籍。
目錄大綱
第1章 畫質演算法與底層視覺概述
1.1 畫質演算法的主要任務
1.1.1 畫質演算法定義及其主要類別
1.1.2 畫質問題的核心:退化
1.2 基於深度學習的底層視覺技術
1.2.1 深度學習與神經網路
1.2.2 底層視覺任務的特點
第2章 畫質處理的基礎知識
2.1 光照與成像
2.1.1 視覺與光學成像
2.1.2 Bayer陣列與去馬賽克
2.1.3 相機影像訊號處理的基本流程
2.2 色彩與顏色空間
2.2.1 人眼色覺與色度圖
2.2.2 常見的顏色空間
2.3 影像的影調調整方法
2.3.1 長條圖與對比度
2.3.2 對比度拉伸與長條圖均衡
2.3.3 對比度增強演算法的改進策略
2.4 影像常見的空間操作
2.4.1 基本影像變換:仿射變換與透視變換
2.4.2 光流與幀間對齊
2.5 影像的頻域分析與影像金字塔
2.5.1 傅立葉轉換與頻域分析
2.5.2 自然影像的頻域統計特性
2.5.3 影像金字塔:高斯金字塔與拉普拉斯金字塔
第3章 影像與視訊降噪演算法
3.1 雜訊的來源與數學模型
3.1.1 影像雜訊的物理來源
3.1.2 雜訊的數學模型
3.2 降噪演算法的困難與策略
3.2.1 降噪演算法的困難
3.2.2 盲降噪與非盲降噪
3.2.3 高斯降噪與真實雜訊降噪
3.2.4 降噪演算法的評價指標
3.3 傳統降噪演算法
3.3.1 空域濾波:平均值、高斯與中值濾波器
3.3.2 非局部平均值演算法
3.3.3 小波變換降噪演算法
3.3.4 雙邊濾波與導向濾波
3.3.5 BM3D濾波演算法
3.4 深度學習降噪演算法
3.4.1 深度殘差降噪網路DnCNN和FFDNet
3.4.2 雜訊估計網路降噪:CBDNet
3.4.3 小波變換與神經網路的結合:MWCNN
3.4.4 視訊降噪:DVDNet和FastDVDNet
3.4.5 基於Transformer的降噪方法:IPT與SwinIR
3.4.6 自監督降噪演算法:Noise2Noise、Noise2Void與DIP
3.4.7 Raw域降噪策略與演算法:Unprocess與CycleISP
第4章 影像與視訊超解析度
4.1 超解析度任務概述
4.1.1 解析度與超解析度任務
4.1.2 超解析度的任務設定與特點
4.1.3 超解析度的評價指標
4.2 超解析度的傳統演算法
4.2.1 上採樣插值演算法與影像銳化處理
4.2.2 基於自相似性的超解析度
4.2.3 基於稀疏編碼的超解析度
4.3 經典深度學習超解析度演算法
4.3.1 神經網路超解析度開端:SRCNN和FSRCNN
4.3.2 無參的高效上採樣:ESPCN
4.3.3 無BN層的殘差網路:EDSR
4.3.4 殘差稠密網路
4.3.5 針對視覺畫質的最佳化:SRGAN與ESRGAN
4.3.6 注意力機制超解析度網路:RCAN
4.3.7 盲超解析度中的退化估計:ZSSR與KernelGAN
4.4 真實世界的超解析度模型
4.4.1 複雜退化模擬:BSRGAN與Real-ESRGAN
4.4.2 影像域遷移:CycleGAN類網路與無監督超解析度
4.4.3 擴散模型的真實世界超解析度:StableSR
4.5 超解析度模型的輕量化
4.5.1 多分支資訊蒸餾:IMDN與RFDN
4.5.2 重參數化策略:ECBSR
4.5.3 消除特徵容錯:GhostSR
4.5.4 單層極輕量化模型:edgeSR
4.6 視訊超解析度模型簡介
4.6.1 視訊超解析度的特點
4.6.2 BasicVSR、BasicVSR++與RealBasicVSR
4.7 超解析度模型的最佳化策略
4.7.1 基於分頻分區域處理的模型設計
4.7.2 針對細節紋理的恢復策略
4.7.3 可控可解釋的畫質恢復與超解析度
第5章 影像去霧
5.1 影像去霧任務概述
5.1.1 有霧影像的形成與影響
5.1.2 有霧影像的退化:大氣散射模型
5.1.3 去霧演算法的主要想法
5.2 基於物理模型的去霧演算法
5.2.1 基於反照係數分解的Fattal去霧演算法
5.2.2 暗通道先驗去霧演算法
5.2.3 顏色衰減先驗去霧演算法
5.3 深度學習去霧演算法
5.3.1 點對點的透射圖估計:DehazeNet
5.3.2 輕量級去霧網路模型:AOD-Net
5.3.3 基於GAN的去霧模型:Dehaze cGAN和Cycle-Dehaze
5.3.4 金字塔稠密連接網路:DCPDN
5.3.5 特徵融合注意力去霧模型:FFA-Net
第6章 影像高動態範圍
6.1 影像HDR任務簡介
6.1.1 動態範圍的概念
6.1.2 HDR任務分類與關鍵問題
6.2 傳統HDR相關演算法
6.2.1 多曝融合演算法
6.2.2 局部拉普拉斯濾波演算法
6.2.3 Reinhard攝影色調重建演算法
6.2.4 快速雙邊濾波色調映射演算法
6.3 基於神經網路模型的HDR演算法
6.3.1 網路模型的訓練目標:MEF-SSIM
6.3.2 點對點多曝融合演算法:DeepFuse
6.3.3 多曝權重的網路計算:MEF-Net
6.3.4 注意力機制HDR網路:AHDRNet
6.3.5 單圖動態範圍擴充:ExpandNet
第7章 影像合成與影像和諧化
7.1 影像合成任務簡介
7.2 經典影像合成演算法
7.2.1 alpha通道混合演算法
7.2.2 多尺度融合:拉普拉斯金字塔融合
7.2.3 梯度域的無縫融合:卜松融合
7.3 深度學習影像合成與影像和諧化
7.3.1 空間分離注意力:S2AM模型
7.3.2 域驗證的和諧化:DoveNet
7.3.3 背景引導的域轉換:BargainNet
7.3.4 前景到背景的風格遷移:RainNet
第8章 影像增強與影像修飾
8.1 影像增強任務概述
8.2 傳統低光增強演算法
8.2.1 基於反色去霧的低光增強演算法
8.2.2 多尺度Retinex演算法
8.3 神經網路模型的增強與顏色調整
8.3.1 Retinex理論的模型實現:RetinexNet
8.3.2 雙邊即時增強演算法:HDRNet
8.3.3 無參考圖的低光增強:Zero-DCE
8.3.4 可控的修圖模型:CSRNet
8.3.5 3D LUT類模型:影像自我調整3D LUT和NILUT
8.3.6 色域擴充:GamutNet和GamutMLP