The Unicode Standard, Version 4.0
暫譯: Unicode 標準，第 4.0 版

Name: The Unicode Standard, Version 4.0
Price: 1680 TWD
Availability: InStock
Author: The Unicode Consortium
ISBN: 0321185781

The Unicode Consortium

出版商: Addison Wesley
出版日期: 2003-09-06
定價: $2,800
售價: 6.0 折 $1,680
語言: 英文
頁數: 1504
裝訂: Hardcover
ISBN: 0321185781
ISBN-13: 9780321185785
相關分類: XML、資訊科學

立即出貨(限量) (庫存=4)

買這商品的人也買了...

~~$520~~ $411

資料結構－使用 C++ (Fundamentals of Data Structures in C++)
~~$680~~ $537

計算機組織與設計--軟硬體界面第二版 (Computer Organization & Design, 2/e)
~~$2,660~~ $2,527

Data Mining: Concepts and Techniques
~~$860~~ $679

演算法導論 (Introduction to Algorithms, 2/e)
~~$2,270~~ $2,157

Unicode Demystified: A Practical Programmer's Guide to the Encoding Standard
~~$550~~ $468

如何設計 PHP 程式
~~$1,300~~ $1,235

Thinking in Java, 3/e
~~$1,930~~ $1,834

Sun Certified Programmer & Developer for Java 2 Study Guide, 2/e
~~$780~~ $741

作業系統概念 (Operating System Concepts, 6/e Windows XP Update)
~~$750~~ $638

Java 完美經典優質學習篇
~~$590~~ $466

ASP.NET 程式設計徹底研究
~~$720~~ $569

重構─改善既有程式的設計
~~$640~~ $544

FreeBSD 完全探索 (Absolute BSD: The Ultimate Guide to FreeBSD)
~~$620~~ $490

LDAP 系統管理 (LDAP System Administration)
~~$750~~ $638

鳥哥的 Linux 私房菜－伺服器架設篇
~~$560~~ $476

鳥哥的 Linux 私房菜─基礎學習篇增訂版
~~$2,390~~ $2,271

CCNA Self-Study: Interconnecting Cisco Network Devices (ICND) 640-811, 640-801, 2/e
~~$480~~ $379

人月神話：軟體專案管理之道 (20 週年紀念版)(The Mythical Man-Month: Essays on Software Engineering, Anniversary Edition, 2/e)
~~$780~~ $616

CCNA 認證教戰手冊 Exam 640-801 (CCNA Cisco Certified Network Associate Study Guide, 4/e)
~~$390~~ $308

世界是平的 (The World Is Flat)
~~$750~~ $593

Visual C# 2005 程式開發與介面設計秘訣
~~$540~~ $427

聖殿祭司的 Silverlight 完美入門
~~$450~~ $351

MIS 網路管理的工具箱
~~$590~~ $502

SQL Server 2008 管理實戰─營運管理篇
~~$680~~ $578

SQL Server 2008 Reporting Services 報表服務

商品描述

The authoritative guide to universal character encoding
The official way to implement ISO/IEC 10646
The key to advancing global interoperability in information technology products

Unicode 4.0

The Unicode Standard

The Unicode Standard provides a unique code number for every character in electronic text, no matter what the platform, no matter what the application, no matter what the language. It is required for XML and is at the core of modern software products. Unicode 4.0 contains 96,248 characters covering languages of the world. The Unicode Standard contains extensive descriptions of each writing system, as well as definitions of character properties and detailed conformance requirements. It is the complete and definitive user's guide for novices and experts alike.

This edition, The Unicode Standard, Version 4.0, adds 47,188 new characters for minority and historic scripts, several sets of symbols, and a very large collection of additional CJK ideographs. It provides updated specifications covering structure, conformance, character behavior and semantics, as well as implementation guidelines, detailed discussions of writing systems, comprehensive charts, and an extensive glossary. The accompanying CD-ROM includes the text of all the Unicode Standard Annexes and the entire Unicode Character Database.

Table of Contents

Acknowledgments.

Unicode Consortium Members and Directors.

Figures.

Tables.

Preface.

1. Introduction.

Coverage.

Standards Coverage.

New Characters.

Design Goals.

Text Handling.

Interpreting Characters.

Text Elements.

The Unicode Standard and ISO/IEC 10646.

The Unicode Consortium.

The Unicode Technical Committee.

Submitting New Characters.

2. General Structure.

Architectural Context.

Basic Text Processes.

Text Elements, Characters, and Text Processes.

Text Processes and Encoding.

Unicode Design Principles.

Universality.

Efficiency.

Characters, Not Glyphs.

Semantics.

Plain Text.

Logical Order.

Unification.

Dynamic Composition.

Equivalent Sequences.

Convertibility.

Compatibility Characters.

Compatibility Decomposable Characters.

Mapping Compatibility Characters.

Code Points and Characters.

Types of Code Points.

Encoding Forms.

UTF-32.

UTF-16.

UTF-8.

Comparison of the Advantages of UTF-32, UTF-16, and UTF-8.

Encoding Schemes.

Unicode Strings.

Unicode Allocation.

Planes.

Allocation Areas and Character Blocks.

Details of Allocation.

Assignment of Code Points.

Writing Direction.

Combining Characters.

Sequence of Base Characters and Diacritics.

Multiple Combining Characters.

Ligated Multiple Base Characters.

Spacing Clones of European Diacritical Marks.

"Characters" and Grapheme Clusters.

Special Characters and Noncharacters.

Byte Order Mark (BOM).

Special Noncharacter Code Points.

Layout and Format Control Characters.

The Replacement Character.

Control Codes.

Conforming to the Unicode Standard.

Supported Subsets.

Related Publications.

3. Conformance.

Versions of the Unicode Standard.

Stability.

Version Numbering.

Errata, Corrigenda, and Future Updates.

References to the Unicode Standard.

References to Unicode Character Properties.

References to Unicode Algorithms.

Conformance Requirements.

Byte Ordering.

Unassigned Code Points.

Interpretation.

Modification.

Character Encoding Forms.

Character Encoding Schemes.

Bidirectional Text.

Normalization Forms.

Normative References.

Unicode Algorithms.

Default Casing Operations.

Unicode Standard Annexes.

Semantics.

Definitions.

Character Identity and Semantics.

Characters and Encoding.

Properties.

Normative and Informative Properties.

Simple and Derived Properties.

Property Aliases.

Default Property Values.

Private Use.

Combination.

Decomposition.

Compatibility Decomposition.

Canonical Decomposition.

Surrogates.

Unicode Encoding Forms.

UTF-32.

UTF-16.

UTF-8.

Encoding Form Conversion.

Unicode Encoding Schemes.

Canonical Ordering Behavior.

Application of Combining Marks.

Combining Classes.

Canonical Ordering.

Canonical Ordering and Collation.

Conjoining Jamo Behavior.

Hangul Syllable Boundaries.

Standard Korean Syllables.

Hangul Syllable Composition.

Hangul Syllable Decomposition.

Hangul Syllable Names.

Default Case Operations.

Definitions.

Case Conversion of Strings.

Case Detection for Strings.

Caseless Matching.

4. Character Properties.

Unicode Character Database.

Case-Normative.

Case Mapping.

Combining Classes-Normative.

Directionality-Normative.

General Category-Normative.

Numeric Value-Normative.

Ideographic Numeric Values.

Bidi Mirrored-Normative.

Unicode 1.0 Names.

Letters, Alphabetic, and Ideographic.

Boundary Control.

Characters with Unusual Properties.

5. Implementation Guidelines.

Transcoding to Other Standards.

Issues.

Multistage Tables.

ANSI/ISO C wchar_t.

Unknown and Missing Characters.

Reserved and Private-Use Character Codes.

Interpretable but Unrenderable Characters.

Default Property Values.

Default Ignorable Code Points.

Interacting with Downlevel Systems.

Handling Surrogate Pairs in UTF-16.

Handling Numbers.

Normalization.

Compression.

Newline Guidelines.

Definitions.

Background.

Recommendations.

Regular Expressions.

Language Information in Plain Text.

Requirements for Language Tagging.

Language Tags and Han Unification.

Editing and Selection.

Consistent Text Elements.

Strategies for Handling Nonspacing Marks.

Keyboard Input.

Truncation.

Rendering Nonspacing Marks.

Canonical Equivalence.

Positioning Methods.

Locating Text Element Boundaries.

Identifiers.

Property-Based Identifier Syntax.

Syntactic Rule.

Alternative Recommendation.

Sorting and Searching.

Culturally Expected Sorting and Searching.

Language-Insensitive Sorting.

Searching.

Sublinear Searching.

Binary Order.

UTF-8 in UTF-16 Order.

UTF-16 in UTF-8 Order.

Case Mappings.

Complications for Case Mapping.

Reversibility.

Caseless Matching.

Normalization.

Unicode Security.

Default Ignorable Code Points.

6. Writing Systems and Punctuation.

Writing Systems.

General Punctuation.

Punctuation: U+0020-U+00BF.

General Punctuation: U+2000-U+206F.

CJK Symbols and Punctuation: U+3000-U+303F.

CJK Compatibility Forms: U+FE30-U+FE4F.

Small Form Variants: U+FE50-U+FE6F.

7. European Alphabetic Scripts.

Latin.

Letters of Basic Latin: U+0041-U+007A.

Letters of the Latin-1 Supplement: U+00C0-U+00FF.

Latin Extended-A: U+0100-U+017F.

Latin Extended-B: U+0180-U+024F.

IPA Extensions: U+0250-U+02AF.

Phonetic Extensions: U+1D00-U+1D6A.

Latin Extended Additional: U+1E00-U+1EFF.

Latin Ligatures: FB00-FB06.

Greek.

Greek: U+0370-U+03FF.

Greek Extended: U+1F00-U+1FFF.

Cyrillic.

Cyrillic: U+0400-U+04FF.

Cyrillic Supplement: U+0500-U+052F.

Armenian.

Armenian: U+0530-U+058F.

Georgian.

Georgian: U+10A0-U+10FF.

Modifier Letters.

Spacing Modifier Letters: U+02B0-U+02FF.

Combining Marks.

Combining Diacritical Marks: U+0300-U+036F.

Combining Marks for Symbols: U+20D0-U+20FF.

Combining Half Marks: U+FE20-U+FE2F.

8. Middle Eastern Scripts.

Hebrew.

Hebrew: U+0590-U+05FF.

Alphabetic Presentation Forms: U+FB1D-U+FB4F.

Arabic.

Arabic: U+0600-U+06FF.

Cursive Joining.

Ligatures.

Arabic Presentation Forms-A: U+FB50-U+FDFF.

Arabic Presentation Forms-B: U+FE70-U+FEFF.

Syriac.

Syriac: U+0700-U+074F.

Syriac Shaping.

Syriac Cursive Joining.

Ligatures.

Thaana.

Thaana: U+0780-U+07BF.

9. South Asian Scripts.

Devanagari.

Devanagari: U+0900-U+097F.

Bengali.

Bengali: U+0980-U+09FF.

Gurmukhi.

Gurmukhi: U+0A00-U+0A7F.

Gujarati.

Gujarati: U+0A80-U+0AFF.

Oriya.

Oriya: U+0B00-U+0B7F.

Tamil.

Tamil: U+0B80-U+0BFF.

Telugu.

Telugu: U+0C00-U+0C7F.

Kannada.

Kannada: U+0C80-U+0CFF.

Malayalam.

Malayalam: U+0D00-U+0D7F.

Sinhala.

Sinhala: U+0D80-U+0DFF.

Tibetan.

Tibetan: U+0F00-U+0FFF.

Limbu.

Limbu: U+1900-U+194F.

10. Southeast Asian Scripts.

Thai.

Thai: U+0E00-U+0E7F.

Lao.

Lao: U+0E80-U+0EFF.

Myanmar.

Myanmar: U+1000-U+109F.

Khmer.

Khmer: U+1780-U+17FF.

Khmer Symbols: U+19E0-U+19FF.

Tai Le.

Tai Le: U+1950-U+197F.

Philippine Scripts.

Tagalog: U+1700-U+171F.

Hanunoo: U+1720-U+173F.

Buhid: U+1740-U+175F.

Tagbanwa: U+1760-U+177F.

11. East Asian Scripts.

Han.

CJK Unified Ideographs.

CJK Unified Ideographs Ext. B: U+20000-U+2A6D6.

CJK Compatibility Ideographs: U+F900-U+FAFF.

CJK Compatibility Supplement: U+2F800-U+2FA1D.

Kanbun: U+3190-U+319F.

CJK and KangXi Radicals: U+2E80-U+2FD5.

Ideographic Description: U+2FF0-U+2FFB.

Bopomofo.

Bopomofo: U+3100-U+312F.

Hiragana and Katakana.

Hiragana: U+3040-U+309F.

Katakana: U+30A0-U+30FF.

Katakana Phonetic Extensions: U+31F0-U+31FF.

Halfwidth and Fullwidth Forms: U+FF00-U+FFEF.

Hangul.

Hangul Jamo: U+1100-U+11FF.

Hangul Compatibility Jamo: U+3130-U+318F.

Hangul Syllables: U+AC00-U+D7A3.

Yi.

Yi: U+A000-U+A4CF.

12. Additional Modern Scripts.

Ethiopic.

Ethiopic: U+1200-U+137F.

Mongolian.

Mongolian: U+1800-U+18AF.

Osmanya.

Osmanya: U+10480-U+104AF.

Cherokee.

Cherokee: U+13A0-U+13FF.

Canadian Aboriginal Syllabics.

Canadian Aboriginal Syllabics: U+1400-U+167F.

Deseret.

Deseret: U+10400-U+1044F.

Shavian.

Shavian: U+10450-U+1047F.

13. Archaic Scripts.

Ogham.

Ogham: U+1680-U+169F.

Old Italic.

Old Italic: U+10300-U+1032F.

Runic.

Runic: U+16A0-U+16F0.

Gothic.

Gothic: U+10330-U+1034F.

Ugaritic.

Ugaritic: U+10380-U+1039F.

Linear B.

Linear B Syllabary: U+10000-U+1007F.

Linear B Ideograms: U+10080-U+108FF.

Aegean Numbers: U+10100-U+1013F.

Cypriot Syllabary.

Cypriot Syllabary: U+10800-U+1083F.

14. Symbols.

Currency Symbols.

Currency Symbols: U+20A0-U+20CF.

Letterlike Symbols.

Letterlike Symbols: U+2100-U+214F.

Math Alphanumeric Symbols: U+1D400-U+1D7FF.

Mathematical Alphabets.

Fonts Used for Mathematical Alphabets.

Number Forms.

Number Forms: U+2150-U+218F.

Superscripts and Subscripts: U+2070-U+209F.

Mathematical Symbols.

Mathematical Operators: U+2200-U+22FF.

Supplements to Mathematical Symbols and Arrows.

Supplemental Math Operators: U+2A00-U+2AFF.

Miscellaneous Math Symbols-A: U+27C0-U+27EF.

Miscellaneous Math Symbols-B: U+2980-U+29FF.

Arrows: U+2190-U+21FF.

Supplemental Arrows.

Standardized Variants of Mathematical Symbols.

Technical Symbols.

Control Pictures: U+2400-U+243F.

Miscellaneous Technical: U+2300-U+23FF.

Optical Character Recognition: U+2440-U+245F.

Geometrical Symbols.

Box Drawing: U+2500-U+257F.

Block Elements: U+2580-U+259F.

Geometric Shapes: U+25A0-U+25FF.

Miscellaneous Symbols and Dingbats.

Miscellaneous Symbols: U+2600-U+26FF.

Dingbats: U+2700-U+27BF.

Yijing Hexagram Symbols: U+4DC0-U+4DFF.

Tai Xuan Jing Symbols: U+1D300-U+1D356.

Enclosed and Square.

Enclosed Alphanumerics: U+2460-U+24FF.

Enclosed CJK Letters and Months: U+3200-U+32FF.

CJK Compatibility: U+3300-U+33FF.

Braille.

Braille Patterns: U+2800-U+28FF.

Byzantine Musical Symbols.

Byzantine Musical Symbols: U+1D000-U+1D0FF.

Western Musical Symbols.

Musical Symbols: U+1D100-U+1D1FF.

15. Special Areas and Format Characters.

Control Codes.

Layout Controls.

Invisible Operators.

Deprecated Format Characters.

Deprecated Format Characters: U+206A-U+206F.

Surrogates Area.

Surrogates Area: U+D800-U+DFFF.

Variation Selectors.

Private-Use Characters.

Private Use Area: U+E000-U+F8FF.

Supplementary Private Use Areas.

Noncharacters.

Noncharacters: U+FFFE, U+FFFF, and Others.

Specials.

Specials: U+FEFF, U+FFF0-U+FFFD.

Tag Characters.

Tag Characters: U+E0000-U+E007F.

16. Code Charts.

Character Names List.

Images in the Code Charts and Character Lists.

Character Names.

Aliases.

Cross References.

Information About Languages.

Case Mappings.

Decompositions.

Reserved Characters.

Noncharacters.

Subheads.

CJK Unified Ideographs.

Hangul Syllables.

17. Han Radical-Stroke Index.

A. Han Unification History.

B. Abstracts of Unicode Technical Reports.

Unicode Standard Annexes.

UAX #9: The Bidirectional Algorithm.

UAX #11: East Asian Width.

UAX #14: Line Breaking Properties.

UAX #15: Unicode Normalization Forms.

UAX #24: Script Names.

UAX #29: Text Boundaries.

Unicode Technical Standards.

UTS #6: A Standard Compression Scheme for Unicode.

UTS #10: Unicode Collation Algorithm.

Unicode Technical Reports.

UTR #16: UTF-EBCDIC.

UTR #17: Character Encoding Model.

UTR #18: Unicode Regular Expression Guidelines.

UTR #20: Unicode in XML and Other Markup Languages.

UTR #22: Character Mapping Markup Language (CharMapML).

UTR #26: Compatibility Encoding Scheme for UTF-16: 8-Bit (CESU-8).

Other Unicode References.

Unicode Technical Notes.

FAQ (Frequently Asked Questions).

Charts.

Conferences.

Policies.

Updates and Errata.

Versions.

Where Is My Character?

C. Relationship to ISO/IEC 10646.

History.

Unicode 1.0.

Unicode 2.0.

Unicode 3.0.

Unicode 4.0.

Encoding Forms in ISO/IEC 10646.

Zero Extending.

UCS Transformation Formats.

UTF-8.

UTF-16.

Synchronization of the Standards.

Identification of Features for the Unicode Standard.

Character Names.

Character Functional Specifications.

D. Changes from Unicode Version 3.0.

Versions of the Unicode Standard.

Changes from Unicode Version 3.0 to Version 3.1.

New Characters Added.

Unicode Character Database Changes.

Changes Affecting Conformance.

Unicode Standard Annexes.

Changes from Unicode Version 3.1 to Version 3.2.

New Characters Added.

Unicode Character Database Changes.

Changes Affecting Conformance.

Unicode Standard Annexes.

Changes from Unicode Version 3.2 to Version 4.0.

New Characters Added.

Unicode Character Database Changes.

Changes Affecting Conformance.

Unicode Standard Annexes.

Errata.

G. Glossary.

R. References.

Source Standards and Specifications.

Source Dictionaries for Han Unification.

Other Sources for the Unicode Standard.

Selected Resources: Technical.

Selected Resources: Scripts and Languages.

I. Indices.

Unicode Names Index.

General Index.

商品描述(中文翻譯)

權威的通用字符編碼指南
官方實現 ISO/IEC 10646 的方式
推進資訊科技產品全球互操作性的關鍵

### Unicode 4.0

*Unicode 標準*

Unicode 標準為電子文本中的每個字符提供唯一的編碼號，無論平台、應用程式或語言為何。它是 XML 的必要條件，也是現代軟體產品的核心。Unicode 4.0 包含 96,248 個字符，涵蓋世界各地的語言。Unicode 標準包含每種書寫系統的詳細描述，以及字符屬性的定義和詳細的符合性要求。它是新手和專家都能使用的完整且權威的用戶指南。

本版本，**《Unicode 標準，第 4.0 版》**，新增 47,188 個針對少數民族和歷史文字的新字符，幾組符號，以及大量的額外 CJK（中日韓）表意文字。它提供了更新的規範，涵蓋結構、符合性、字符行為和語義，以及實施指南、書寫系統的詳細討論、全面的圖表和廣泛的術語表。隨附的 CD-ROM 包含所有 Unicode 標準附錄的文本和整個 Unicode 字符資料庫。

**目錄**

**致謝。**

**Unicode 聯盟成員及董事。**

**圖表。**

**表格。**

**前言。**

**1. 介紹。**

涵蓋範圍。

標準涵蓋範圍。

新字符。

設計目標。

文本處理。

字符解釋。

文本元素。

Unicode 標準與 ISO/IEC 10646。

Unicode 聯盟。

Unicode 技術委員會。

提交新字符。

**2. 一般結構。**

架構背景。

基本文本處理。

文本元素、字符和文本處理。

文本處理與編碼。

Unicode 設計原則。

普遍性。

效率。

字符，而非字形。

語義。

純文本。

邏輯順序。

統一性。

動態組合。

等效序列。

可轉換性。

相容字符。

相容可分解字符。

映射相容字符。

編碼點與字符。

編碼點類型。

編碼形式。

UTF-32。

UTF-16。

UTF-8。

UTF-32、UTF-16 和 UTF-8 的優勢比較。

編碼方案。

Unicode 字串。

Unicode 分配。

平面。

分配區域和字符區塊。

分配的詳細信息。

編碼點的分配。

書寫方向。

組合字符。

基本字符和變音符號的序列。

多個組合字符。

連字的多個基本字符。

歐洲變音符號的間距克隆。

「字符」和字形集群。

特殊字符和非字符。

字節順序標記 (BOM)。

特殊非字符編碼點。

佈局和格式控制字符。

替代字符。

控制碼。

符合 Unicode 標準。

支持的子集。

相關出版物。

**3. 符合性。**

Unicode 標準的版本。

穩定性。

版本編號。

勘誤、修正和未來更新。

對 Unicode 標準的參考。

對 Unicode 字符屬性的參考。

對 Unicode 算法的參考。

符合性要求。

字節排序。

未分配的編碼點。

解釋。

修改。

字符編碼形式。

字符編碼方案。

雙向文本。

標準化形式。

規範性參考。

Unicode 算法。

默認大小寫操作。

Unicode 標準附錄。

語義。

定義。

字符身份和語義。

字符與編碼。

屬性。

規範性和資訊性屬性。

簡單和衍生屬性。

屬性別名。

默認屬性值。

私用區。

組合。

分解。

相容性分解。

標準分解。

代理。

Unicode 編碼形式。

UTF-32。

UTF-16。

UTF-8。

編碼形式轉換。

Unicode 編碼方案。

標準排序行為。

The Unicode Standard, Version 4.0
暫譯: Unicode 標準，第 4.0 版

The Unicode Consortium

買這商品的人也買了...

商品描述

Unicode 4.0

商品描述(中文翻譯)

類似商品

最後瀏覽商品 (8)

The Unicode Standard, Version 4.0 暫譯: Unicode 標準，第 4.0 版

The Unicode Consortium

買這商品的人也買了...

商品描述

Unicode 4.0

商品描述(中文翻譯)

類似商品

最後瀏覽商品 (8)

The Unicode Standard, Version 4.0
暫譯: Unicode 標準，第 4.0 版