如何看待 W3C 的中文排版需求(草案)的發布?

中文排版需求

W3C 推出了中文排版需求, 內容是簡繁體混排的。
邀請的專家董福興、陳奕鈞、梁海又是什麼背景呢?

互聯網技術界有參與其中嗎?


我在Type is Beautiful上的文章大致上已經說明了這份文件的目的:Type is Beautiful

本文件的目的

再補充說明:這一份文件的英文名是:Requirements for Chinese Text Layout,中文正確的名稱應該是「中文排版需求書」。W3C i18n將其作為參考文件。編輯要做的是將中文排版表現上的各項要點鉅細彌遺地列出,待完成後,以英文、簡體及繁體發布。同時i18n小組也會審視文件中各項要求,比對現在HTML、CSS以及Unicode規範,找出需修改、增加的部分,寫出Gap Document,要求各規範的編輯參考修正。

本文件是什麼?

所以,這一份文件:

  • 不是一份照做就對,不照做就錯的「排版規範」。
  • 不會提供具體的CSS範本,讓前端工程師可以直接使用。
  • 是整理中文書籍,也包括雜誌、報紙等排版規則的完整文件。
  • 是作為「印刷出版」與「數字出版」,於技術上接軌的文件。

本文件的進度

同時,按照W3C的文件進程,這只是First Editor"s Draft,意思就是編輯寫到覺得可以發布的程度,於是先發布出來、邊蒐集意見、邊繼續撰寫。待整體大致完成,會開放review,最後變成「Working Group Note」,當然還會依照意見補充、擴寫、加入圖片。

所以此時此刻,不會修改草稿裡繁簡混雜的部分;也不會花時間在體例的調整(例如Github上有朋友認為文檔使用的html tag不那麼W3C)。先專注在如何完整表達中文排版的各種狀況,日後正式發佈前夕,會再進行:

  • 繁體、簡體、英文版的分離與檢查;
  • 術語的檢查;
  • 體例的調整。

也就是說:這份文件還沒寫完,先別在意細節,專注在寫出來的有沒有問題,以及趕緊把它寫完。(工作小組的時間到2016年底,其實時間不多。)

為什麼沒有大教授?

有人質疑這份文件怎麼交給三個年輕人來寫。我在台灣活動了相當久,也邀請老編輯、教授參與,但願意加入的人不多。相較於蒙古文由內蒙古大學教授Nashun-urt直接參與,中文這端沒有學術界、實務界的人願意加入,我也覺得奇怪。而W3C北航小倩也邀請會員加入,但狀況也沒改變。如果各位覺得沒有學術界是個問題,歡迎直接請教授們加進來,但不要只掛名都好。

這份文件與Polyfill框架有何關聯?

再談談這份文件與CSS、以及亦鈞所做的Polyfill框架有什麼不同。目前中文排版可以透過JavaScript以及CSS來調整。但是這些框架後面都是按照個人對中文排版的認識,其實也就是「中文排版需求書」所要傳達的內容。而缺少這份文件,彼此認知不同。

舉個範例:Web技術對於中文排版來說是個畸形兒,製作框架的技術者都想為它動手術,但大家認識的正常不一致,所整形後的結果不一致。同時,如果畸形各個都要靠手術矯正,也是相當麻煩且累的事情。

W3C的目的是,先透過這份「需求書」,從歷史判斷怎麼樣才是正常,而且要怎麼做才會正常。之後交付給CSS來在新規範裡加入對應的Properties與Value,設定之後,就會對。也就是從源頭來改善結果,而不是想辦法以補洞的方式來處理。

這份文件如何影響到CSS等規範

例如凡談排版,就會有人批評為什麼中文與英文字間不加空白。但手動輸入的空白是內容,自動加入的間距是樣式,樣式與內容分離早就是Web的準則。Polyfill框架以JS自動加入空白,雖然是個解法,但不完善。而且日文的間距是1/4 em,是來自活字印刷1/4字大小的鉛片;中文從來沒有這麼清楚的規則。更不應該直接套用。於是我們會在「中文排版需求書」裡提出處理方法,之後應該會進入CSS Text Level 4來以text-spacing處理。雖然花時間,但Web技術本來就不會只用個1、2年,而會持續發展下去。

這份文件對排版實務的影響

也有人覺得語言文字約定俗成,不應該規範。但日文印刷品隨便抓一本都有高品質,這是不容否認的事實。日文從JIS X 4051到JLREQ,除了以上目的外,也被當作國內排版教育的基礎,各種從文件衍伸出的教科書,都教授一代代的設計與排版工作者日文排版的基礎。在那基礎上要如何破格、變化、作出設計,是個人造化。

中文始終沒這樣的文件。從活字排版到照相排版、跳躍到桌上排版,都是師徒相承、口述言授。也難怪從桌上排版到Web及電子書的排版,會有這麼大的斷層。如果你覺得這份文件沒必要,那也不應該批評Kindle排版很差,因為約定俗成嗎。


3 月 28 日版的《中文排版規範》(Requirements for Chinese Text Layout (CLReq)正式的中文題名即將變更為「中文排版需求」),是編者草案(editor』s drafts)的初稿。

CLReq 的編撰本意,應是整理具有普遍參考意義的中文排版需求,結稿成文,以備國際化排版引擎開發及數字出版業人員參考。

特邀編委席的一員、董福興先生,撰文說明了該文檔的緣起及起草背景:http://www.typeisbeautiful.com/2015/04/9171/。


https://lists.w3.org/Archives/Public/public-html-ig-zh/2015Mar/0037.html

參與渠道:
https://lists.w3.org/Archives/Public/public-html-ig-zh/
https://github.com/w3c/clreq/issues


董福興背景:

https://ipn.li/itgonglun/119/

梁海背景:

https://ipn.li/itgonglun/88/

陳奕鈞背景:

http://css.hanzi.co/

以上三人,外加 @濤吳、@Eric Liu 和在下,在第十六期《內核恐慌》播客裏討論了這份文檔:

https://ipn.li/kernelpanic/16

記得聽完。萌點在最後。


董福興是台灣汪達(Wanderer)數位出版股份有限公司的創始人:公司資料 有超過十年的EPUB製作經驗,他們公司的主要業務也是製作電子書。
我曾經上過他12小時的EPUB電子書教授課程,包括如何製作、如何在Google Play和iBooks Store上售賣,一個胖胖的男老師,很專業。雖然最後沒有完全學會,(需要一定的代碼編寫基礎)但是算是被他領入門了。後來通過自學,我把自己的作品做成了一本複雜版面的EPUB(EPUB主要分為文字重排reflow、一圖一頁、複雜的固定版面fixed-layout三類),微博上有分享weibo.com 的頁面。這本書就是圖文分離的,但版式又是完全按照紙質書排的,在iBooks上看會很舒服。前後花了一個多月編排,都是直接寫代碼排版,真正的電子書應該是深入到代碼層面的。
台灣現在的電子書和美國一樣是EPUB格式的,國內好像還沒有統一的電子書格式,都是各自為陣,固定版面的電子書更是沒有。iBooks Store還沒有進入大中華地區,據說是因為蘋果還沒有解決中文排版的問題,現在亞洲就日本有iBooks Store。日本的排版要好很多,而且有專門針對漫畫的一圖一頁的EPUB,但是畢竟不是中文,中文的版式規範有很多沒有明確的地方:
如何實現首行縮進兩字、中文和英文之間如何自動隔開一個半形字元的距離、中文拼音怎麼輸入、直排繁體的注音符號怎麼輸入……英文規範已經很完善了,中文規範還有很多亟待解決的問題。
台灣的專業人士在主動參與W3C中文版式的推動,國內似乎還沒聽到什麼動靜,感覺大家好像對EPUB沒什麼興趣,似乎覺得只要像網頁那樣的純文字,能讀就行了。如果只是那樣,就真的低估EPUB 3.0的能耐了。EPUB絕對是未來進行數字典藏的絕佳方式,因為它不僅能保存文字、圖片,還能存儲聲音、視頻等多媒體信息,還可以進行互動等等,相當於將多個HTML 5網頁封裝在一本書里,大大豐富了我們對電子書的定義,而且EPUB是Apple唯一支持的電子書格式,Apple的影響力不用多說。所以說,EPUB應該是未來電子書的趨勢。
如果說未來的電子書格式將由EPUB統一,那麼中文版式規範就顯得尤為重要了。當然前提是中國也和國際接軌,採用統一的EPUB;如果要搞中國特色,那就另當別論了。


關鍵要學術界參與進去,相比日文排版要差很多,專業性不夠,不過是個很好的開端。


《侏羅紀公園》有一句台詞:生物會自由進化,不會遵循人類制定的規則。
語言的發展也是這樣。


為外來語、首字母縮略詞標注其中譯,或對翻譯名詞標注其原文,多見於專有名詞、作品名及譯後概念較難傳達的詞彙。常見於譯作,尤以輕小說為主。

黑得漂亮。


推薦閱讀:

日期如何豎向排版?
產品人員如何使自己產出的各類文檔更加美觀?

TAG:排版 | 字體排印 | 萬維網聯盟(W3C) | 中文排版 |