標籤:

關於《粵語審音配詞字庫》的一些問題

關於《粵語審音配詞字庫》的一些問題

10 人贊了文章

最近爬取了《粵語審音配詞字庫》的13060個字,放入數據庫中研究,發現了一些問題,現記錄如下

一、39個字異讀音標示出錯

例如:「蜃」字,標爲自己的異讀

這樣的字共有39個,分別是

蜃,淨,鵏,邃,鬗,綷,濮,霽,燜,袢,姁,懭,檡,溔,刻,腎,釓,鉊,行,釁,拎,蒐,芩,蠥,鵙,镼,祜,伿,奼,魃,狃,麛,蔇,獥,痁,綎,牡,嘮,螲。

大部分都比較好處理,容易看出本讀字應該是哪個,但有兩個字:「檡」,「獥」較難處理。

作爲愛好者,水平自然很菜,我個人不敢確定,目前的處理如下

根據《粵審》的使用凡例中有一類叫「破音字」

任何「多讀音字」,若(a)其讀音當中至少有兩個表示不同的意義;而且(b)其讀音之間並未構成下文所述之異讀關係者,皆屬「破音字」。例如「覺」字,當讀如[gaau3]時,意指「睡眠」;若讀如[gok3],則意指「對刺激的感受和辨別」、「醒悟」等等。

而「檡」字在《漢典網》的釋義如下

讀音與意義皆不同,理應將「檡」看作「破音字」,zaak6與tou4是它的兩個讀音。

而「獥」字在《漢典網》的釋義如下

在《韻典網》的讀音如下

讀音不同但是釋義相同,屬於《粵審》的使用凡例中「異讀字」的定義

任何「多讀音字」,若其讀音之變化並沒有構成字義之別,皆屬「異讀字」。例如「曙」字,分別被註上[cyu5]、[syu5]和[syu6]三個不同的讀音,但基本意義不變。

所以我將「獥」的hat6讀音列爲本讀,giu3與gik1列爲異讀。注意,這裡與《漢字古今中外讀音查詢》app的處理方式是不同的

在《漢字古今中外讀音查詢》app中gik1是列爲giu3的異讀,而我認爲gik1與giu3都是hat6的異讀,所以有所不同。

上述讀音乃一家之言,如有繆誤,望不吝賜教。

二、3個字的查詢服務器出錯

這三個字分別是「宎」,「嬪」,「妏」。

不知道是服務器抽了什麼風,反正偏偏這三個字查不到,另外在《粵音字庫》app中也是出錯的,因爲該app是依賴於《粵審》的網路數據來查的

但是幸運的是在《漢語多功能字庫》中是可以查詢的,所以查不到的話可以上這個網站,它是《粵語審音配詞字庫》的改進版

三、9個字無讀音

《粵審》中有9個字是沒有讀音的,大多是日譯漢字或日本字。

原《粵審》是沒有讀音的

這種沒有讀音的字總共有9個,分別是

「粴」,「粨」,「覅」,「粁」,「籿」,「嵙」,「粍」,「粌」,「粀」。

同樣幸運的是,在《漢語多功能字庫》中對這些字的讀音作了補充而且改了釋義

但是除了唯一的一個日本漢字「嵙」,依然不賦予讀音,其他8個字都有讀音了

推薦閱讀:

香港粵語歌神--許冠傑
譚詠麟最具代表的十首粵語歌曲第七首【忘不了您】
陳淑樺-流光飛舞(粵語)的歌詞
《金枝玉葉(二) 粵語》
索樂唱片《不老情歌2 粵夜粵美麗》經典粵語情歌 全新對唱演繹

TAG:粵語 |