關於《粵語審音配詞字庫》的一些問題
10 人贊了文章
最近爬取了《粵語審音配詞字庫》的13060個字,放入數據庫中研究,發現了一些問題,現記錄如下
一、39個字異讀音標示出錯
例如:「蜃」字,標爲自己的異讀
這樣的字共有39個,分別是
蜃,淨,鵏,邃,鬗,綷,濮,霽,燜,袢,姁,懭,檡,溔,刻,腎,釓,鉊,行,釁,拎,蒐,芩,蠥,鵙,镼,祜,伿,奼,魃,狃,麛,蔇,獥,痁,綎,牡,嘮,螲。
大部分都比較好處理,容易看出本讀字應該是哪個,但有兩個字:「檡」,「獥」較難處理。
作爲愛好者,水平自然很菜,我個人不敢確定,目前的處理如下
根據《粵審》的使用凡例中有一類叫「破音字」
任何「多讀音字」,若(a)其讀音當中至少有兩個表示不同的意義;而且(b)其讀音之間並未構成下文所述之異讀關係者,皆屬「破音字」。例如「覺」字,當讀如[gaau3]時,意指「睡眠」;若讀如[gok3],則意指「對刺激的感受和辨別」、「醒悟」等等。
而「檡」字在《漢典網》的釋義如下
讀音與意義皆不同,理應將「檡」看作「破音字」,zaak6與tou4是它的兩個讀音。
而「獥」字在《漢典網》的釋義如下
在《韻典網》的讀音如下
讀音不同但是釋義相同,屬於《粵審》的使用凡例中「異讀字」的定義
任何「多讀音字」,若其讀音之變化並沒有構成字義之別,皆屬「異讀字」。例如「曙」字,分別被註上[cyu5]、[syu5]和[syu6]三個不同的讀音,但基本意義不變。
所以我將「獥」的hat6讀音列爲本讀,giu3與gik1列爲異讀。注意,這裡與《漢字古今中外讀音查詢》app的處理方式是不同的
在《漢字古今中外讀音查詢》app中gik1是列爲giu3的異讀,而我認爲gik1與giu3都是hat6的異讀,所以有所不同。
上述讀音乃一家之言,如有繆誤,望不吝賜教。
二、3個字的查詢服務器出錯
這三個字分別是「宎」,「嬪」,「妏」。
不知道是服務器抽了什麼風,反正偏偏這三個字查不到,另外在《粵音字庫》app中也是出錯的,因爲該app是依賴於《粵審》的網路數據來查的
但是幸運的是在《漢語多功能字庫》中是可以查詢的,所以查不到的話可以上這個網站,它是《粵語審音配詞字庫》的改進版
三、9個字無讀音
《粵審》中有9個字是沒有讀音的,大多是日譯漢字或日本字。
原《粵審》是沒有讀音的
這種沒有讀音的字總共有9個,分別是
「粴」,「粨」,「覅」,「粁」,「籿」,「嵙」,「粍」,「粌」,「粀」。
同樣幸運的是,在《漢語多功能字庫》中對這些字的讀音作了補充而且改了釋義
但是除了唯一的一個日本漢字「嵙」,依然不賦予讀音,其他8個字都有讀音了
推薦閱讀:
※香港粵語歌神--許冠傑
※譚詠麟最具代表的十首粵語歌曲第七首【忘不了您】
※陳淑樺-流光飛舞(粵語)的歌詞
※《金枝玉葉(二) 粵語》
※索樂唱片《不老情歌2 粵夜粵美麗》經典粵語情歌 全新對唱演繹
TAG:粵語 |