台湾の2010年末の自治体合併 その1

台湾は2010年末に、大きな自治体合併があったよ。
これによって、直轄市2市が5市に、省轄市5市が3市となった。
直轄市2市――台北市 新北市 台中市 台南市 高雄市
省轄市3市――基隆市 新竹市 嘉義市
太字が変更箇所。
台中と台南と高雄に関しては、市が同一名称の県がくっついて直轄市となって、
台北県は、新北市という別の名前になって直轄市になったよ。
だから、もともと7つの市だったのが、これで8つにふえたわけだ。

こういう傾向だと、省轄市で同一名の県がある新竹市と嘉義市は、将来的に県と市がくっついて直轄市に昇格するのかと予想できるけど、
情勢はかなり流動的みたいなので、このブログを書いているこの段階では何とも言えない。

この行政区域の変更によって、「台」の文字を使う市が3つ、「新」を使う市が2つ、「北」を使う市が2つで――学習者には勉強しやすいような紛らわしいような感じ(漢字)になった。
恐らく新しくできた新北という名称と、嘉義という都市は知らない人がいるけど、それ以外の地名は日本人でも常識レベルで聞いたことがあるはず(と言いたい)。
新北はきっとそのうちよく聞かれるようになって、日本人も知ることになるだろうから、
つまり、常識的に日本人は「嘉義」という地名さえ覚えれば、台湾の大きな都市をみんな知っているということになりそうだよ。
でも、どうやったら嘉義を日本人の中でメジャーにできるのか……ちょっとそのとっかかりがつかめない。

最後に、以前に「台湾の同一名称の県と市の関係」でつくった地図は古いものになってしまったので、新しい形態のものを載せておくよ。
これまでは同一名称の県と市という関係性がすごく見られたんだけど、その関係も減ってきた、減っていくと言えそうかな。
ちなみに、赤点は、県轄市が県名と同一のものだよ。

長くなったので、次回に続く。

gooブログ與華文漢字

由於日本的gooブログ用的文字編碼是EUC-JP碼,是一種比較傳統的日文編碼,不支援日文以外的文字。因此梅與櫻的華文文章其實是在比較克難的環境下發表的。

雖然在gooブログ系統下用華文投稿有些不方便的地方,但是由於gooブログ的介面非常人性化,沒有什麼多餘累贅的東西,再加上我們沒有時間自己架一個blog系統,因此目前梅與櫻仍然會繼續使用gooブログ,當然我們並不排除將來自己弄一套blog系統的可能性 (前提是我們要有時間)。

梅與櫻到2010年年底為止,總共有1362篇文章,文字總數約為175萬字 (包含回應文字,不含HTML標籤)。由於梅與櫻當中有一半的文章是中文文章,因此當我們使用gooブログ系統的備份功能時,備份文字檔中的中文部分會出現亂碼。事實上,用「亂碼」這個詞可能會有語病,因為嚴格來說,文字檔中的看似「亂碼」的部分其實是一種十進位的「Numeric character reference」編碼 (有些人把這個詞譯作數字字元參引)。不過這裡基於方便,姑且以「亂碼」來稱呼。

從梅與櫻開站到2010年年底為止,175萬字的文字備份檔當中一共出現了14941個「亂碼」,佔總字數的0.8789%。也就是說,每114個字當中,就有一個字是gooブログ系統無法表示的文字。而這14941個「亂碼」其實是由627個文字構成。統計如下:

類別 字種個數 字種比率 出現頻度 頻度比率 全文中比率
繁體字 325 51.83% 14107 94.42% 0.8298%
誤字 56 8.93% 73 0.49% 0.0043%
簡體字 169 26.95% 471 3.15% 0.0277%
其他 77 12.28% 290 1.94% 0.0171%
合計 627 100% 14941 100% 0.8789%

從上面的表來看,繁體字造成的亂碼的字種、頻度都最高。這是因為梅與櫻當中的中文文章全部都是用繁體中文寫成的。而簡體字部分比較少,是因為簡體字只出現在極少數回應當中。從文字性質來看,其實gooブログ對繁體字的相容性比較高,這是因為繁體中文和日文漢字比較接近。而簡體中文許多文字都已經過度改造,因此和日文漢字相通性非常低。事實上,如果把上面表中的169種簡體字改寫成繁體字的話,其中155個字不會變成亂碼。

至於「誤字」指的是在輸入過程中,按錯按鍵的情況下打出來的怪字。按錯按鍵的情形大致上有兩種,一種為按錯位置,另一種為按錯順序 (打字打太快時就容易造成擊鍵順序錯誤),而這56個誤字多半是屬於後者。

至於「其他」的部分,則包含中文的注音符號、、粵語漢字、韓文、土耳其文、阿拉伯文、希臘文、特殊符號等。

我們在寫中文文章時,會遇到的另一個問題就是日文windows裡的「メモ帳」(相當於中文windows裡的「記事本」的東西) 也無法完全正確表現中文。當我們遇到這種字時,就只有盲打而已。


325種在gooブログ系統中會變成亂碼的繁體字 (文字順序照頻度排序)。由於我們在gooブログ發表中文文章時,會加上HTML標籤來防止亂碼發生,因此讀者在讀梅與櫻的中文文章中不會出現亂碼。然而,這只限於文章的正文部分而已。gooブログ系統的正文部分可以用HTML標籤來防止亂碼發生,但是標題部分沒有辦法用這招,因此我們的中文文章的標題絕對不會用上圖中的325種繁體字,因為一用的話,標題就會出現亂碼。所以梅與櫻的部分中文文章的標題其實遷就gooブログ的特性,改用英文、日文、或是異體字來防止亂碼發生。又,gooブログ的回應系統對繁體字的相容性比較部落格的文章標題寬鬆,但是仍然會有部分繁體字會變成亂碼,而且無法用HTML標籤修正,因此我們在回應文章時,儘量以相似的日文漢字來取代上圖中的繁體字。


「メモ帳」中看不見的繁體字。在第一張圖中的325種繁體字當中,有103種字是「メモ帳」上看不見的字。這些字在「メモ帳」會顯示成一個半形的黑色方格。由於我們在打中文草稿時都是在「メモ帳」上作業,因此遇到這些字時,只能靠盲打而已。雖然「メモ帳」也可以更改字形,但是一但更改字形之後,會影響到日文文章作業時的易讀性。由於這是日文windows本質的問題,因此換成其他的editor其實也無法完全解決這方面的問題 (換成word雖然可以解決文字的問題,但是這又會影響操作便利性)。因此我們就只能將就使用「メモ帳」而已。我們並不喜歡這種狀況,但是這種「黑色方格」至少是我們在決定中文文章標題或是用中文回覆留言時的用字參考指標。當我們用「メモ帳」打標題或是打留言時,如果發現畫面上出現了「黑色方格」,我們就會知道:最好用別的字來代替。


56種誤字 (文字順序照頻度排序)。這些誤字也包含部分讀者回應中的誤字。文章中出現這些字的原因並不是因為語言知識不足,而是在操作電腦過程時的疏失造成。事實上,由於打錯字這種事情不可能避免,再加上我們打出來的錯字有些根本是看不見的字,因此我們只能在文章發表後,從發表出來的文章中一一檢查。當然,帶有這張圖當中的誤字的文章已經全數修正。

打字時,打錯字的機率有多大?

其實每個人的情況都不一樣。即使是同一個人,在不同的精神狀況下,打字時的擊鍵正確率也會不一樣。個人基於興趣,從2009年3月開始,除了假日以外幾乎每天都會花十五至二十分鐘進行打字練習 (內容除了日打、英打以外,還包含鍵盤上所有的數字、符號的打字訓練)。從打字練習的結果統計來看,大約平均每四到五次擊鍵,就會發生一次誤擊。由於大部分的情況是誤擊之後會立刻修正回來,因此錯字並沒有那麼多。雖然英打和日打性質和中打的性質不太一樣,但是上面圖片中的誤字大都不是拆字或是文字知識不正確的問題,而是鍵盤的誤擊造成。因此英打和日打的擊鍵錯誤率其實多少還有一些參考價值。

台湾の賞味期限日付表示

新年があけ、この1月1日で台湾は民国100年を迎えたよ。
民国は、歴史の教科書にあるように、1911年、孫文が辛亥革命を始めてはや100年がたったということだよ。
――日本国内ではそれほど強く報道されていないから、気づいていない人もいるかもしれない。

民国は1912年から始まるわけで、民国元年=大正元年だということは、「台湾の元号」にも書いた。
つまり、明治生まれのお年寄りはもう100歳を超えるということだね。

そこで、一番気になっていたのは、食品の賞味期限表示(or製造年月日表示)はどうなるのかなということ。
2けたで表示していたものが3けたになって、都合が悪くなる事例もあるのかなと思ったんだよね。

表示を民国にするか西暦にするかについてはメーカーごとに対応が違っていて、どちらも存在している。
しかも、売り場によっては、民国、西暦表示の両方が同じような割合で混在していることもある。

下の写真の飲み物は同じシリーズなんだけど、そろってないのはなぜなんだろう……
2011年とするものと100年とするものとの両方がある。

これまでは、民国表示の方が多かった気がするから、民国だけを気にしていればよかったんだろうけど、
これからは、混在していくんだったら、両方を覚えていかないといけなさそうだね。

ちなみに、西暦と民国の換算は、厳密には1911を足したり引いたりするんだろうけど、
そこまでしなくても、11を足したり引いたりして見当つければいいよ。
西暦=民国11
西暦11=民国

日本人與粥

對台灣人而言,粥是一種非常普通的食物。台灣很多夜市裡都有廣東粥的攤位,當過兵的台灣人對部隊早餐的印象不外乎是稀飯和饅頭,台灣的許多飯店旅館提供的早餐多半也有粥類。有時候白飯吃膩了,偶爾煮一鍋粥來吃,對台灣人而言一點都不奇怪。在台灣人眼中,稀飯是極為常見、非常普通的主食。

日本雖然也是米食文化圈,不過日本人不像台灣人那麼常吃稀飯。恐怕有不少日本人一輩子當中,吃稀飯的機會可能比吃牛排的機會少。到日本旅行過的台灣人在日本旅館吃早餐時,早餐內容不外乎是白飯、味噌湯、納豆、烤魚,就是沒有稀飯。

日本人對稀飯的印象是生病時才吃的食物。如果某個日本人家中有人生病的話,家人就會煮稀飯給生病的人吃,而且稀飯也就只是給生病的人吃而已,其他健康的人用餐時可能還是都吃白飯,就只有生病的人一個人吃稀飯而已。當然,如果有人很少生病的話,可能就沒什麼機會吃到稀飯了。因此日本人吃稀飯的機會少於吃牛排的機會一點都不誇張。

雖然日本人很少吃稀飯,不過在日本的超級市場中仍然買得到稀飯類的商品,只是這些商品不能算是主流商品而已。

每年一月初,日本許多超市都會販賣一種叫作「七草粥」的商品,「七草粥」是一月七日的應景食品。事實上,一月七日 (人日) 吃七草粥其實是受到古代中原文化的影響所留下來的習慣。華人世界的「人日」本來是指農曆的一月七日,不過由於日本把新年改在陽曆一月一日慶祝之後,也把「人日」一同搬到陽曆的一月七日。因此日本許多超市才會在一月七日之前促銷「七草粥」。


七草粥的七草。

編號 日文名稱 中文名稱
水芹
御形 鼠鞠草
繁縷 繁縷
仏の座 稻槎菜
蘿蔔 蘿蔔
蕪菁

※表中的日文名稱是日本商家販賣七草粥時所用的傳統名稱,而非一般名稱。

七草粥雖然說是應景用的食品,但是和聖誕節的蛋糕或是新年的年糕、蒲鉾、伊達巻相比,七草粥的能見度其實很低。

◆◆◆


七草粥。當稀飯煮得差不多的時候,加入切碎的七草,再加一點鹽,七草粥就完成了。一般日本人在煮七草粥時頂多就只是加了一些鹽而已,所以七草粥的味道非常單調,不如用高湯煮出來的稀飯那麼好吃。


另一種七草粥。這張照片中的七草粥用調理包製成的七草粥。每年一月初,如果日本的超市設有七草粥的販賣區的話,這個販賣區除了會賣真正的七草植物,也會賣七草粥的調理包。而調理包其實也就是像速食麵裡面附的脫水蔬菜。當稀飯煮好之後,把調理包中的脫水七草拌入稀飯中即可。當然,口感也非常單調。


お茶漬け式 (茶泡飯) 七草粥。每年一月初,日本的超市中除了賣真的七草植物,以及簡易的七草粥調理包以外,也會賣茶泡飯(お茶漬け)的七草粥食品。因為茶泡飯的調理包已經不是純粹的七草粥,佐料中還加入了其他成分,所以口味會比上述的兩種七草粥好吃。然而茶泡飯能否算是稀飯,本身就是個問題。

當一月七日一過,日本的超市就會立刻撤掉七草粥的商品區。事實上,七草當中,日本人比較熟悉的東西只有水芹、蘿蔔和蕪菁而己,其他四種菜平常不太容易見到。再加上七草粥是能見度比較低的應景食品,所以很多日本人可能根本就沒吃過這種東西。日本人之所以會知道七草,是因為日本高校的國語課會學到這些東西。

日本人受到古代中原文化的影響,一月七日吃七草粥,一月十五則吃小豆粥。日本的小豆就是紅豆。而小豆粥則是紅豆稀飯。嚴格來說,小豆粥也可以算是一種特定時期的應景食品,不過並沒有像七草粥那麼特別。


日本的小豆粥。台灣人眼中的紅豆稀飯是好吃的甜點,不過日本人眼中的小豆粥就只是加了紅豆的稀飯而已,裡面只加了少許的鹽,沒有糖。也就是說,在日本人的印象中,小豆粥 (紅豆稀飯) 不是甜的。這種情形就和日本的赤飯非常類似 (※關於紅豆飯,可以參考本站的「日本的赤飯」這篇文章)。

那麼,日本人真的不吃稀飯嗎?

其實日本的關西地方還是有吃稀飯的文化,甚至有些商家早上也有提供稀飯類的食品。不過這只能算是日本的地域文化,整體而言,日本人並不像台灣人那麼常吃稀飯。

註:
日本人覺得稀飯是給病人吃的食物,這是因為日本人認為稀飯容易消化。不過食物是否容易消化,除了食物形態、成分以外,也會受到消化系統的酵素影響。由於吃稀飯時不太需要咀嚼,所以多少會影響消化液的分泌量。因此稀飯是不是真的容易消化,其實還有很多變因。

相關文章連結:
日本的雜煮與雜炊