自動翻譯機的浪漫(2)

最近幾年,日本常常有關於今後10~20年間可能會消失的職業的話題。由於現在AI技術越來越進步,所以將來電腦有可能取代很多現存的職業。例如自動駕駛技術成熟後,電腦就可能取代鐵路和公路的車輛駕駛的工作。另外,電腦可以在一瞬間處理非常複雜的計算,而且幾乎不會出錯,所以銀行的業務員也可能被電腦取代。

這一類預測「可能會消失的職業」的報導非常多,每篇報導提到的職業都大同小異。這些「可能會消失的職業」的共通特徵就是「照著規則形式化作業」。

最近,有一部分報導把「翻譯」也列入「可能會消失的職業」。其實不只是媒體報導,有幾位我有在關注的日本社會評論家也認為今後「翻譯」這門工作可能會被電腦取代。他們的立論根據是AI技術越來越進步,IT企業可以透過網路蒐集龐大的文字資料,也可以透過聲控服務蒐集人類的語音資料。有了這些巨大資料,電腦在不久的將來就可以理解人類的語言,哆啦A夢的翻譯蒟蒻不再是想像中的工具。

翻譯時不找專業的翻譯人員,直接用電腦自動翻譯。其實這不能算預測,因為是現實中早就存在的事實,而且是十年前就已經是事實了。至於「電腦在不久的將來可以理解人類的語言」,則只是一部分媒體和評論家的浪漫的想像而已。

我在2008年曾經寫過《自動翻譯機的浪漫》及《翻譯軟體的能力極限》兩篇文章,提到電腦的自動翻譯有很多缺陷。不過當時已經有很多人在用電腦的自動翻譯,儘管當時電腦翻出來的內容多半不像句子。

2018年的現在,電腦自動翻譯的品質明顯比10年前進步。10年前的自動翻譯翻出來的結果不像句子,現在的自動翻譯翻出來的結果比較像句子。不過電腦翻譯的基本原理還是和10年前一樣,就只是詞彙轉換和句子重組。只是以前的電腦是用文法規則來組句子,現在的電腦是參考大量語言範例來組句子。

由於目前這個世界上還沒有人想得出讓電腦理解人類語言的方法,所以開發翻譯系統的人做的不是讓電腦理解人類語言,而是用統計學的技術讓電腦參考大量例句,把轉換後的詞彙拼湊成比較自然的句子。所以現在電腦翻出來的句子比以前自然。不過詞彙轉換過程中必然會失真,如果原文夾帶了任何模糊語氣或暗示的話,翻譯的精度會更低。所以現在的電腦翻譯出來的句子的等級還是「僅供參考」。

今後20年,這個世界上恐怕還是造不出優質的自動翻譯系統。

2011年,日本的國立情報學研究所曾經推動了一個用AI技術讓電腦挑戰日本的大學入學考試的研究計畫。計畫的主題是「機器人進得了東大嗎」。具體而言就是動用目前最新的技術讓電腦去考大學入學考試的摸擬考。考試的方法是把模擬考題的資料輸入電腦,讓電腦回答,然後和其他參加模擬考的高中生比成績,推算出電腦大概可以考上什麼學校。

這個計畫動員了上百名專業人士。一半是大學的學者和研究生,一半是民間企業的研究員。這個計畫本來是10年計畫,不過做了5年就中止了。因為大家得到結論,確定目前最先進的技術無法讓電腦考上東大。再多做5年也不會變。

電腦參加大學入學考試的一大難關是電腦無法理解考題內容。技術人員要做的是教電腦從考題的文字種類及排列組合特徵來推論「考題可能在問什麼」,然後讓電腦湊答案。舉例來說,負責數學科的技術人員是研究數學考題的文字特徵,分類成幾何代數型、統計型、數列型考題,然後讓電腦從題目中的數字來湊出可能的答案。負責歷史科的技術人員則是讓電腦從考題的各選項的關鍵詞分析出題目可能的形態,然後再比對題目的特徵,把相關性最高的選項當作答案。只從關鍵詞來推論考題內容非常不容易,不過技術人員還是找到了高精度的推論方法,讓電腦在數學和歷史科得了高分。不過這種技術只適用於「日本的大學入學考試中的敘述比較形式化的考題」而已。國語和英語科的閱讀型考題的文章沒有固定的形式,無法從關鍵詞推論考題內容,而且閱讀測驗無法用計算或形式化的知識解題,所以電腦得不了高分。

日本的大學入學考試的國語科閱讀測驗的形式是讓考生看一篇文章。文章裡有幾段話的旁邊有畫線。考題就是問這幾段話的意義,然後讓考生四選一或五選一。由於電腦無法理解文章的意義,而且技術人員找不到有效的解題方法,所以最後負責國語科的技術人員是用計算文字量的方式讓電腦猜答案。具體而言就是計算文章中畫線句子中的文字種類及數量,以及該句子前一個段落中的文字種類及數量,當作參考基準。然後再計算各選項中的文字種類及數量,和參考基準比較。作答時就是讓電腦選和數值最接近參考基準的選項。這種解題方法實質上和占卜差不多。不過這一招讓電腦的猜答案的正確率達到五成。這個方法是技術團隊試過的所有方法中得分最高的方法。不過因為本質上是猜答案,所以不論怎麼改良,成績永遠停留在猜答案的水準。

英語科考試中,英語科的技術人員一開始是給電腦3300萬個英文例句資料。電腦在練習考古題時,英文句子重組問題的答題正確率達到八成。不過實際考摸擬考時,由於題目加了一點變化,電腦無法應付,結果三題中只答對一題。正確率掉到三成三。之後,技術人員把英文例句資料加到19億個,這時候電腦才能答對大部分的英文句子重組問題。也就是說,19億個英文句子的範例資料可以讓電腦造出比較正常的句子。不過遇到英文會話測驗時,電腦的答題正確率就落到四成。後來技術人員又把英文例句資料提升到150億個,還讓電腦深層學習,狀況還是沒有明顯改善。研究團隊證明了巨大資料和深層學習在處理語言資料時並非萬能,無法讓電腦理解語言的意義。

這個計畫在推動當初,曾經有某個單位想贊助超級電腦。不過這個計畫的技術團隊本身有很多頂尖的電腦專家,他們知道超級電腦不是萬能的工具。技術團隊用的伺服器如果遇到解不開的考題的話,就算改用超級電腦,還是一樣解不開。所以電腦在答題時沒有動用超級電腦。

「機器人進得了東大嗎」的研究團隊在計畫的第5年就確信現在的最新AI技術無法讓電腦考上東大。這不是失敗,而是成功。因為參加這個計畫的所有工作人員從一開始就不認為現在的最新AI技術能讓電腦考上東大。這個計畫的本質只是想確認目前最新的AI技術能讓電腦在日本的大學入學考試考到什麼水準。

雖然電腦考不上東大,而且目前的技術再發展二十年可能還是無法讓電腦考上東大,不過「機器人進得了東大嗎」的計畫中止時,電腦的成績有達到日本的中堅層大學的入學水準。

在計畫中止前,日本的媒體在報導相關消息時,幾乎全部都是在談AI技術非常先進,先進到準備要挑戰東大。研究團隊發表電腦的考試結果時,媒體則輕描淡寫提到電腦還不擅長閱讀測驗。這種報導讓不少日本大眾誤解了現實的AI技術。結果一些媒體和社會評論家誤以為過幾年AI技術可能會克服問題,電腦的翻譯會越來越精確。

其實真正的事實不是「電腦還不擅長閱讀測驗」,而是目前電腦根本無法理解人類的語言。

翻譯是把某種語言表達的內容轉換成另一種語言,而且在轉換過程中要努力不讓意義失真,要儘可能讓接收意義的人能理解發話者的原意。所以從事翻譯工作最基本的條件是理解語言、理解意義,而且要能妥善表達。

由於電腦無法理解人類的語言,所以電腦在翻譯時根本不知道原文的意義,當然也不知道翻譯出來的句子的意義,而且在兩種語言的詞彙轉換過程中一定會發生失真。不過現實中,很多從事翻譯的人其實對外語一知半解,自己的母語表達也一塌糊塗。舉例來說,台灣很多翻譯書中雖然印的是中文,不過句子根本不像句子,譯者本身可能也沒讀懂原文。而且這樣的書還不少,而且遍及娛樂、文學、學術領域。拿這些翻譯書和10年前的電腦翻譯的句子相比,水準其實不會差太多。由於現在的電腦翻出來的句子比較像句子,所以那些沒看懂原文,而且連自己的母語都無法適切表達的翻譯人員就有可能被電腦取代。因為電腦造出來的句子看起來比較正常。

如果想做翻譯工作,又不想輸給電腦,方法其實很單純。就是把自己的母語及外語學好,要能確實看懂或聽懂外語的資訊,然後要能清楚適切地表達意思。

今後幾十年,在語言理解領域,人類只要努力還是可以贏過電腦。不過翻譯業界還是會被電腦侵蝕。因為很多人不知道電腦無法理解人類的語言。很多人以為電腦翻譯是電腦萬能,能理解人類語言的結果。這種大眾觀念就可能讓電腦取代人類。

以日本為例,現在日本很多店家為了吸引外國人觀光客消費,有準備各種外語標示。不過大部分的外語標示是由電腦自動翻譯。因為店家覺得這種事情交給萬能的電腦就可以了,而且不用花錢。雖然現在電腦自動翻譯的結果比較像句子,不過大前題是原文必須清楚完整。很多店家設計標示時用的原文可能是過度省略的日語口語,由於結構不完整,電腦當然翻不出像樣的內容。就算標示內容是完整的文章,如果原文寫得太爛,或是用了一堆非常偏門的專業術語,電腦還是會翻得一塌糊塗。有不少到日本觀光的台灣人可能曾經在很多地方看過一堆莫名其妙的中文標示,這就是日本人把自己平常用的母語丟給電腦翻譯的結果。這反映了很多日本人連自己的母語都無法妥善表達。

無法妥善表達自己的語言,並不是日本獨有的問題。台灣的狀況恐怕更嚴重。在日本,網路上還可以找得到很多解析日語的資訊。例如把一些比較難懂的文章或法律條文地解析成易懂、明確的日常日語。這表示還有不少日本人關心自己的語言,也關心自己國家的法律制度。台灣的網路上很難找到這一類的資訊。台灣的網路上雖然找得到古文翻譯成白話文的資訊,但是沒有人知道這些翻譯文的根據,也沒有人知道這是誰翻的。台灣的網路上雖然有人討論法律,但是幾乎所有的討論都只是轉貼條文,然後直接下結論,沒有人去分析法律條文用詞設計的邏輯考量。這反映了台灣人不太關心自己使用的語言。不關心語言的人恐怕也不會去思考怎麼妥當表達自己的語言。這形同把人類還能勝過電腦的能力放棄了。

目前日本的總務省的情報通信研究機構正在開發多語言翻譯系統,想在東京奧運時發揮功能。「機器人進得了東大嗎」的計畫主持人新井紀子曾經有一段期間擔任過這個計畫的顧問。新井紀子指出,開發新的多語言翻譯系統的關鍵不是系統的演算法,而是翻譯例句的資料量。現在的演算法不論怎麼改良,都不會有大的突破。不過如果翻譯例句的資料量夠大,翻譯品質會明顯不同。如果只給電腦100萬組例句資料,翻譯的品質會很糟。如果翻譯例句超過1000萬組,電腦就有可能造出「比較正常」的句子。

一般人學外語時,如果要造出像樣的句子,其實學不到100個外語例句就可能達成。如果能確實吸收1000個外語例句,外語能力會相當好。不過電腦要學1000萬組以上的例句才能造出比較像樣的句子。從這裡可以看出人腦和電腦的學習能力的落差。

日本政府的多語言翻譯系統計畫最大的問題是沒有人知道要從哪裡生出1000萬組的多語言翻譯例句的學習資料。如果動員大量外語班學生和正在學外語的志工來製作資料,然後用網路回收,是有可能生出1000萬組例句資料。不過管理過程要花大錢。而且如果當中有人提供的資料有誤,或是有人故意惡作劇的話,電腦的學習資料就會被汙染。電腦一但吸收了被汙染的資料,錯誤內容就永遠變成電腦的知識的一部分。

日本的通產省在1982年曾經推動第五代電腦的開發計畫,想造出能思考、能正確翻譯的電腦。不過由於人類的數學無法重現人腦活動,所以這個自動翻譯機的浪漫計畫最後失敗。而且政府內沒有人敢提這件事,就連事後的失敗研究報告資料也找不到。現在總務省推動的多語言翻譯系統也是相當浪漫的計畫,不過巨大資料和深層學習並非萬能,而且製作深層學習用的巨大資料要花很多時間和勞力,所以想搶在東京奧運前實用化的多語言自動翻譯系統恐怕也只是一種浪漫的嘗試。

日語的髒話

※每個人對髒話的定義可能都不一樣。這裡的髒話是指粗俗、不堪入耳的話。

很多人在學外語時會想知道外語的髒話怎麼講,不過大部分的外語教材不會寫這些東西,外語老師也不會教學生這方面的詞彙。結果大部分的外語髒話知識是來自各種瑣碎的管道。

我學的第一個外語髒話是來自我小時候看的電影。當時電影裡的日本兵在罵人時,字幕是寫「八格野鹿」。我小時候當然不懂日文,只是大家說「八格野鹿」是日本的髒話,所以我就相信了。「八格野鹿」這個詞在台灣非常有名。因為這是知名小說家的作品中的日本人的台詞,之後被其他作品借用。我小時候看的電影的編劇人員恐怕也有受到小說的影響。

後來,我學了日文後,才知道「八格野鹿」在日本其實是寫作「馬鹿野郎」,而且這個詞的用法也比我想像中要複雜。

「馬鹿野郎」是由「馬鹿」和「野郎」兩個詞組合成。

日語的「馬鹿」當作名詞時是指笨蛋,當形容詞時是指笨。日本人一聽到「馬鹿」這個詞時,就會直接聯想到「笨」。但是現實的日語中,「馬鹿」的意思不只一種。

「馬鹿」的使用時機非常廣,主要包括:
辱罵人時。
提醒人、糾正人時。
對某人失望時。
自謔、自謙時。
狀況出乎意料時。
小孩惡作劇、鬥嘴時。
覺得某人很可愛時。
情侶間打情罵俏時。
(※西日本的人通常不說「馬鹿」,上述的狀況多半是說「阿呆」)

除了上述狀況以外,東西壞掉(多半是機器)的狀態、沒有意義的發言或行為也可以叫「馬鹿」。

結果很多狀況下,「馬鹿」不是真的指「笨」,也未必有攻擊性。而且使用對象未必是人。如果使用時機不當,詞彙的效果就會大打折扣。舉例來說,如果在網路上惡作劇,對日本人用「馬鹿」這個詞時,日本人的反應可能不是生氣,而是覺得莫名其妙。

日語的「野郎」本來的意思是指男人,而且多半是指有男子氣概的人。美國電視影集《The A-Team》(天龍特攻隊)在日本播出時的標題叫《特攻野郎Aチーム》,《MacGyver》(百戰天龍)則叫《冒険野郎マクガイバー》。日本觀眾一看到這樣的標題,就可以想像這些影集是在講男子漢故事。

在罵人的時候,「野郎」就會變成攻擊性的詞彙。意思相當於中文的「傢伙」「混蛋」。

日本的網友在聊天時如果發現對方是男的,也可能會用「野郎」這個詞。這種情況下的「野郎」沒有罵人的意思,就只是指「男的」。這種「野郎」也沒有男子漢的意思,就只是網路對話的粗俗用詞表現而已。

結果日語的「野郎」這個詞的意思也會隨使用場合發生變化。

日語的「馬鹿野郎」是「馬鹿」和「野郎」這兩個可以用來罵人的詞彙組合成的加強版罵人詞彙。「馬鹿野郎」是非常生氣的時候說的話。日本人如果聽到有人用這個詞罵人,就可以想像說這句話的人非常非常生氣。結果「馬鹿野郎」實質上是對人表達憤怒、表達不滿的攻擊詞彙。意思和「馬鹿」、「野郎」原來的意思無關了。這種感覺就像是台灣人非常生氣時,可能飆出一字經。這個「一字經」已經和本來字面的意思不同了。

由於「馬鹿野郎」是非常生氣時才說的話,而且非常粗俗、不堪入耳,所以現實中的日本其實不太容易聽到有人用這個詞罵人。不過日本的自衛隊、警察、消防、學徒制行業或運動社團等男性為主的上下關係嚴厲的組織中,高層的人在管教低層的人時常常會用罵的。所以在這些比較特別的圈子可能比較常用到「馬鹿野郎」。

「馬鹿野郎」除了用來罵人以外,也可能是粗人的口頭禪。例如日本電影《男はつらいよ》(男人真命苦)中的寅次郎說話時就常常飆出「馬鹿野郎」。寅次郎是個老粗,所以滿口粗話。寅次郎說「馬鹿野郎」時未必在生氣,多半只是反駁別人,要別人聽一下他的意見。寅次郎的「馬鹿野郎」相當於台灣人說的「屁啦」「媽啦」。

日本的卡通人物江戶川柯南也有類似「馬鹿野郎」的口頭禪。由於「馬鹿野郎」實在太粗俗,所以柯南會講得比較輕,來減少這個詞的殺傷力。柯南口中的「馬鹿野郎」因為講得不重,所以「鹿」和「野」的子音消失,變成「馬~郎」。柯南的目的也是要別人聽一下他的意見,表達方式雖然沒有寅次郎那麼重,但是還是相當不禮貌。

在日本,有一句話叫「青春の馬鹿野郎」。這句話中的「馬鹿野郎」也沒有罵人的意思,而是指不吐不快的吶喊。所以「青春の馬鹿野郎」的意思相當於「青春的吶喊」。

從這些例子來看,日語的「馬鹿野郎」的意思非常多,未必是攻擊別人的詞彙。

我高中時代的補習班英文老師曾經說:人到國外時,最先學的是實用的單字。由於髒字可以自衛,所以很多人最先學到的是髒字。

英文老師的這段話讓我印象深刻,不過狀況並沒有發生在我身上。我到日本留學之前,日文已經有一點基礎。我到日本時最先學到的也不是髒字,我在日本生活中幾乎也用不到髒字,因為不實用。外國人在日本社會就算不會講髒話,也不會有不利的狀況。

「馬鹿野郎」這個詞,我在日本只用過一兩次而已。使用對象是和我非常要好的韓國人留學生。我說「馬鹿野郎」時沒有帶任何敵意,就只是呼應友人誇張的搞笑行為而已。結果「馬鹿野郎」在某些情況不但沒有攻擊性,還可以增進友誼。

日語的「馬鹿野郎」雖然可以當成罵人的話,而且是不堪入耳的髒話。但是這只是「馬鹿野郎」種種用法當中的一種而已。現在日本的廣播及電視的倫理規範非常嚴,很多詞彙不能在節目中出現。如果有人在節目中不小心說了禁用的詞彙,媒體要向社會道歉。「馬鹿野郎」雖然可以當成不堪入耳的髒話,但是日本的媒體沒有禁用這個詞,就連卡通也可能出現這個詞。如果媒體禁用「馬鹿野郎」的話,很多創作表現會受到限制,電視也很難表現人物生氣的狀況了。

日本の中国語表示(繁体字と簡体字) その7

このシリーズは前回で終わっていたはずだったんだけど、
正体字(正體字)という言い方のことについてすっかり書き忘れていたね……。

このブログでは台湾の文字は繁体字というふうに言ってみているんだけど、
台湾の漢字の言い方にはバリエーションがあって、
教育部は台湾の漢字は標準字とか言っていたり、そして正体字という言い方もあったりする。

台湾の文字は正体字であるべきという考え方は結構前に打ち出されていたものではあったんだけど、
ただ、実際のところ、正体字とは簡体字ではない何かという以外、よくわからないものだった。
それが、馬英九が台北市長だったときに、正体字に定義づけを行う政治キャンペーンをしたこともあって、
目下のところ、台湾の中国語の漢字を正体字というふうに言う言い方がされている。
確かに台湾の役所のサイトでは「正體中文」という言い方をされていたりする。
ウィキペディアでも、「台湾正體」とかなっているのは、その影響?
中国語のウィキペディアを台湾人に見やすくする」も見てね。

じゃあ、我々は台湾の総統の意向に合わせて正体字と言うべきなのかというと、そこまでこの政治キャンペーンが盛り上がっているかどうかの判断も必要な気もしている。
目下の情勢の中では、例えば何か大きな国際漢字大会があって、そこで漢字の言い方が採択されたということでもない限り、
日本にいる我々は、台湾の漢字をどう言うかについてまで深い関心を寄せなくてもいいと思うわけで、
いずれにしても、日本国内で台湾&香港人向けの中国語パンフレットの漢字字体は「繁体中文」でいいと思う。

ただ、もし、台湾の役所向けに文書をつくって提出する場合には、政治的なものを意識して、「繁體字」ではなくて「正體字」と書いた方がいいと思う。
実際に、「繁體字」と印刷してお役所に出したら刷り直しになったという話を聞いたことがあったのを思い出したので、これをおまけとして書き足しておくね。

台湾の押す表現

以前、「台湾の火災報知器のボタンの文字」には「強押」とか書いてあるというのを紹介したんだけど、
「押」の文字があるのはそれだけではなくて、例えば、扉の間のボタンを押さないとあかない自動ドアとかにも、「押」という文字が出ている。
 

こういうのを見て、ああ、中国語でも「押す」は「押」なんだなとか思ったりするんだけど、
実際のところ、自動ドアではない扉には何と出ているかというと「推」だよね。

中国語では、「押」は物理的に押すことよりも、何か強制的に巻き上げる的な表現
日本語で言うところの押収とか押領とか、その種の意味づけで使うことが多い漢字だよ。
例えば、デポジットとかは「押金」とか言うよね。

ということで、プッシュを素直に訳せば「押」じゃなくて「推」なんじゃないかと思う。
ただ、「推」というと何か重いものを両手で押している感じもしていて、自動ドアのそれはそこまで押すのに加重があるわけでもない。
じゃあ、実際に何を使うべきなのかというと、「按」「壓」がいいのかもしれない。
確かに、火災報知器のボタンにも「壓」を使っているのもあった。
マウスをクリックするのは「按」とか「點」を使うみたい。

だったら、なぜ「押」を使うんだろうかというところが不思議なのだが、
火災報知器や自動ドアの外観形状を見る限り、日本のものを漢字もろともそのまま使っているのだけ?、それが社会的に認知されている?という気がする。

ちなみに、押すは「推」だけど、引くは「拉」だよ。

台湾人名のアルファベットのつづり その2

前回、台湾人名のアルファベットは、中国語を勉強する日本人が知っている名前とは違っていて、
ウェード式のつづりを使っているのかもという想像力が必要と書いたんだよね。

ちょっと写真が古過ぎるんだけど――
日本でアジアシリーズをやっていたころの台湾人の名前は、こんな感じだった。
 
HSUさんは、許さんだろうけど、XUじゃない、
KAOさんは、高さんだろうけど、GAOじゃない、
KUOさんは、郭さんだろうけど、GUOじゃない、
荘景賀さんも、どうしてそのつづりなのか、ちょっとよくわからない。

さて、ウェード式をどうやって調べるかだけど、
まず、中国語を熟知している人であれば、
台湾外交部のサイトに「護照外文姓名拼音對照表」があるので、これで逐一探していくとか、
外交部の外文姓名中譯英系統の(単漢字3文字まで)(100字以下)という
繁体字とウェード式等各種つづりとの変換ツールのようなものもある。

私のを変換すると、こんなふうになるよ。

「威妥瑪」が、ウェード式。
「漢語拼音」が、中国のと同じつづり。
ここにはあと2つあるけど、アルファベットのつづりにはそのほか幾つものバージョンがある。
いずれにしても、パスポートのアルファベットのつづりについては、台湾については、こういう参考例をもとに選んでいいようだ。

ところで、台湾人の名前は、姓の後にカンマ、名前が複数のときにはハイフンが入るのが正しいよね。
ただ、パスポートの表記どおりに航空会社のサイトに入力してもはねられたのはどういうことなんだろうなと思う。
JALもANAもなんだけどさ、多分ほかのサイトもなんだろうけど、
パスポートどおりの名前の表記ということでハイフン入れると、はねられちゃうの?

ハイフンを外して入力するというのは、常識なのかな……

台湾の野球選手の名前に関連して、「台湾人男性の名前の傾向を見る」というのもつくったことがあるので、見てね。
スペル以外での、名前の並べ方については、「台湾人の名前のピンインの並べ方」も見てね。

台湾人名のアルファベットのつづり その1

例えば、中国人と台湾人がまざっている名簿をつくるとする。
こういうのでまず難儀するのは、漢字圏の人たちの漢字の達筆ぶりというか、書き方が合理的過ぎて?下手過ぎて?解読不能というのがあるんだけど、それはさておき……
何とか漢字の入力ができ、日本語読みの振り仮名をつければ完成するよね。
これだけじゃなくて、現地読みの振り仮名やアルファベットのつづりを入れたものをつくりたいなどと思うこともあるかもしれない。
現地読みというのは、一般的に日本人が考える北京語、国語、華語の領域でしかないんだけど、ひとまずそれで、名前のアルファベットのつづりを名簿に入れ込みたいとする。

そういうときは、ネット上にある変換ツールを使うと楽かもしれない。
読み仮名については、「繁体字 片仮名 変換」などでググれば、出てくるし、
アルファベットのつづりについても、「繁体字 ピンイン 変換」などとググれば、出てくる。

「ピンイン」というのは中国語(漢字)のアルファベットの振り仮名のようなもの。漢字で書くと「拼音」だけど、日本語入力環境ですぐに変換して出てこない漢字なので、よく片仮名で表記される。
キーワードを「繁体字」としているのは、日本語の漢字をそのまま変換ツールにぶち込んでピンインに変換できる可能性が高いから。
なお、ツールにぶち込んでうまく反応しないようだったら、日本語の旧字を入力して試したり、別途繁体字の字体を探す必要が出てくる。

上記のような変換ツールだけど、例えば「どんと来い、中国語」というサイトを使ってやってみるね。
 
出典:中国語カタカナ変換及び繁体字ピンイン変換どんと来い、中国語

こういう変換ツールを使えば、相当たやすく中国語の現地読みのリストをつくれるよね。

これで少なくとも、中国人分については完成と言えるんだけど――
台湾人の人名については、変換ツールで出たものとは違うつづり方をするかもしれないと思った方がいいと思う。

台湾人の人名のアルファベットのつづり方は、伝統的には「ウェード式」が選ばれ、ピンインではないんだよね。
例えば、高学歴な台湾人であれば、学術の分野で英語論文を読んだりして、
そこに出てくる台湾人研究者の名前のつづりにウェード式が多いなと気づくこともあるかもしれない。

台湾人名のアルファベットのつづりというのは、台湾国内にいる限りはそれほど必要ではないので、
実際に悩みに直面するのは、パスポートをつくるときだと思う。

台湾政府は、2008年末のお達し以降、名前のアルファベットのつづりは「漢語拼音」を使うことを奨励していたりするんだけど、
実際には、台湾人名のアルファベットのつづりは、何通りかのつづり方式から選ぶことができることになっている。
だから、自分の人名のアルファベットのつづりをどうしようと困ってしまい、ネット上でもその手の相談の書き込みが存在したりする。

ただ、旅行代理店にパスポート申請をお願いすると、旅行代理店はウェード式で申請したりするようだし、
中国人の名前だと思われたくない人がウェード式を選ぶということもなどもある。

ということで、台湾人名のアルファベットのつづりについては、最終的には、本人につづくり確認するにしても、
我々としては、それなりの類推や機転をきかせて、台湾人の名前のアルファベットのつづりはウェード式かもしれないということを想定した名簿づくりをしたいものだよね。

ちょっと長過ぎるので、次回に続く。

台湾人とイングリッシュネームも見てね。

日文的加油打氣的表現(2)

講到日文的加油打氣的表現,稍微懂一點日文的人可能會想到這幾種表現:
がんばれ
がんばって
がんばってください

這些表現都是動詞【がんばる】的變化形。日本人在幫別人加油打氣時,經常會用到這些表現。

雖然這些例句是加油打氣的表現,但是這些例句是幫別人加油打氣的句子,不是用來鼓勵自己的句子。

有些正在準備重要考試的學生,可能想要找一些句子來鼓勵自己,幫自己加油打氣。在這種場合,用上面的例句會非常奇怪。日本人不會用這些句子鼓勵自己。

如果自己要加油的話,日本人會怎麼說呢?

如果是單純自己說給自己聽的話,可以說がんばろう。(意向形)
如果是在大家面前宣示的話,可以說がんばるがんばります

自己一個人自言自語がんばろう,是不折不扣的鼓勵自己。至於がんばるがんばります,並不是鼓勵的話,而是向別人承諾自己會努力。

日本學生在準備考試時,會用什麼樣的句子來自我鼓勵呢?

其實每個人的做法都不一樣。而且不是每個人都喜歡用語言或文字來鼓勵自己。

有些人可能是用實際行動來鼓勵自己。例如有些人在準備考試時,如果準備到一個目標,可能會吃一頓大餐,或是看一場電影,或是買自己喜歡的東西,來調整自己的心情。

有些喜歡看日本漫畫或是戲劇的人,可能在某些作品中看到準備考試的日本學生在自己房間牆上貼著毛筆寫的「必勝」標語,或是在頭上綁著「必勝」頭巾。漫畫和戲劇中的情節其實多半是象徵性的「表演」。這種表演是為了讓觀眾一看就懂。這種表現不見得寫實。

現實中的日本學生在準備考試時,在自己房間牆上貼「必勝」標語,或是在頭上綁「必勝」頭巾,其實並不奇怪。只是並不是所有的人都會這麼做,會這麼做的人甚至可能是少數,而且這些人也可能受到漫畫或是戲劇的影響。

雖然並不是每個日本學生在準備考試時,都會用到「必勝」標語,但是「必勝」的確可以算是日本人用來激勵自己的標語。不過要留意的是,「必勝」只是標語而已,標語是用眼睛看的東西,不是用嘴巴說的東西。

除了「必勝」以外,日本人在準備考試時可能會用到的標語還可能會用到「合格」或「絕對合格」。如果考生有明確的目標,可能會用「○大合格」或是「○○試験合格」。同樣地,這些標語是用眼睛看的東西,不是用嘴巴說的東西。

日本的觀光景點附近通常會一些賣日本風格禮品的商店。日本人用的「必勝」頭巾其實可以在這些雜貨店中買到。除了「必勝」頭巾以外,還有「合格」頭巾或是「絕對合格」頭巾。在日本人眼中,「必勝」頭巾其實是小孩子的玩具。在別人面前綁這種頭巾會很丟臉。結果頭巾頂多就只是用來當作開同樂會時的遊戲道具。會花錢買頭巾的反而是外國人觀光客。

「必勝」、「合格」、「絕對合格」是日本學生在準備考試時,比較可能用到的自我激勵的標語。如果把「必勝」、「合格」、「絕對合格」這三種標語和「がんばろう」比較的話,漢字詞彙的標語比較適合貼在牆上。因為假名標語看起來比較幼稚。

當然,漢字詞彙的標語並不是只有這三種。日本人也會自己發明標語。只是真的會刻意在自己房間牆上貼標語激勵自己的人並不多,所以自已發明標語的人只會更少而已。不過在日本職棒比賽中,還是可以看到不少球迷高舉一些自創的加油打氣的標語來鼓勵自己喜歡的選手。

現實中,日本學生如果希望自己考試順利的話,一般人多半是去神社佛寺參拜,然後買合格御守,然後寫繪馬。不過日本的考生在寫繪馬時,並不是寫鼓勵自己的話,而是寫自己的願望。

◆◆◆

以下是題外話。

每個人在面對困境時,多少會想要鼓勵自己。這是很健康的想法。恐怕有不少網友很想找【用日文鼓勵自己的話】,所以點入了本站。

為什麼用【日文】來鼓勵自己呢?原因很多。

以學生為例的話,很多學生平常看的中文,是課本上的文字、考卷上的文字。看到這些字,只會有壓力而已。除了課本和考卷以外,在報紙上、電視上也可以看到一堆中文。不過很多人可能覺得華文媒體非常噁爛,所以對華文報紙和電視上的文字充滿反感。

另一方面,恐怕有不少人在看日本的動漫畫作品時,深受感動。對不少人而言,這些日本作品是很重要的精神支柱。所以想找【鼓勵自己的日文句子】,一點也不奇怪。這很正常。

不過在網路上找【鼓勵自己的日文句子】,方向其實不正確。

以本站為例的話,很多人為了找【鼓勵自己的日文句子】,結果點入了本站。如果本站列出日文句子的話,可能會有幾百甚至上千人用本站列出的句子。幾百人甚至上千人一窩蜂用同一個句子,只會讓句子變庸俗而己。

這裡建議想要找【鼓勵自己的日文句子】的人,到自己家附近賣日文原文書的書店,買幾本自己喜歡的日文原文勵志漫畫,用自己的閱讀感性,從漫畫中找。手續有點麻煩,而且要花錢,但是方法比較確實。這樣子一定可以找到屬於自己一個人的獨一無二的【鼓勵自己的日文句子】。

人生的當中,遇到困境的機會很多,找到屬於自己一個人的獨一無二的【鼓勵自己的日文句子】,可以受用很多年。

「意外」という事故の言葉

日本語の文脈で使い得ないときに「意外」が出てくることがある。
以前、日本語を勉強している台湾人に「意外があった」というふうに言われて、
「意外」に思うことがあったというけど、どういう意外なことがあったのか――と質問し返したことがあったんだよね。

ここでの「意外」(yi4wai4)というのは、名詞として使われているもので、
思いがけなく、突然、想定外の事故やトラブルが起こって、不幸にも巻き込まれているような状況を示すみたいだ。
よく「發生」(fa1sheng1)とセットで「發生意外」(事故が起きた)というふうに使うみたい。
例えば、「希望她沒有發生意外。」は、事故に遭っていなければいいけど……という意味になる。

言い回し的には、意外=事件みたいな感じで使われているけど、
ここでの意外は、「意外事件」(yi4wai4 shi4jian4)、「意外事故」(yi4wai4 shi4gu4)を短縮している感じ。
だから、「意外」で想起されるのは、例えば交通事故とか転落事故とかかな。

この前、テレビを見ていたら、そういうのが出てきたよ。

交通事故で車に衝突されて亡くなったんでしょう――みたいな意味かな。

想定外と言えば、我々としては、東日本大震災とか福島の原発事故とかが思いついて、これこそまさに「意外」と思うけど、
天変地異は事件や事故ではないから「意外」とは捉えにくいし、既に災害の状況が把握しているものについては「意外」の範疇ではないみたい。
福島については、あえて言えば、「福島核意外」と決めつけられなくはないのかな。

ちなみに、台湾での「意外」はこれだけじゃなくて、
日本語みたいの形容動詞「意外」の意味でも使われるよ。

人気を表現する

人気があるというのをどうやって言うかなんだけど、
一番簡単なのは、「人氣」(ren2qi4)とそのまま中国語読みして、
「很有人氣」(hen2you3 ren2qi4)などとすることだよね。
ただ、これは、ここ何十年で日本から入ってきたであろうカジュアル表現なので、
まさに若い人向けの言葉遣いとしてはありという表現だから、
何も言えないよりかはいいけど、別の言い方も知っておきたい。

人気があることを表現したいときの言い方として
オーソドックスなものは、「受歡迎」(shou4 huan1ying2)だよ。
「紅」(hong4)という言い方もあるけど、
人気がえらく飛び抜けているものでないと使いにくい気がする。

「台湾の小籠包は日本で人気があります。」だったら、
「台灣的小籠包在日本很受歡迎.」「台灣的小籠包在日本很紅.」

「日本の果物は台湾で人気がありますか。」だったら、
「日本的水果在台灣很受歡迎嗎?」「日本的水果在台灣很紅嗎?」となるよ。

ただ、こんな難しくしなくても、実際には「喜歡」(xi3huan1)とかでいいんだよ。
ブームだったら、「流行」(liu2xing2)という言い方もある。
「日本人喜歡台灣的小籠包.」「日本流行吃台灣的小籠包.」
「台灣人喜歡日本的水果嗎?」「台灣流行吃日本的水果嗎?」
「流行」の例文はちょっと変に見えるけど、これでもいいらしい。

紅(hong4)は、人気の人物、特に大スターを表現するときに使うよ。
「AKB48は日本で人気があります」と言いたいときは、
「AKB48在日本很紅.」と言う。

ただ、「AKB48は台湾で人気がありますか。」と台湾人に聞きたいときは、
「AKB48在台灣很流行嗎?」になるんだろうなと思う。
「紅」にするか「流行」にするかは、
この例では、AKB48がどれだけ台湾で存在感があって、営業的に現地に出張ってやっているかで決まってくるんだろうなと思う。

紅(hong4)については、お山の大将的な人気では、なかなか使いにくいよ。
だから、「鈴木君はクラスの人気者です」と言うときには、
「鈴木在班上的人緣很好.」「鈴木在班上很受歡迎.」「鈴木在班上很有人氣.」となる。
「人緣」(ren2yuan2)は、人間関係のことだよ。

ちなみに、
人気(ひとけ)という場合には、「沒人」「沒有人」になるよ。
「混んでいる」を表現する」も見てね。

空腹を表現する

何となく、すごく基本的な気がしたんだけど、
奇をてらわないコンテンツづくりも大事だよね……

おなかがすいたというのは、「餓」(e4)を使って、
「我餓了」(wo3 e4le)とか「肚子餓了」(du4zi e4le)という。

ある意味で簡単とも言える表現なんだけど、これの悩みどころは
中国語「e」が発音しにくい上に、それを四声で言わないといけないということもある。
だから、発音に自信を持てなければ、「肚子」を言うようにした方が聞き取られやすくなるかもしれない。

あとは、具体的に欲求を示すことで表現できるかもしれない。
何か食べたいと表現するのは、「我想吃東西」(wo3 xiang3 chi1 dong1xi1)
何か食べるものはありますかと言いたければ、「有沒有吃的」(you3mei2you3 chi1de)

おなかが鳴るというのは「肚子叫」(du4zi jiao4)で、これを言って空腹を表現できるか。
子供向きっぽいけど、「肚子咕嚕咕嚕叫」(du4zigu1lu1gu1lu1jiao4)という言い方もある。
「ぐるぐるじゃお」なので、日本人にも言いやすいかもしれない。
おなかがすくのは擬声語ではグルグルになるということなんだけど、
では、下痢でおなかがグルグルするときはどうなるかというと、それは「肚子痛」(du4zi tong4)になる。

ちなみに、「おなかがすく」という別の言い方として、「(私は)空腹だ」というのが思いつくだろうけど、
「空腹」を使う言い方はしないんだよね。
「腹」は何か専門的なカテゴリー、古語というイメージがしてしまう、
一般的には、おなかというのは「腹」ではなく「肚子」なんだよ。

とはいっても、「空腹」という漢字を見せれば、こちらの言わんとすることはわかるかもしれない。
これは「満腹」についても同様のことが言えるよ。
満腹は、「吃飽了」(chi1bao3le)になるよ。