2008年現在,日本的Yahoo、Excite、Infoseek、ODN等入口網站,都有提供免費線上翻譯的服務。有些沒有提供線上翻譯功能的網站多少都有線上字典服務。而且那些線上字典的資料庫多半是由知名的字典出版業者提供,相當有參考價值。
用電腦來做語言翻譯是很多科學家的夢想之一。早在1940年代的美國,就已經有學者(Warren Weaver和Andrew D. Booth)提出用電腦翻譯語言的構想。到了1950年代,美國的IBM和喬治城大學開始開發電腦翻譯系統。經過五十多年發展,現在電腦翻譯功能越來越進步,而且有相當的實用價值。
其實,梅與櫻的日本人作者在做中譯日(主要是把中國的最新產業新聞譯成日文)時,也常常會使用免費線上翻譯。
講到這裡,有些人可能會覺得不可思議,特別是那些有一定的外語知識,而且確實用過線上翻譯功能的人可能會驚叫:「沒搞錯吧!?」「線上翻譯翻出來的句子能看嗎?」「用線上翻譯的結果能信嗎?」「翻譯軟體所翻出來的結果根本狗屁不通!」
可能有不少人會對線上翻譯軟體譯出來的結果嗤之以鼻,不過目前日本線上翻譯系統的功能確實有使用價值。這是不爭的事實。
有些人很不屑翻譯軟體,是因為這些人看了太多翻譯軟體所翻出來的失敗例子,所以非常不信任線上翻譯系統。
的確,在網路上可以看到太多翻譯軟體翻出來的奇怪句子。不過這些句子能上檯面,根本的原因還是使用者的問題。因為有人相信這些句子正確無誤。
因為有人相信這些句子正確無誤,所以才會有人在網路上使用或張貼這些句子。使用這些句子的是人,張貼這些句子的也是人。如果這些人認為這些句子是錯的,這些人可能就不會使用這些句子了。
同樣的道理,這些句子之所以不倫不類、狗屁不通,是因為有另外的一群人相信這些句子不倫不類、狗屁不通。
使用這些句子的是人,判定這些句子正確與否的也是人。電腦做的只是確實地依照程式規則代換詞彙、重組句子而已。
當然,有人會說「誰都看得出那些翻出來的句子一定是錯的」。
的確,翻譯軟體翻出來的東西不完美。不過「一定是錯的」這樣的說法太極端。其實人工翻譯也可能出現類似的句子。舉例來說,台灣的一些有使用原文教材的大學的學生共同筆記就常常會出現一些奇怪的句子。因為很多學生在「翻譯」時就就真的只是把英文詞彙代換成中文而已。例如把英文動詞被動語態翻成中文時,就只是在中文動詞前面加一個「被」字,甚至連中文不太使用的冠詞都硬翻出來。結果共筆中就出現一堆【○○○被認為是一種△△△】。
其實,現實中的華語不太使用被動句,也不太使用冠詞。所以【○○○被認為是一種△△△】中的「被認為」和「一種」都是不自然的中文。比較自然的譯法應該是【有人認為○○○是△△△】。
這些在翻譯文中用了一堆「被認為」「一種」的學生的十幾二十年的現實世界的華語生活中,可能從來就沒講過【○○○被認為是一種△△△】這樣的句型。
翻譯時會出現這種不自然的句型,是因為翻譯的人自己的母語表達方式並不成熟。如果這些人遇到更複雜的外文句型的話,恐怕會翻出更多他們一輩子也不可能講出來的中文。雖然學生共筆中充斥了太多不倫不類的句子,但是很多學生還是看得非常高興。
除了大學生的共筆以外,在台灣的書店裡,隨便去翻一下專業領域的學術翻譯書籍,也可以輕易發現一堆不倫不類、狗屁不通的中文句子。最經典的句型當然還是【○○○被認為是一種△△△】。如果有人真的用心讀了這些翻譯書的話,恐怕內心會發出類似「×!這個翻譯者根本就沒讀懂原作」的怒吼。
其實我在看翻譯文章或翻譯書時,如果發現有類似【○○○被認為是一種△△△】的經典句型的話,我會直接去找原文資料。因為我會認定翻譯的人的知識不足。
把那些共筆或翻譯書中的奇怪的句子拿來和翻譯軟體翻出來的「比較差的結果」相比,其實半斤八兩。既然有人會相信共筆或是翻譯書中的奇形怪狀的句子的正確的,把翻譯軟體的翻譯結果當成正確無誤的句子也就不足為奇了。
這裡之所以說翻譯軟體有實用性,是因為電腦照著程式規則變換重組詞彙和句子時非常忠實,絕對不會偷工減料。光從這一點來看,就比學生共筆好多了。學生在製作共筆時,遇到自己不懂的地方可能就會偷工減料。至於電腦,不論句子有多長,詞彙有多麼地多,只要按一個按鈕,電腦就會在極短的時間之內顯示出結果。對於從事翻譯工作的人而言,如果有個助手能把某一個或是某一群詞彙一口氣全部完美地變換,當然會大大地提升工作效率。至於那些電腦所無法應付的例外用法,當然就是靠人腦來解決。
因此,翻譯軟體的實用性是在於輔助翻譯,而不是取代翻譯者。翻譯機是翻譯工作中的工具,人類才是翻譯工作中的執行者。
當我們在使用某個工具來提升工作效率時,必須要先了解工具的正確使用方法。每個人都知道如何翻書,但是這並不代表每個人都知道怎麼讀書,某個人會翻字典也並不代表這個人會查字典。若要善用「字典」這樣的「工具」,必須要先理解字典的特性、功能,進而理解查字典的方法,並不是從第一頁翻到最後一頁就OK了。
同樣的道理,使用翻譯軟體的人當中,有多少人真的理解了這個工具的特性、功能,以及使用方法了呢?
如果把某段文章剪貼到翻譯軟體的欄位中,按下翻譯按鈕,就以為電腦會把文章會完完全全正確無誤地翻譯出來,就是沒理解翻譯軟體的特性、功能,以及使用方法。使用翻譯軟體的過程中,的確需要剪貼複製、點選按鈕的能力,但是這並不代表有這些能力的人就能善用翻譯軟體,就如同使用字典時必須要翻頁,但這並不代表有能力翻頁的人就懂得查字典。
查字典時,並不是找到那個「字」或是「詞」就結束了,找到那個「字」或是「詞」時,只是「翻頁」這個工作結束而已,查字典的人真正的目的是要從這個條目中找出自己需要的資訊。這是因為「字」和「詞」的意思不只一種。能從條目中找到自己需要的資訊的人,才能算是會查字典的人。同樣的道理,使用翻譯軟體的人,並不是看到「結果欄」中出現結果就結束了,「結果欄」中出現結果只意味著輸入文章及點擊按鈕的工作結束,使用翻譯軟體的人真正要做的是從翻譯機的翻譯結果中找出自己所要的資訊,例如詞彙的變換方式,句子的重組邏輯,為什麼會產生這個結果等。而不是直接把這個結果當成正確答案。網路上之所以會出現一堆翻譯軟體生成的不倫不類的句子,就是因為使用者並沒有正確使用翻譯軟體。簡單地說,這些人就像是一個知道怎麼翻書,但是卻不知道怎麼讀書的人。這些使用者可能以為翻譯機有能力理解文章或句子的意思,就好像有些人以為把一本書從第一頁翻到最後一頁就算是「看書」。
事實上,翻譯機做的只是詞彙變換及句子重組而已,這個過程中完全不涉及「理解」。或多或少會有人期待有一天有人能發明出一台能夠自行思考,而且還能夠和人類進行溝通的電腦。這是一種非常浪漫的想法。然而這種浪漫是否能成真呢?有些學者認為不可能,有些學者則仍然抱持著希望。簡單地說,就是因為這種電腦目前不存在,就是因為這種技術離現實太遙遠,所以才會有學者認為不可能;所以才會有學者抱持著「希望」。
事實上,日本在1982年開始發展的第五代電腦時,其中一個目的就是想造出一台能夠進行思考、能夠進行正確翻譯的電腦,不過這個計畫最後是以失敗結束。失敗的原因之一是在於當時科學家還沒有把人類的思考方式、語言機制的基礎部分的謎解開。當然,那些問題到現在還是沒有解開。由於基礎部分的謎沒有解開,他們模仿人類打造出來「會思考的電腦」的基礎部分當然殘缺不全,計畫理所當然會失敗。大約在同一期間,歐洲方面也曾經試圖開發多國語言翻譯機,來應用在歐洲共同體的會議當中,不過最後也是以失敗告終。由於許多科學家已經認為,人類的思考模式、語言機制的謎已經不可能解開,因此目前的「會思考的電腦」的研究比較傾向模仿簡單的生物,想辦法設計出能自行進化的人工生命。
目前沒有一家軟體公司敢宣稱他們的翻譯軟體或翻譯機能譯出完美的句子,因為那是不可能的事。事實上,現在的翻譯軟體本來就只是定位在「翻譯輔助」工具。只是有太多抱持著「自動翻譯機的浪漫」的人擅自認為「只要把文章丟到空欄中,按個按鈕就可以產生完美的翻譯」,因此即使翻譯軟體所重組出來的句子明顯地肢離破碎,恐怕有些人還是抱持著孤注一擲的心態,把那些明明自己知道有問題的重組結果搬上台面,畢竟電腦科技是一種浪漫,自動翻譯機也是一種浪漫,在這種浪漫的思維之下,有些人就會對這種浪漫採取相信,而不是批判及懷疑。即使結果看起來文句不通,恐怕他們也會把這些問題當成自己的錯覺,畢竟高科技的浪漫最大。
如果我們要把一個任務或是工作委託給另一個人執行時,哪怕那個人是多麼優秀、多麼認真,就常識而言,委託人必須要驗收結果,最起碼這是確認「執行成果是否符合要求」的手段。
不懂得建築的人,在買房子時起碼也要懂得看清楚房子是不是真的符合合約上的規格,因為那是最起碼可以自己確認的東西。不懂英日語的人,在使用翻譯軟體將英文或是日文翻成中文時,起碼也要懂得看清楚翻譯軟體所翻出的中文結果是否符合中文的文法,裡面的內容是否合乎事實邏輯。如果連這個最基本的驗收程序都沒有做的話,問題實在不是在忠實執行程式的電腦,而是負責人沒有驗收結果,負責人根本就沒有負到最基本的責任。如果使用者想要利用翻譯軟體把中文翻成自己不擅長英文或日文的話,也必須要先有個基本認知:翻譯軟體並非「不擅長」外文,而是翻譯軟體根本就不可能理解語文。翻譯軟體能做的只是「符號變換重組」而已,「語意重現」是人類的工作。如果主角的人類無法理解語言的話,即使有一個能忠實執行指令的工具也是無用武之地。
在媒體上,偶爾可以看到一些因為使用翻譯軟體而鬧出笑話的事件。許多人可能因此對翻譯軟體大肆批判,或是把「使用翻譯軟體」當成一種不負責任的行為。事實上,這個問題並不是翻譯軟體的問題,也不是「使用翻譯軟體」這個行為的問題,而是在翻譯過程中,負責人並沒有盡到監督及驗收的責任的問題。這不是語言能力或是電腦知識的問題,而是人們做事心態上問題。
蒟蒻 (コンニャク)。在日本漫畫「哆啦A夢」中,有一種道具叫作「ほんやくコンニャク」(翻譯蒟蒻,這種道具曾經被譯為「翻譯糕」),只要吃著「ほんやくコンニャク」就能和使用其他語言的人溝通,這種道具代表著人類對於異文化、異語言間溝通的一種浪漫渴望。現實中的蒟蒻的口感類似果凍或是洋菜膠 (不過蒟蒻的彈力較強)。由於一般蒟蒻沒有味道,因此稱不上是美味的食物。
相關文章連結
翻譯軟體的能力極限
不解
由於學淺,是否可以解釋,下文雙引號中的意思?謝謝。
電腦所做的只是”蠩實地”依照程式規則將詞彙進行變換、將句子進行重組而已。
我看到的是「確實地」
scchiangさん,您好
感謝您的回應。
由於當我回應本篇結束後,再次的查看問題點時,確實顯示的是「確實地」,而回應的內容已無法更改或
刪除。造成大家不便,在此深感抱歉。
我從來沒有從這個角度思考過翻譯機的功能,看了這篇文章之後收穫很多,謝謝。
前幾天才在和同事討論翻譯網站的事.這個觀點的確值得思考.的確,語言是人用來溝通的工具.人才是主角呀…
謝謝回應
To 神田:
謝謝您的指教。
我們在張貼文章時,的確有錯字。不過該錯字可能在您張貼回應文章之前就已經修正。
原則上,我們會儘量使用一般人能理解的詞彙來寫文章。因此如果您發現我們的文章中出現了難以理解、而且字典中查不到的詞彙時,很有可能是我們打錯字。
您指正了我們的錯字,這意味著您仔細地閱讀了我們的文章,而且也可能意味著你希望我們能張貼出沒有錯字的文章,我們非常感謝您用心地讀了我們的文章,也感謝您的熱心指正。我們感謝您指正我們的錯字,然而我們並不樂見所有的回應全部是針對錯字而來,因為我們相信我們的文章所傳達的東西並不是只有錯字而已。而我們也不希望這裡的日本人讀者 (「梅與櫻」的讀者當中將近半數為日本人) 對於台灣人的印象是「愛挑錯字」。
今後我們除了會繼續準備新的話題以外,也會儘量小心不要打錯字。
To scchiang:
謝謝您的說明。
事實上,我們的確曾經打錯字。只是那個錯字在投稿後十分鐘內立刻修正了。
在Windows日文環境下的記事本打中文文章時,有許多字是看不見的,這些看不見的字在記事本中全部是以黑格子形態呈現。因此我們的文章在投稿之前會充滿一堆黑格子,直到我們在部落格張貼文章後,我們才能完全確認這些黑格子分別是哪些字。
今後我們除了會繼續準備新的話題以外,也會儘量小心不要打錯字。
To skylee, susu:
謝謝回應。
我們之所以會寫這篇文章,其實就是因為看到許多誤用翻譯軟體的例子。許多人對於翻譯軟體過於期待,而使用過翻譯軟體之後卻又過於失望。然而這些問題往往是由於許多人不甚了解翻譯軟體的功能所致。
在2008年的現在,翻譯軟體的定位仍然是屬於一種輔助工具,而且給具備語言能力及翻譯能力的人使用的工具。而具備語言能力及翻譯能力人使用這個工具的前提題理解這個工具的特性。
這種感覺有點像是汽車是一種輔助的行動工具一樣,開車的人必須要認得路、必須要知道交通規則,而且還要了解汽車的操縱方法才行。就算不認得路,也要有個驗證管道 (例如地圖、GPS或是知道路的乘客),而不懂得翻譯的人起碼也要有個懂翻譯的人來幫忙檢查,才能讓工具發揮其本來的功能。
今後歡迎繼續指教。
☆☆☆
狗屁不通の使い方
To szyu,
想跟您就”狗屁不通”的用法討論一下。
就國語辭典可查到的用法而言, “狗屁不通”或許只是單純的”指出他人文句不通順之處。”
但就日常生活而言, 當面對他人講出”你的文章狗屁不通。”時, 一般會認為除了指出”文章不通順”之外, 還帶有辱罵的意味, 並不能直接替換。
所以我會感覺, 或許可以考慮在一篇論述的文章裡出現”狗屁不通”是否有奇怪之處。
謝謝回應
To ahtoh:
謝謝您的回應。
在您的留言中,第一句話是想要討論詞彙的用法,然而最後一句話卻是講到論述文的文體問題。
由於您留言的主旨前後不一,因此我們也不知道該如何與您討論。
討論的目的是為了建立共識,
然而從您的留言可知,當字典的解釋和您的主觀意識發生落差時,
您並沒有和您手邊的參考資料(字典)建立共識,而且還堅持自己的主觀想法。
並把別人的文章中的用詞全部套用在自己主觀解釋上,並且硬下了一個「不能直接替換」的規定。
如果您無法暫時放下自己的主觀解釋的話,恐怕沒有人會相信您有討論的誠意。
如果您對我們文章的表現方式感到惑困的話,我們倒是可以提供您一些思考方向:
基本上,言語是一種活的東西,因此詞彙的意義和用法並非固定不變的。
即使在同一篇文章中,同樣的詞彙在不同的句子中也可能代表不同的意義。
甚至,如果某個詞彙在一個句子中重複出現,這些重複詞彙的意義也可能彼此不同。
如果您仍然堅持己見,把所有詞彙的意義固定化、狹隘化的話,那是您詮釋上的自由。
「梅與櫻」不是討論網站,我們也沒有那麼多時間與精力和您討論,
而您想討論的議題也和「梅與櫻」網站設立主旨無關。
我們的能力不足,網站的功能無力支援討論,我們只能向您說聲抱歉。
如果您想要在網路上發表高論的話,我們只能建議您去申請一個屬於您自己的網路發言空間。