搜尋的鬱悶

最近,每次在網路上查資料時,查到最後心情都會相當鬱悶。因為用google幾乎只會搜到不相關的資訊。

我想查的資訊很單純。例如處理生活中遇到的某些問題時,有哪些解決方法。或是日本以前發生某件事時,當時網路上的日本人對這件事有哪些看法等。十年前,要查這一類資訊並不難,只要有搜尋,幾乎都可以得到結果。不過現在要查類似的資訊卻變得相當難,而且狀況越來越糟。

我在搜尋資料時,常常遇到以下的狀況:

■搜尋結果充斥著大量廣告網站

我在搜尋比較需要專業知識的生活資訊時,搜到的全部都是看似有內容,實質上卻是什麼都沒寫的廣告網站。

我最早遇到這樣的狀況,是好幾年前我以個人身分接翻譯工作的時候。當時我在查估價單、請求書(帳單)等文件範本格式時,發現搜尋結果幾乎沒有個人分享的經驗,就只有商用軟體業者的廣告網站而已。這些業者用一些粗糙的範本騙人點閱網站,實質的目的是想向點閱網站的人推銷軟體。看到那些內容粗糙的文書範本,我當然也不會想買他們的軟體。還好估價單和請求書的格式並不難,可以從多方零星的資訊中拼湊出來。

最近幾年,我在網路上查報稅的相關資訊時,也幾乎搜尋不到個人經驗談。日本google的搜尋結果清一色是稅理士的廣告網站。這些廣告網站看似寫了很多稅務資訊,實際上全部是沒有深度、沒有建設性的「一般論」。本質上就是無條件地慫恿從事自由業的人去開店,然後找稅理士處理稅務。近幾年,日本從事自由業的人越來越多,當中收入不安定的人並不少。這些人的事業未必能長期營運,也沒有開店的體力。但是日本的網路上,幾乎沒有針對這些收入不安定、最需要幫助的自由業族群的稅務資訊。我會查稅務資訊是因為我有副業收入,想要知道怎麼報稅比較有利。由於我的副收入的金額不多,也不安定,而且也無法預期將來能做多久。如果去開店,還找稅理士處理稅務,我的副收入可能就歸零了。

這些泛濫的稅理士廣告網站實質上是利用大量稅務關鍵詞欺騙google的AI,搶佔搜尋結果排行,為自己的事業打廣告。結果洗掉了網路上真正實用的稅務知識資訊,讓真正有稅務方面問題的人查不到資訊,而且還浪費時間點進廣告網站。這些稅理士用狡猾的手段為自己宣傳,當然也不用期待他們會誠實幫客戶解決稅務問題。

以前google標榜搜尋結果不受廣告商左右,但是在網站可以大量生產的現在,「假資訊真廣告」的網站大量稀釋掉正常資訊。日本google實質上已經變質成了「廣告搜尋器」。google或許也不想當「廣告搜尋器」,但是打廣告的人知道怎麼欺騙AI,讓google無力招架。這種欺騙手法實質上就是專業領域的小型內容農場。google治不了內容農場的話,當然也治不了這種比較特別的領域的「假資訊真廣告」的網站。

■google擅自移除使用者設定的搜尋關鍵詞

當我發現搜尋結果漸漸被廣告網站霸佔時,我就調整搜尋方法,抓出廣告網站的用詞特徵,然後精挑細選不帶歧義、不太可能誤搜到廣告網站的字串來搜尋資料。而且多半會用兩個以上的關鍵詞來搜尋。

剛開始,用這招搜尋資料還算有用,真的可以排除掉廣告網站。不過現在這樣做,google就會擅自拿掉一個關鍵詞,把我強制帶回搜尋原點。我會選用這些關鍵詞搜尋,就是因為只有完全達成這些搜尋要件,一個都不能少,才有可能過濾掉垃圾資訊。但是google的AI居然還不准我這麼搜,擅自把我精挑細選的關鍵詞當中的一個移除掉,然後列出一堆垃圾搜尋結果給我。google這種設定實質上就是在妨礙搜尋。這種感覺就像是消費者到店裡指定條件要買某種商品,而且店家一定有這種商品。但是店家卻直接無視消費者指定的條件,故意拿出不符條件的劣質商品推銷,浪費消費者的時間。

當初我以為這只是google過渡性的實驗措施,不過現在直接移除其中一個關鍵詞已經快變成google的標準設定。結果我必須要一開始就把所有的關鍵詞都加上英文的雙引號,google才會服從。

我現在在用排除語法搜尋資料時,也必須在排除對象的關鍵詞上加雙引號。不加雙引號,google就不會乖乖地比照辦理。所以現在用google搜尋資料時,所有的關鍵詞最好一開始就加上雙引號,這樣才不會被google擅自竄改。

我平常用電腦時,常常要切換日打和中打,而且切換過程有點辛苦。因為windows的IME輸入介面有缺陷,切換輸入法時常常會發生延遲。現在在google上搜尋資訊,為了防止google偷改我的關鍵詞,我還要另外切換成英打模式來輸入雙引號。所以我會有一種被google和微軟聯手惡整的感覺。

■幾乎很難搜到幾年前的資訊

由於廣告網站和內容農場泛濫,所以我在用google搜尋資料時,會設定期間。我在2017年用google查資料時,就常常把當時最近三年期間的資訊排除掉。因為當時日本網路上的內容農場已經相當泛濫,只有把期間設在內容農場比較不泛濫的時代才有機會搜到比較有意義的資訊。當時用這招還可以找到一些有用的資訊。不過2022年的現在,這招也沒什麼用了。因為幾乎搜不到東西了。搜不到東西,有兩種可能的原因:一種是記錄這些資訊的網路平台消失。另一種可能性則是平台還存在,但是google卻把這些平台的資訊從搜尋資料庫中抹消了。

日本的主要新聞媒體通常會把兩週前的資訊抹消。資訊抹消後,google當然就搜不到了。想看以前的新聞資訊的民眾必須向報社付費查詢。不想付費的民眾只能到公共圖書館翻閱紙本的縮印版合輯。我自己有付費訂閱日本報紙的網路版,所以我可以透過付費系統搜尋及確認幾年前日本發生過的事。但是我能確認的就只限於媒體單方面的報導而已,我無法確認當時日本網路上對這些事情有哪些感想,因為這些資訊幾乎搜不到。儘管我在搜尋時有仔細研究過可能的關鍵詞,而且還限定搜尋的期間範圍,但是就是搜不到相關的資訊。這些是以前一定存在過,但是卻因故被抹消掉的資訊。

以前部落格流行的時代,很多人會在自己的部落格評論時事。這些資訊是理解當時大眾想法的大寶庫。不過這個時代已經結束了。大部分的部落格平台已經消失。當時的人平台上留下的寶貴成長記錄也跟著一起消失。現在用日本的google只搜得到最新的時事和民眾的感想。稍微舊一點的時事資訊或民眾的感想幾乎已經搜不到了。

◆◆◆

網路發達後,查閱某些領域的資訊變得非常方便。例如從地址或設施名稱來找地點、確認某個設施「平時的營業時間」等。以前要翻工具書才找得到的資料,現在也可以上網搜得到。最新的新聞,流行話題等,當然也可以搜得到。和以前相比,這些資訊真的是唾手可得。

但是另一方面,十年前很容易查到的資訊,現在變得非常不容易查。因為網路發達後,製作垃圾資訊的門檻變得非常低。高品質的資訊必須花時間醞釀,垃圾資訊則可以用簡單的剪貼複製大量生成。我用google搜尋時遇到挫折的一大原因恐怕是資訊的母群體當中,垃圾資訊佔的比率太大。在垃圾資訊不斷增殖以及競爭搶搜尋排行的情況下,個人發表的資訊只會被淹沒而已。由於資訊的母群體已經嚴重劣化,所以就算改用別的搜尋引擎,狀況也不會變。

幾年前,我的資料硬碟故障,必須找業者修復資料。上網一查,修復資料的業者還不少。但是實際點入這些網站後,讓我相當不安。因為這些業者的網站給人的第一印象就是投機取巧的奸商。網站裡貼了一堆光鮮亮麗的圖庫照片,內容大多是俊男美女上班族。由於這些照片太做作,所以反而給人一種工業製品的無機質感覺。網站中的業務說明的用詞不外乎是業界第一、復舊率最高、價格最便宜等,而且文字還用了陳腐的立體感設計。我一看就直接聯想到不實廣告的垃圾網站。

或許這些業者在現實中真的很用心地幫客戶修復資料,網站可能只是委託網頁設計公司做出來的。不過業者採用了讓消費者感到不安的網頁設計,充斥著讓人覺得不誠實的廣告詞,完全反映出了這些業者的資訊素養及行銷能力。而且可怕的是在網路上搜到的幾乎都是樣的業者。

結果我非常努力地用搜尋語法排除掉這些網站看起來像詐騙廣告的業者,終於找到了一家非常樸素的看起來像自製網站的資訊修復業者。我實際去見那個業者時,對方是個很平凡的自營業大叔。這位大叔開的資料修復價格或許不便宜,但是至少把我的硬碟資料救回來了。

幾年前,我用各種搜尋技巧還有辦法搜到平凡的個人網站。不過現在,個人網站幾乎都被大量生成的無機質垃圾廣告網站埋掉了。查資料查到最後,得到的往往不是有用的資訊,而是鬱悶的心情。心情鬱悶的原因不是查不到資料。對我來說,「資料不存在」也是很有意義的結果。真正讓我心情鬱悶的原因是搜尋過程中遭遇到太多妨礙。

google的搜尋結果中,大部分的網站的本質不是提供資訊,而是在妨礙搜尋。而且妨礙得非常成功。在網路資訊母群體已經被大量生成的垃圾網站汙染的時代,要從中翻出比較有意義資訊,已經相當困難了。

Comments are closed.