用母語寫作,讓 AI 帶我的文章走向世界:全站自動雙語化實踐

在建立這個個人網站的過程中,我一直有一個兩難:我希望能用自己最熟悉、最有溫度的母語(繁體中文)來記錄與創作,但同時,我也渴望與世界接軌,讓更多英文母語者或是對我的技術文章感興趣的國際讀者,有機會看到這些內容的潛力。 此外,從技術部落格的經營角度來看,雙語內容對於搜尋引擎優化(SEO)也有著顯著的幫助,能夠為網站帶來更廣泛的自然流量。 為了解決這個問題,我沒有選擇花費大量時間手動翻譯,也沒有強迫自己改變寫作語言,而是決定利用 AI 的力量來自動化這個流程。 專注於創作,把翻譯交給 AI 我最近在網站上實作了一套基於 GitHub Actions 與 Gemini API 的自動化翻譯工作流: 維持原本的寫作習慣:我只需要專注於用中文撰寫 Markdown 文章。 自動觸發翻譯:每當我把新文章 push 到 GitHub 上,GitHub Action 就會在背景自動執行 Python 腳本。 Gemini 接手處理:腳本會掃描尚未有英文版本的文章,呼叫 gemini-2.5-flash 模型,自動將內文精準翻譯成流暢的英文。 自動更新網站:翻譯完成後,腳本會自動把內容包裝成中英文切換的 HTML 區塊,並將修改直接 commit 回 repository。 現在,你在這篇文章(以及網站上的其他文章)上方,應該能看到一個「🌐 切換為英文 (Switch to English)」的按鈕。這一切都是自動發生的,我完全不需要介入。 這樣一來,我不僅保留了寫作的純粹與樂趣,也同時賦予了這個網站觸及全球讀者的能力。 未來的計畫:走向更現代化的架構 雖然目前的做法已經能很好地滿足「專注創作+自動翻譯」的需求,但我知道這個網站還有進步的空間。 為了提供更好的閱讀體驗與效能,我之後會繼續嘗試將網站架構遷移到更輕量化、載入速度更快的 Astro.js,並結合 Astro 原生的地區適應(i18n / Localization)功能,讓雙語切換不僅僅是內文的隱藏與顯示,而是從網址結構、Metadata 到介面語系都能完美適配的現代化架構。 世界很大,語言不該是我們分享知識的障礙。接下來,就讓 AI 繼續幫我把這些文字,翻譯給更多需要的人吧!

May 29, 2026 · 1 分鐘 · datafox & 柯宥圻 (Yuchi Ko)

從 Geoguessr 的「找膠帶」玄學,看深度學習的捷徑學習(Shortcut Learning)迷思

從 Geoguessr 的「找膠帶」玄學,看深度學習的捷徑學習(Shortcut Learning)迷思,我們如果太依賴某特徵會發生什麼事情? 1. 那些被丟在荒郊野外的日子:Vibe Guessing 的浪漫 自從結束交換學生的日子後,我意外迷上了 Geoguessr 這款遊戲。它的魅力在於不用下載任何 App,打開瀏覽器就能隨時隨地被「隨機空投」到世界某個角落。在玩這款遊戲時,我不僅能複習曾經走過的街景,還發現自己漸漸長出了一種超能力——「Vibe guessing(直覺流)」。 多虧了在歐洲遊走的經驗,我開始能用直覺去感受一個地方的「氣味」:不依賴那些主流的meta側面破解技巧,而是靠著建築的冷暖色調、路邊植物的生長姿態,甚至是一種難以言喻的「破敗感」或「秩序感」來定位。雖然這種黑盒子演算法偶爾會讓我大落漆(把南美洲猜成東歐之類的),但這種真正用雙眼去感受地理的過程,才是遊戲靈魂。 2. Meta 玩家的玄學:現實世界沒有長著涉水管的 Google 車 但與此同時,我對 Geoguessr 圈內極度推崇的「Meta 策略」抱持著高度懷疑。 什麼是 Meta?高階玩家被丟到荒郊野外時,他們第一時間不是看風景,而是低頭看 Google 街景車。他們透過記憶 Google 街景車在各國的收錄瑕疵來上分: 「車頂有黑膠帶?這絕對是迦納。」 「車頭右邊有一根涉水管?不用看了,肯亞。」 「天空有明顯的第三代鏡頭接縫光暈?定位塞內加爾。」 這確實很聰明,也是遊戲規則內的完美必勝法。他們繞過了真正需要龐大知識量的地理分析,直接破解了題庫。但荒謬的是,如果今天把這些 Meta 玩家丟到真實世界的肯亞,他們會迷路—— 因為現實中的肯亞街頭,並沒有那台長著涉水管的 Google 街景車跟著他們。 3. 演算法也是個功利的玩家:什麼是 Shortcut Learning? 把場景換到 AI 領域,深度學習模型其實就是個死命想上分的 Geoguessr 玩家。 不管是在電腦視覺還是對抗性攻擊與防禦(Adversarial Attack/Defense,我最近跟者羅紹元老師的腳步在研究)中,模型唯一的目標就是把 Loss 降到最低。它才不管什麼大局觀,只要能最快達到目的,它就會毫不猶豫地走捷徑。 這在機器學習裡被稱為 捷徑學習(Shortcut Learning) 。 模型並沒有學會我們期望它學會的「真正特徵」,而是學到了「資料集裡的統計相關性(或是瑕疵)」。只要這個帶有強烈訊號的捷徑特徵一消失,模型的預測能力就會瞬間崩盤,毫無泛化性(Generalization)可言。 4. 殺傷力極強的隱形炸彈:相關性不等於因果關係 Shortcut Learning 在機器學習各個領域都是個災難,而且它比我們常說的Overfitting更難被發現、殺傷力更高。 Overfitting 是模型死背了訓練集,但在驗證集就會露餡。但 Shortcut Learning 可怕的地方在於,如果你的驗證集也包含了同樣的瑕疵,模型的表現會堪稱完美。 這就像經濟學和統計學裡常被拿出來鞭的鐵則:「相關性不代表因果」。模型只看到了高度相關,卻搞錯了因果。 套用回 Geoguessr 的比喻:如果哪天 Google 官方來個大更新,用 AI 把所有街景車的特徵、天線、膠帶全部 P 掉,那些高度依賴 Meta 的玩家積分絕對會迎來史詩級的雪崩。 ...

May 28, 2026 · 1 分鐘 · 柯柯