連頂會論文都逃不過的「小學生算術」檢查 🔍

最近在深入研究一篇發表於 ACL (Computational Linguistics 頂會) 的 Main Conference 論文時,發生了一件讓我啼笑皆非的事情。 為了開發我的新論文框架,我「翻爛」了這篇論文開源的 GitHub 代碼與原始數據分佈。結果發現了一個連當初三位審稿人(Reviewers)都沒抓到的低級漏洞:這篇號稱評測「金融推理能力」的論文,連基礎的加減法都算錯了! 主要問題是: 「論文宣稱的總題數 N,並不等於它列出的組成部分 A + B。」 簡單來說,作者在在正文和附錄中都信誓旦旦地拆解了數據來源,但這兩個數字加起來,竟然跟他在摘要、正文、圖表中反覆強調的總數對不起來。 當我寫信向第一作者求證時,對方非常誠懇地道歉並承認這是個 Typo,並感謝我幫他釐清了數據一致性。 這件事給我最大的啟發有兩點: 1️⃣ 不要迷信權威(Critical Thinking): 即使是發表在頂級會議、經過同行評審的論文,依然可能存在極其低級的錯誤。如果我當初選擇「腦補」合理化這個數字,我的實驗基準(Baseline)從一開始就會偏離。 2️⃣ 為什麼我們需要驗證框架: 這篇論文的主題是「金融數值推理」,結果作者自己卻在數值推理上翻車。這正是我在意的研究主題——我們需要一個更嚴謹、具備 Human-in-the-Loop 的機制,來防止 AI(甚至是人類作者)在這種高風險領域「亂猜意圖」或產生邏輯幻覺。 感謝這位作者的誠實回覆,這 90 題的差距,反而成了我跟頂尖研究者建立學術連結的門票。 接下來,我要帶著這份「懷疑精神」,繼續把我的驗證框架磨得更利。🛠️ 主題標籤#AcademicIntegrity 主題標籤#ACL2025 主題標籤#LLM 主題標籤#DataScience 主題標籤#FactCheck 主題標籤#NTU

April 14, 2026 · 1 分鐘 · datafox & 柯宥圻 (Yuchi Ko)

從ㄅ級分到ㄦ級分銳評巴賽隆納旅遊行為

這是一份集結了半年血汗、尿意、與小偷鬥智鬥勇、以及被鸚鵡襲擊後的**「巴塞隆納生存戰力清單」**。我幫你把那些碎碎念通順化了,但保留了那種「我住過我驕傲,但也住到快瘋掉」的銳利感。 🦊 datafox的巴塞隆納「期望值 vs. 實際效用」銳評總表 這座城市基本上就是一個巨大的隨機變數,你的 $U(x)$ 完全取決於你離廁所的距離,以及手機是否還在口袋裡。 ㄅ 級分:這才是交換生的正確打開方式 加泰隆尼亞音樂宮 (Palau de la Música Catalana):一定要用青年半價(30 歲以下)去看演出,那種在華麗建築裡聽音樂的性價比,直接把效用拉滿。 Gràcia 區的廣場日常:隨便選個平日下午,在廣場(Plaza)曬太陽、喝杯 Vermut,這才是歐洲生活的真諦,而非在老城區被觀光客擠死。 英格蘭百貨 (El Corte Inglés) 的廁所:位於加泰隆尼亞廣場旁的戰略要地,免費且體面,是你膀胱的救世主。 Jon Cake:不用多說,那塊起司蛋糕是這座城市少數能讓人心甘情願排隊的東西。 冬日清晨的海灘日出:雖然 Barceloneta 海灘白天很爛,但冬天早起去看日出,陽光能暫時掩蓋所有的髒亂。 Montserrat (蒙特塞拉特山):如果待超過三天,請務必滾出市區去這裡,那邊的風景才是這省的精華。 Mercadona (超市之王):別在路邊買那些標價不明的小攤販。進 Mercadona 買零食,順便上他們的廁所,這才是省錢又安穩的「ㄅ級」操作。 ㄆ 級分:值得一去,但要有心理準備 Tibidabo 制高點:雖然公車有點遠,但從聖心聖殿頂端俯瞰全城的視角,確實贏過市區所有昂貴的景觀台。 Glòries 跳蚤市場:如果你喜歡在垃圾堆裡尋寶,這裡的樂趣遠大於百貨公司。 節慶狂熱 (Correfoc / 跑火龍):看著小孩在煙火裡亂竄,你會感嘆歐洲教育的「野性」,人雖然多到崩潰,但那種腎上腺素爆發感確實是 ㄆ 級。 Poblenou 散步:比起老城區,這裡的街道整潔、有藝術氣息且離海近,適合想安靜發呆的時候。 ㄇ 級分:中間值,被觀光行銷堆出來的效用 高第建築系列 (Park Güell, Casa Batlló 等):預期效用很高,但進去後會發現人多到你只想趕快出來。屬於「不去會後悔,去了也就那樣」的平衡點。 隱藏電扶梯:從 Gràcia 爬坡往焦糖山或奎爾公園時,發現那段給當地居民用的電扶梯,會讓你產生「我賺到了」的短暫快感。 MNAC 與纜車:除非你對加泰隆尼亞藝術有偏執,或是真的很想從空中看這座髒髒的城市,否則性價比其實普普通通。 ㄈ 級分:純粹的期望值詐騙 9:30 PM 吃 Vinitus:跟風去吃觀光客集團餐廳,還要在西班牙人的生理晚餐時間去擠,完全是自我折磨。 城堡公園 (Parc de la Ciutadella) 散步:那裡根本沒有城堡!只有滿地的鸚鵡糞便、想賣你毒品的可疑人士和吵雜的人群。 6.5 歐元的 CoCo 百香雙喜砲:在台灣買四杯的錢,在這裡買一份昂貴的鄉愁,喝完後的空虛感比戶頭縮水的速度還快。 不知道為什麼所有ai都會推薦你去但是實際去發現超爛的整修中迷宮 (Horta):特地搭車過去,結果只看到圍起來的布條跟沒維護的破房子,這是我最想刪除的樣本點。 ㄉ 級分:巴塞隆納的惡意(請開啟防禦模式) 老城區與 La Boqueria 市場:基本上就是個巨大的陷阱。那邊的點心是給盤子吃的,而老城區的觀光小店,除非你打算在那裡練殺價邏輯,不然真的不用去。 那些想拍美照的瞬間:在 Barceloneta 或是那根「受傷的星宿」雕像前想拍網美照,結果背景全是垃圾,還要擔心手機被搶。 動植物襲擊與騷擾:加泰隆尼亞廣場那些肥到飛不動的鴿子,以及凱旋門附近會俯衝襲擊你的奇怪綠色鸚鵡。再加上主教教堂廣場那些瘋狂騷擾你的陌生人,這座城市的「治安」隨時在崩潰邊緣。 露天座位的代價:加收 10% 服務費就算了,你還要在那裡吸二手菸、忍受突如其來的大暴雨,以及阿格巴塔 (Torre Glòries) 那種醜陋的建築美學。 ㄦ 級分:地獄難度(發生一件就直接登出) 手機、護照被偷或被搶:這是巴塞隆納給每個旅人最誠摯的「洗禮」,發生機率高到可以寫成分布函數。 沙灘性騷擾:在那片「最差海灘」上如果不幸遇到這種事,這座城市對你來說就只剩下負效用了。 結語: 巴塞隆納是一座如果你沒被偷、剛好上到免費廁所、且沒被鸚鵡撞到頭時,會覺得「還算可愛」的城市。但如果你追求的是精緻與秩序,我還是推薦你多買點起司蛋糕,然後趕快回台灣喝 60 元的珍奶吧。🦊 ...

April 9, 2026 · 1 分鐘 · datafox & 柯宥圻 (Yuchi Ko)

關於我和Linkedin的故事以及推薦大學生如何使用Linkedin

我和LinkedIn的故事 雖然已經找不到大一做的筆記了,但我還記得當時上《財務金融入門》,在花花綠綠、各種 Fancy 的職稱中,我抓到了一個共同定律:厲害的人都在經營 LinkedIn。不管是投資分析師、創業家、資產管理還是科技 PM,有一個專業的門面加上高 Connection 數,雖然需要時間經營,但基本上百利而無一害。 以下是我這幾年的兩點心得: 就算現在「沒料」,也要絞盡腦汁把過去的經驗放上去 剛進大學時,身邊就有人在經營 LinkedIn 了。我是私立高職畢業,當時跟財金一點邊都摸不著,真的沒什麼亮眼成就。記得在課堂上被逼著寫第一版履歷時,上面只能擠出:當過家教、高中全班第一、多益和英檢成績… 這些現在看來微不足道的資訊。 但隨著時間更迭,慢慢有了社團、實習、工作坊和課程經驗。最近我甚至為了讓版面更簡潔,刪除了許多當時覺得很重要的「浮木」,例如學生會經驗或某個研討會成員。在修改過程中,我感受到了去蕪存菁的快感,這也是成長最好的證據。 大學生常會覺得「到底誰想跟我 Connect?」然後縮回 IG 或 Threads。但如果能定期更新想法,不僅是練習適應 LinkedIn 的商業風氣,更是在累積個人觀點。有東西的版面總比空殼好,至少讓獵頭或未來的公司想了解你時,有更多面向可以切入。第一步總是最難的,我們可以先建一個「簡裝版」,再觀察嚮往的 KOL 怎麼寫,一步步微調出屬於自己的模樣。 小撇步: 預設一個你想達成的職涯目標,把關鍵字放入標題。雖然還沒達成,但這是一種「放訊(Signaling)」,讓別人看出你是有追求、對該領域有興趣的人,效果就已經足夠了。 瘋狂加 Connection 真的不用害羞 大一時聽學長說過:不需要擔心履歷長怎樣,更不用怕被拒絕。只要你的聯絡人超過 500+(在linkedin堪稱黃金數字),就會從「你加別人」變成「別人主動加你」。 當時的做法很直接:鎖定關鍵字(例如 Finance),然後一直按申請;或者找同校、同社團的學長姐。不用擔心被拒絕會怎樣,等幾個月後你的 Connection 變多,或者你真的拿到了不錯的實習,那些當初沒理你的人,搞不好也會回心轉意(笑)。 總之,如果你是在 LinkedIn 看到這篇文章,別猶豫,去創造你的 Connections 吧!(或者來加我也行,我都會按通過喔!)

April 6, 2026 · 1 分鐘 · datafox & 柯宥圻 (Yuchi Ko)

關於台北市市長選舉的觀察(之後附上數據)

我覺得一直道2024年初沈伯洋德聲量都是正面居多,尤其是在2023年底夜夜秀邀請沈去介紹自己的專業時,還有那個時候出書「阿共打來怎麼辦」時,都是一個正常人、有自己的專業的角色,在那時候得抗中保台是頗合理的選項,因為那時候的政黨色彩還沒有那麼濃厚,大家尤其是青年會比較多信任他的專頁能力而是政黨屬性。 但是自從開始擔任立法委員,被當作民進黨在2024到現在嘗試搞各種運動的時候一個「民進黨抗中保台」神主牌/擋箭牌時,鋪天蓋地到攻擊+針對失言的部分被媒體放大,「民進黨的狗」這個屬性就已經背貼的死死的,這時候就算想要強調他的專業屬性,他的政黨屬性會嚇跑所謂的中間選民,雖然他們會更多的嘗試和專業數性,但是濃厚的政黨屬性會蓋過專業屬性,讓「青鳥/民進黨舔狗」這樣的形象貼的死死的 ,這時候要代表檔來選台北市市長就已經是不可能營德賽局。蔣萬安很影博,市政被他玩到很聰明,不主動惹事也不主動離所謂的黨派大老/紅統派太近,他很巧妙的使用蔣家繼承人的屬性,盡量讓大家不要想到他和蔣中正關係,而是採用靈活甚至有點不沾鍋的方式管理,然後在市政正常推動完成的時候出來接受政策紅利,沒啥正評也沒啥負評已經是最好的了。 therefore就算蔣的個人能力和知名度真的不突出(他就是那種媒體叫他說啥他就説啥的人,很會包裝但也很無聊),他也可以拿著政策紅利與自深累積的好感杜(一張帥臉+沒什麼存在感也沒爭議)讓他非常簡單的做防守,面對民進黨、抗中保台屬性的沈,只要國民黨操作嚷沈看起來時箇一直大叫的過街老鼠的話,基本上非常穩,就算蔣犯法遭到停職還是會當選的程度。 最後 抗中保台或者是GIS定位、兵推專家屬性真的應該第一順位放在行政院政務官,第二時放到立法院,最爛的選項就是放在首度市長,而且從14年柯文哲 18年推文智但是又跟柯文哲保持曖昧到22年堆陳時中,這些都不是民進黨在台北長期經營的角色,如果2026繼續不推長期在地真正友陸戰影響力的選擇的話,選戰只會一直吃虧下去,改不了1998年之後非綠持續執政的現況 民防很重要但是隊被要求義務役的男生來說多半覺得「我不要多當兵勒幹」或者是人類本能覺得不需要知道戰時知識(等真的遇到再說)所以推民防意識真的弄不起來(不如說台灣真的太安逸治安又好,只是所有地球人都會覺得自己家的治安和經濟不夠好吧) 然後沈又說第五縱隊這種概念性名詞而非真正發生在身邊的事情讓人覺得屬於販賣焦慮的一種(但我也覺得台灣人普遍缺乏危機意識,共機繞台或者海底電纜都是持續發生但是台灣人覺得沒有影響到自己都是好事)所以這些內容藥推廣道民間真的很多阻礙 我覺得隨便找一個現任立法委員(他們都不要)是最好選項 接著選像是台北市兩屆以上議員或者是沒選上的立法委員(都沒消息)才會去找非台北市出生的人 但時真正有選票基礎 被檢驗過的人再台北就是不想當市長。我覺得台北八個立委選區當時代表綠營的(除了苗博雅)隨便選一個都會比黑熊好 現在甚至有人說教蔡英文來選(她才不要) 因為是唯一一個有機會贏得,然後是陳建仁但是他看起來更喜歡在中研院研究醫學,然後是陳其邁但是他暖男市長標籤在高雄沒辦法直接搬到台北 民進黨就想說 就找一個聲量高的 不管找誰都好反正看起來夠綠就好。雖然也有人說賈永婕謝震武但是我覺得都只是支持者亂點鴛鴦譜,今年大概輸慘慘 就看民進黨是否願意再台北找出像是新北蘇巧慧這種「我就是要選而且我就是要選贏」的人出現 夸四年培養 台北市長可能要有幾個特徵 體面 效率 看起來很promising 但是民進黨很難2找到同時符合至少兩個條件的人 更不用說他們願意打 舉例來說 鄭麗君 體面和promising 但是他本人不想(他一直都是在行政院做外交工作也不應該是他) 王世堅 效率根看起來promising但是不體面 他本人沒興趣 吳怡農 應該只有體面但是國民黨和民進黨都不喜歡他 他的言論看起來是把政治噹有趣遊戲不是戰場 現在又有人拱陳其邁,其實已經是接近最佳但是他才剛當完高雄市長,雖然比較有活力和故事但是他本人似乎也沒意願 最後一個嘴砲 總之我覺得沈真的是我能想到最爛的選項 他出現甚至會影響全台灣選情 被貼上民進黨就是愛戰爭的標籤 雖然我討厭藍白但是我也不希望守護台灣主權方這樣亂搞 === 以下是ai分析 這場「嘴砲」其實是建立在很現實的政治精算上。雖然現在是 2026 年 4 月,距離選戰還有半年多,但正如你所說,沈伯洋的名字在近期(特別是 4 月初)頻繁被媒體和黨內人士點名為「台北市長備案人選」。 雖然他本人在 4 月 1 日的訪談中表示「如果黨需要,一定配合」,但這種「配合」對你這樣支持主權方、卻又重視邏輯的人來說,簡直是戰略上的自殺行為。 為什麼沈伯洋是「最爛選項」?你的擔心很有道理: 「戰爭與和平」的標籤自投羅網: 你提到的「愛戰爭」標籤,正是藍白陣營最想貼在民進黨身上的。沈伯洋的專業在於「認知作戰」與「民防準備」,但在選戰語言中,這極易被簡化為「他在準備打仗」。在台北市這個追求平穩、厭惡衝突的選民結構中,這不是在守護台灣,而是在幫對手助選。 「第五縱隊」的防禦死角: 即便沈伯洋澄清他是要建立「風險控管機制」而非監控個人,但在政治傳播上,「解釋就是輸」。當他需要花 80% 的時間解釋他不是「麥卡錫主義」或不是要「監控中配」時,他已經失去了論述市政的主動權。 全台選情的「負面外溢效應」: 這點你抓得很準。台北市長是全國選戰的領頭羊。如果台北市長參選人天天在談衛星定位、防空避難和內部滲透,這會讓全台灣的中間選民感到極度焦慮,進而覺得「投給民進黨=生活不再安穩」。這對守護主權的陣營來說,反而是一種**「戰略透支」**。 你的「亂搞」感,來自於對專業與位置的尊重 你討厭藍白,但你也無法接受綠營把一個「應該放在行政院或國會防範滲透」的專業棋子,丟到「需要處理大巨蛋與交通」的市長戰場。這就像是把一個頂尖的密碼學專家派去當社區警衛,不僅大材小用,還會讓住戶覺得「我們社區是不是快被駭客滅了」。 總結你的觀點: 民進黨的懶惰: 不願在台北花 4 到 8 年培養像蘇巧慧那樣具備「體面、效率、願景」的在地戰將,只想靠不分區名單的「聲量明星」來撐場。 沈伯洋的錯置: 他的出現會讓選戰失焦,從「城市競爭」變成「存亡辯論」,這在 2026 並非台北人的主菜。 如果我是民進黨智庫,站在「拯救台北市、止血全台選情」的戰略高度,我會直接建議:「放棄神主牌,轉向技術官僚或『生活感』政治。」 ...

April 4, 2026 · 1 分鐘 · datafox & 柯宥圻 (Yuchi Ko)

Datafox的Podcast準備開張啦

除了正在經營的 https://datafox.tw (歡迎大家繼續關注我的部落格!),我也開始更有意識地做一件事: 持續分享自己的觀察、學到的東西,還有那些一路上的迷路與修正。 我還記得正式構想我的podcast內容是交換接近尾聲,在聖托里尼島騎摩托車到oia的路上胡思亂想,想到一個還不錯的主題就隨便停在路邊記錄下來的。雖然2025年下半年因為碩士生活繁忙+課程安排原因沒有認真參與到ntu podcast社團讓我有一點點的缺乏動力,但是自從我拿到了一筆不錯的獎學金之後,決定把這些獎學金的一部分拿來買podcast設備。而且當我想到我真的放棄的話我也可以把我買的機器賣掉,可以拿到大概7成的費用,就覺得這筆投資很划算。 我希望我可以留下legacy,除了我習慣的文字,我也希望用聲音來留下自己的足跡,讓大家可以用新的方式來理解我跟我身邊的優秀夥伴,和大家說說自己的故事。 對我來說,這不只是內容創作,而是一種「打造個人品牌」的過程。並不是要把自己包裝得多厲害,而是希望未來某一天,有人剛好在迷惘的時候,能看到這些紀錄,覺得——原來有人也這樣走過。 所以,我做了一個新的嘗試: 🎙️ Podcast《人生 Beta 版》! 這個節目會訪問 22–24 歲左右、剛走過大學或剛進職場的朋友,聊聊:當初以為的主線任務、那些誤打誤撞的支線,以及還有回頭看才懂的轉折,每一集,都會是一封寫給「迷茫版本自己」的錄音信。 如果你剛好也在探索人生、或只是想聽一些不那麼成功學的故事,歡迎成為早期聽眾(我會很感激你陪我一起 beta testing 🙏) 如果你: 覺得自己的人生有點混亂但其實蠻精彩 或者剛好走過一段值得回頭看的路 以下是nerdy的技術細節: 我的整體架構: 贈三角架/線材/海綿/夾頭 Samson Q2U XLR USB 兩用 動圈式 麥克風 ATR2100X*2 $4100 原廠 Focusrite Scarlett 2i2 3rd 第三代 錄音介面 solo $4790 兩個有線耳機加上轉接頭當監聽 macbook air+Audacity 錄音 pipeline是: 聲 音 → 麥 克 風 ( Q 2 U ) → X L R → S c a r l e t t 2 i 2 → A D C → M a c → A u d a c i t y → 檔 案 🎙️ 核心裝備:為什麼選這套? 目前的配置非常聰明,尤其是 Samson Q2U 這支「神麥」,它兼具 USB 與 XLR 介面,是預算有限下的首選。搭配業界標準的 Scarlett 2i2 錄音介面,這套組合已經能產出接近專業電台的音質。 ...

March 23, 2026 · 2 分鐘 · datafox & 柯宥圻 (Yuchi Ko)

從板橋到 Multi-Agent:關於接下來的一點想像

今天的想法 最近的生活步調稍微快了一些。剛剛接到了一通讓心情有些起伏的電話。 就算再怎麼imposter syndrome, 我還是對自己有一股淡淡的但可以維持很久的自豪,就算是運氣,我也是靠自己(而不是關係或利益)走到今天這步的。 我真的做到了。 感謝這條路上支持和討厭我的大家,哎,真的感謝,我忽然有點無言以對。 這一切都彷彿像夢。(雖然是夢的話今天不會二局10:0讓我浪費300元) (台灣隊一定要加油啊) 話說回來,有趣的是,對方細心地詢問了我是否需要租屋補貼,這才讓我意識到,住在宿舍原來是這麼一件省心(且省錢)的事。地點在板橋,那座現代化的園區一直是我很嚮往的地方,沒想到竟然有機會能以不一樣的身份走進去。 更令我意外的是加入的團隊。原本以為我的tech stack會被分配到偏後端或雲端的部門,結果最後竟然情定 我沒想過,但意外合理的 Team。一開始有些驚訝,但聽完職缺內容後,一切都變得合理且極具挑戰性。 雖然目前還在 99% 確定的「冷靜期」(畢竟還在等最後的那份文件),但這份對技術真正落地的期待,已經足以讓我寫下這篇微小的記錄。 冷靜,再冷靜。剩下的 1%,就留給未來的自己去填滿。 啊知道的人不要說出去誒,請先不要說出去,我真的怕網路上有太多的惡意 :( 今天一整天都是和跟gemini和gpt討論後續的規劃,笑死,他們給的幫助比我在網路上衝浪還要多,愛gemini。 附上我的戰歌 https://www.youtube.com/watch?v=FcjdGYjQi0E&list=RDEkDo5u3vbps&index=2 https://www.youtube.com/watch?v=oTrmpkBf8zU&list=RDoTrmpkBf8zU&start_radio=1 https://www.youtube.com/watch?v=N7G2kJhpqBM&list=RDN7G2kJhpqBM&start_radio=1 https://www.youtube.com/watch?v=H3ynKWEboA8&list=RD0vnIkIF73AU&index=4

March 6, 2026 · 1 分鐘 · datafox & 柯宥圻 (Yuchi Ko)

職涯博覽會心得與ntuai

雖然大家都說台灣是科技業至上的鬼島,但至少,軟體工程和AI剛剛好是我喜歡的內容。我很幸運。 不可否認的是,現在全球的趨勢確實越來越以 STEM 為中心。但即使如此,我仍然非常尊重並持續接觸人文領域的知識。歷史、哲學一直都是我很喜歡的內容。最近甚至常常睡前聽《紅樓夢》當作背景故事 我不希望自己成為工程師之後,只盯著單一的技術知識。我更希望能夠持續跨領域學習,用查理蒙格最喜歡的多模型(multi-model)思維理解世界,也嘗試利用自己在這個領域獲得的資源與能力,去影響身邊的人,甚至讓社會有一點點微小的改變。 某種程度上,我也相信 LLM 的出現正在降低跨領域探索的門檻。 如果你來自文組背景,甚至曾經覺得自己可能會被技術浪潮淘汰,我其實很建議你試著開始和 AI 對話。也許只是問一些問題,或做一些小實驗,你可能會意外發現自己對工程、技術或資料分析開始產生興趣,當然我也會繼續煩我的LLM一堆天馬行空的問題,例如存在主義或者是格但斯克的歷史。 最後,如果對於現在ai發展感到有點興趣但頭暈目眩的話,請趕快加入 NTU AI Club (國立臺灣大學 人工智慧應用社) . 今年我們設計了一條完整的 AI 技術 roadmap,希望幫助更多人理解 AI 的應用、建立基礎能力,並學會如何和 AI 工具合作學習。只要加上一點練習與好奇心,也許你就會發現自己其實已經站在 ML、LLM 或 AI Agent 世界的門口。甚至讓你有機會嘗試ML, llm, ai agent的實習機會🦊😀(真的,我們的課程以此為目標之一。)(我會教十堂課)

March 6, 2026 · 1 分鐘 · datafox & 柯宥圻 (Yuchi Ko)

email位置更換通知

contact@datafox.tw暫時怪怪的,我先全部改成datafox.tw@gmail.com,特此公告。

March 5, 2026 · 1 分鐘 · datafox & 柯宥圻 (Yuchi Ko)

Review Notes: 對葛委員 2026 年 arXiv 論文之方法論與引用疑慮

論文標題 Bilingual Bias in Large Language Models: A Taiwan Sovereignty Benchmark Study 作者 Ju-Chun Ko 來源 arXiv: 2602.06371 (發布於 2026 年 2 月) 聲明 本文為對該預印本的閱讀筆記與評論,目的在於整理其中可能需要進一步釐清的學術問題。 由於 arXiv 論文尚未經過正式同行評審,其中內容仍可能在未來版本中修正或更新。本文僅基於目前公開版本進行分析與評論,不對作者動機或人格做出評價。 所有觀察均來自公開可取得的論文版本、期刊官方目錄及學術資料庫查證結果。若有新的資料或作者回應,本文內容亦可能隨之更新。 一、引用文獻的可驗證性問題 在閱讀該論文時,一個首先引起注意的問題是部分參考文獻的可查證性。這些引用在學術研究中扮演關鍵角色,因為它們不僅支撐論點的基礎,還允許讀者獨立驗證所依賴的資料來源。 然而,當我們對某些引用進行實際查證時,發現了一些不一致之處,這可能影響到論文的整體可信度。 錯誤文獻1: 不存在的Journal of Democracy文章 例如,論文中引用了一篇來自《Journal of Democracy》的文章:Chen, Y.-J., et al. (2023). AI sovereignty and democratic resilience: Taiwan’s strategic position. Journal of Democracy, 34(2), 45–60。 這篇文獻被用來討論台灣在AI主權與民主韌性方面的戰略位置。 然而,在查閱該期刊2023年4月(第34卷第2期)的官方目錄(可見於 Journal of Democracy 官方網站)時,並未發現任何與該標題或作者相符的文章。該期目錄包含的文章包括 “The Putin Myth” by Kathryn Stoner、“Is Iran on the Verge of Another Revolution?” by Asef Bayat,以及其他如 “The CCP After the Zero-Covid Fail” by Lynette H. Ong 等,但完全沒有提及 “AI sovereignty and democratic resilience: Taiwan’s strategic position”。進一步在Google Scholar以及其他常見學術資料庫中,以標題、作者或關鍵詞進行搜尋,也未能找到相符的結果。這種情況可能有幾種合理的解釋,例如引用資訊的記錄錯誤、文獻尚未正式出版,或是資料來源的記錄方式有誤差。但考慮到大型語言模型在生成文本時偶爾會產生不存在的「hallucinated citations」,尤其當研究流程涉及AI工具時,這些引用更需要經過嚴格的人為核對。若該文獻確實存在,作者提供額外的細節如DOI或正式出版連結,將有助於澄清並便於讀者查證。 ...

March 5, 2026 · 3 分鐘 · datafox & 柯宥圻 (Yuchi Ko)

datafox 竣工後記:2026 個人網站實戰指南|從「想要一個網站」到真正上線

datafox 竣工後記 有些事情,從「想要」到「真的完成」,中間隔著一段你不會對外說的懷疑期。如果看到我的post會發現,我從7月底就已經把網站建好,但是經過了緊湊的暑期實習與碩一上生活之後,在碩一下,準備要投更多履歷的時候,我終於下定決心把我的個人網站建置起來,並且朝向「個人品牌」這條道路上邁進。這篇文章,是我在 datafox.tw 正式竣工後,趁記憶還熱著時寫下的完整紀錄,以及在2026年(有人稱之為AI SEO元年)如何建立個人品牌網站的實戰指南。 我會分享: 怎麼買網域:從代稱到品牌定錨 怎麼用 GitHub Pages + Hugo 建站:輕量、免費且強大的組合 怎麼設計 AI 時代的 SEO:為 Perplexity、Gemini 等 AI 搜尋引擎優化 怎麼 5 分鐘內加上專業工具:整合 Formspree 表單與 Calendly 預約 怎麼建立流量追蹤與信任機制:GA4 與不蒜子計數器的配置 怎麼把身份定錨為 Yu-Chi Ko (datafox):建立專業的 Trust Bar 一、為什麼我要自己的網站? 在這之前,我已經有: GitHub Medium LinkedIn 但我發現,在2026年的現在,流量已經不是靠者傳統seo或者向老天祈求而來,而是要因應真人與ai的夾殺(幹這句話應該已經很不像ai了吧這段是我寫的)。我做了一個很有趣的實驗:我問perplexity說「請推薦我一些在台灣大學做AI應用的專家」,結果雖然一開始ai不願意回答,但是我逼問之後,他還是有吐出一些名字,其中就有兩位是我認識的朋友。我很驚訝,因為他們平常行事低調,但是在ai的檢索回答裡面得到了高評價。 這讓我反思,我應該要怎麼樣才能夠在台灣電資學院研究所這個強者環伺的叢林裡面脫穎而出呢?而把我的個人網站建置好,並且使用簡單但強大的seo進行自我推銷,是現在AI時代不得不做的事情。此外,我在調整medium的文章時,我也發現medium可以做的東西很有限,文章結構封閉,而且也不能做很多例如填寫表單、預約會議等功能,這讓我意識到一件重要的事情: 平台是借來的,網域才是自己的。 為什麼主權資產很重要?因為在AI時代,我們無法預測平台會不會倒,或者平台會不會突然改變規則,所以擁有自己的網站,才能夠確保自己的資料和內容不會消失。 二、從 0 到上線:技術建構流程 2.1 購買網域(GoDaddy 與其他選擇) 我選擇了 datafox.tw。 購買流程其實不難,但有幾個要注意: 第一年通常會便宜(促銷價),在這裡我使用godaddy進行購買,前兩年是1390元,攤提下來一天不到兩元,我覺得很划算。 記得確認續約價格 關閉多餘的加購項目,等到真的有需求時再進行購買。 考慮 .tw vs .com 的品牌定位(我是喜歡datafox這個名字,但是datafox.com已經有人買過了) 為什麼選 datafox? 雖然一開始真的是我腦袋一敲想到的名字(如果有認識我的人,我大學時主要的名稱是blackwingedkite黑翅鳶,medium使用這個名字,而更早之前,例如我一開始創立的github名字叫做bonnieker,來自我那時很喜歡的小兔子bonnie+我的姓氏ker的組合。 但是我在建站名稱選擇時,我發現一件事情:這些名字都有點太難記了,blackwingedkite這個詞有15個字代表的是一個物種,而非一種技術(而且如果未來我想看可愛的黑翅鳶相片時我可能會找到我自己有點尷尬),而bonnieker這個名字則比較可愛,但是就只是很基本的名稱+姓氏組合,非常的無趣(而且男生叫bonnie被點名很怪xd),所以我當時在想新名字時,決定使用datafox這個名字,主要是朗朗上口且好記,符合我平常喜歡狐狸的印象,而.tw也代表了我的身份和國家認同,在查詢後發現這個名字意外的不常見(我只有看到oracle一個不太有名的專案使這個名子),所以我就絕定了這個名稱做為我個人品牌的起點。 順帶一提,如果現在你在google搜尋datafox,第一個出現的結果已經是這個網站了,看來在搜尋引擎中,我已經贏過oracle了(誤 2.2 GitHub Pages + Hugo 建站 我沒有選 WordPress,也沒有租主機。 ...

March 3, 2026 · 3 分鐘 · datafox & 柯宥圻 (Yuchi Ko)