發表文章

目前顯示的是 3月, 2026的文章

又多一款好用備案!Vibing 免費即時語音轉文字工具實測分享

圖片
為什麼我還是會一直關注即時語音轉文字工具? 過去這段時間,我曾經在部落格上跟大家介紹過不少即時語音輸入、AI 語音轉文字的工具。 對我來說,這類工具真的不嫌多。 原因很簡單。這種工具有時候會臨時失效,有時候免費額度一下就用完。多準備幾套順手的工具,平常切換起來會更安心。 過去我介紹過的一些商用工具,像是 Wispr Flow 、 Typeless ,整體表現其實都很不錯。 不管是轉寫速度、即時翻譯,還是後續的條列整理、分段排版,很多都做得很成熟。甚至有些工具還會加上語音助理的功能,用起來確實很方便。 不過,商用工具畢竟還是要考慮成本。 就算有些服務每個月提供 2000 字、4000 字,甚至有些現在已經提高到 8000 字的免費額度,對重度使用者來說,還是很可能不夠用。 當然,本地端其實也有不錯的選擇。像 Handy 我自己就蠻常用的。 不過純本地端的語音轉路工具,如果電腦沒有獨立顯卡,只靠 CPU 來跑模型,等待時間通常就會比較長。這件事情其實很殘酷。語音轉文字的品質、模型大小、等待時間,很多時候就是要自己去抓一個平衡。 Vibing 是什麼? 而我這兩天又看到一款新的開源工具,叫做 Vibing 。 它主打的也是即時語音轉文字,而且它背後採用的,是 Microsoft 最近開源的 VibeVoice 模型。 VibeVoice 本身是一個自動語音辨識模型,也就是常說的 ASR(Automatic Speech Recognition)。根據目前公開的資料,它支援超過 50 種語言,也強調可以一次性處理長達一小時的語音內容。 這一點為什麼值得注意? 因為傳統的語音辨識模型,很多時候需要先把音訊切成很多小段來處理。這樣做不是不行,但有時候前後文就比較容易斷掉。如果模型本身可以一次看更長的語音內容,那在整體語意理解、一致性判斷,甚至講者追蹤上,理論上都會比較有優勢。 根據官方介紹,VibeVoice 除了長音訊處理之外,也支援時間戳、講者區分、內容結構化,還有熱詞標記等能力。 講白話一點,它不只是把聲音轉成文字而已,而是希望把整段語音內容整理得更完整、更有脈絡。 安裝方式很簡單 而現在開源社群已經把這個模型包裝成一套可以直接使用的桌面工具,也就是我這次想介紹的 Vibing。 目前 Vib...

為什麼文件轉成 Markdown 會更適合 AI?我的 Universal Markdown 極簡轉檔器實作分享

圖片
好一陣子沒來部落格發文了,感覺我的網誌都快長草了。 三月這段時間,我一方面在準備外部邀約授課,另一方面也花了不少時間在研究 AI agent、Agent Coding,以及把自己手上的 AI 工作環境整理得更有系統一點。也因為這樣,這陣子比較少輸出內容。如果你是平常有固定在看我文章的朋友,這邊先跟大家說聲不好意思。 不過,換個角度看,這段時間雖然發文變少,但其實不是停下來,而是把不少時間拿去做一些更底層、但我覺得長期會很有幫助的事情。今天想跟大家分享的,就是這段時間我自己做出來的一個小工具: Universal Markdown 極簡轉檔器 。 這不是什麼很炫的大型專案,也不是那種只有工程師才會用得到的工具。它解決的其實是一個很實際的問題: 當我們想把各種文件丟給 AI 讀取時,怎麼做會更有效率、更省成本,也更好用? 為什麼我會開始在意「文件轉成 Markdown」這件事? 最近這段時間,我花了不少時間在接觸各種 AI 協作工具。除了先前提過的 Google Antigravity 之外,後來也陸續摸了 OpenAI 的 Codex、Anthropic 的 Claude Code,還有最近非常多人在討論的 OpenClaw(俗稱龍蝦)。 用久了之後,我有一個很明顯的感受:不同平台、不同模型,各自都有強項。實際在用的時候,常常不是只選一個工具打天下,而是會根據需求、成本、API 串接方式、模型特性,去做比較靈活的配置。 而在這些 AI 協作流程裡,有一個場景其實非常常出現,就是: 我要把我手上的文件提供給 AI 參考。 這些文件有很多種。最常見的像是 Word、PDF、Excel、PowerPoint,有時候也會有 TXT、CSV、JSON 這類比較偏純文字的資料。問題是,這些格式雖然對人類使用者很熟悉,但如果直接拿來給 AI 讀,未必是最有效率的方式。 也因為這樣,我開始認真思考一件事:如果我能先把這些文件整理成 Markdown ,是不是會更適合拿來餵給 AI? 為什麼 Markdown 對 AI 更友善? 這件事如果用白話來講,會比較好理解。 1. 很多富文本格式,對 AI 來說其實有不少雜訊 像 Word、Office 文件,甚至很多 PDF,底層都不是單純只有文字而已。裡面通常還包了很多排版資訊、樣式設定、結構標記,甚至還有圖片、...

企業內訓授課:從提案到結案,專案管理其實是每天都在用的基本功

圖片
今年很榮幸再次受邀,前往國內一家大型醫學編輯與整合行銷公司,為業務團隊進行企業內訓。 和 2023 年那次系列課程不同的是,這一次我特別重新客製化設計了一整套 五大主題 的培訓內容,希望更貼近他們現階段的工作型態與實際挑戰。主題涵蓋了 專案管理、時間管理、業務開發、客戶管理 .... 等不同面向,不只是談觀念,而是希望學員聽完之後,隔天回到工作現場就能真正用得上。 而今年三月率先登場的第一堂課,正是我自己也非常重視的一個主題: 專案管理:從提案到結案 這堂課對我來說,感受其實頗為特別。 因為它是一堂我自己實踐了很多年,但過去從來沒有完整對外講過的課。 以前我常常把專案管理的概念,拆散在不同場合、不同主題裡面分享;但這次,我第一次試著用一整個半天的時間,從頭到尾帶大家走過一次專案管理的完整邏輯。 而且這次我也刻意不想把它講成一堂「很多名詞、很多理論、聽完好像很厲害但回去不一定會用」的課。 我更想做的是,把這些平常看起來很抽象的概念,透過 案例、互動、分組討論、遊戲化操作 的方式,讓學員在具體演練的過程中慢慢理解: 專案管理,其實不是高高在上的管理術語,而是每天都在發生的工作日常。 專案管理,不只是流程,而是思考順序 這堂課一開始,我們先從最根本的問題談起: 到底什麼叫做「專案」? 很多人每天都在忙,也每天都在處理很多事情,但不是所有工作都叫做專案。 真正的專案,通常會有幾個很重要的特徵: 有明確的開始與結束時間 有具體目標與可衡量成果 有明確的交付內容 有需要被協調與被管理的利害關係人 有時程、品質、成本、風險等限制條件 當這些條件同時存在時,你處理的就不只是「一件事」,而是一個需要被好好管理的專案。 所以在課堂裡,我也帶著大家一起拆解專案常見的 五大流程階段 : 啟動 規劃 執行 管控 結案 很多專案之所以後面越走越亂,不一定是執行的人不夠努力,而是前面幾個步驟根本沒有站穩。 一開始如果沒有先把需求、目標、角色、時程、資源想清楚,後面做得再快,也常常只是更快地走偏。 收到客戶需求之後,真正重要的是先「收斂」 這堂課裡,我自己特別重視的一段,是在談: 當收到一個看似很急、但其實還很發散的需求時,到底該怎麼辦? 因為真實世界裡,很多專案都不是從一份邏輯清晰...

Google Antigravity 實戰:我如何用 Vibe Coding 打造記帳軟體一鍵匯入工具

圖片
228 連假,我沒有只是「玩 AI」,而是真的拿它來解決生活中的麻煩事 這幾天是 228 連假。 連假對很多人來說,也許是休息、追劇、出門走走的時間;但對我來說,這次反而是一個很適合拿來做點實驗、把生活中一些長期卡著的小痛點真正解掉的空檔。 所以這次連假,我做了一件我自己覺得很有意思的事: 我試著用 Google Antigravity ,打造一個可以讓我的記帳軟體一鍵匯入資料的小工具。 這不是什麼很炫的大型專案,也不是什麼要拿來創業的產品。 它其實就是一個非常生活化、非常個人化,但又真的困擾我很久的小問題: 我想把平常隨手記下來的記帳文字,快速整理後,直接匯入我用了很多年的本地端記帳軟體。 如果這件事做得成,後面每一次整理記帳資料,我就不需要再土法煉鋼、一筆一筆慢慢手動輸入。 而我這次最想分享的,也不只是「我做出了一個工具」這件事本身。 我更想講的是: 在現在這個 AI 時代,所謂的 Vibe Coding,真的已經開始從「看起來很潮的名詞」,慢慢變成一般人也能拿來解決自己生活問題的實用能力。 尤其像我這樣並不是本科系出身、也不是職業工程師的人,過去如果聽到「自己做一個小工具」,第一時間大概會想到很難、很多語法、很多環境設定、很多除錯,然後就先退三步。 但這次我反而更強烈地感受到: 現在真正最重要的,已經不再只是你會不會寫 code,而是你能不能清楚知道自己的問題是什麼,並且把你要的結果講清楚。 工具,AI 會幫你做。 但方向,還是要你自己來定。 這也是我這篇文章真正想談的主軸。 我為什麼會想做這個工具?不是因為想炫技,而是因為記帳這件事真的太花時間了 先講結論: 我這次會想做這個工具,真的不是為了炫技,也不是因為突然想學寫程式,而是因為 我真的受夠了每隔一兩週就要花很多時間把記帳資料重新整理一次。 我自己已經記帳記了非常多年,差不多快 20 年。 我長期使用的記帳軟體叫做 MoneyAssistant (2.27版) 。這套軟體其實已經是將近20年很老的工具了,作者也早就沒有在維護,但因為我真的已經用得非常習慣,而且資料也累積很多年,所以我完全沒有想要換掉它、也沒有想重新搬移資料庫。 它的優點其實很明確: 完全本地端 免費 分析功能很完整 可以把收入、支出、資產、負債整理得很清楚 視覺化圖...