OpenLess Unbound 實測:Typeless 免費開源替代方案,補上繁中本地化與 Provider 自由度
前一篇文章我才剛分享過 Codex 全域語音輸入實測。那篇文章的重點其實很簡單:語音輸入工具要真的好用,除了模型聽不聽得懂,還要看它能不能出現在我真正需要打字的地方。
因為我平常不會只在 ChatGPT 網頁裡講話。我可能在寫部落格、回訊息、整理筆記、填表單、寫 GitHub issue,甚至是在跟不同 AI 工具互動。這時候,如果語音輸入只能卡在某一個平台裡,其實就很可惜。
過去我也陸續實測過 Wispr Flow、Typeless、Handy、Vibing 這些工具。老實說,如果只看整體功能完整度、回應速度、輸出品質和使用體驗,目前我覺得商用工具裡面最成熟的仍然是 Typeless。
Typeless 讓我最有感的地方,是它已經超過「語音轉文字」的範圍。它比較像是一個語音寫作工作站。你可以講一段比較口語的內容,讓它幫你整理成比較像人會貼出去的文字。它也有語音編輯、即時翻譯、即時搜尋和更完整的工作流。
不過 Typeless 畢竟是商用軟體。它很好用,但不是每個人都想訂閱,也不是每個人都想被綁在同一個平台或額度裡。
所以我後來一直在找一個問題的答案:
有沒有一套免費、開源,而且使用體驗能接近 Typeless 的替代方案?
目前我實測下來,OpenLess 是我看到最接近這個方向的專案。而這次我花了一段時間研究原始碼、測試、修改、打包並公開的 OpenLess Unbound,就是基於 OpenLess 做的一個 fork,重點是修改了幾個我實際使用時想解放的限制。
OpenLess 為什麼值得注意?
OpenLess 本身不是我從零開始寫的軟體。它是由原開發者維護的一套開源語音輸入工具。原版 OpenLess 已經把很多重要功能做出來了,這點我覺得非常值得肯定。
如果用白話講,OpenLess 的基本流程是這樣:
- 按快捷鍵開始錄音。
- ASR 模型把語音轉成文字。
- LLM 語言模型再幫你做文字後處理。
- 最後把整理好的文字插入到目前游標所在位置。
這個流程用講的聽起來都很簡單,但真正要做得順並不容易,背後需要很多程式腳本上的同步運作。
因為一般語音轉文字工具常常只給你一段原始逐字稿。問題是我們平常講話不會像寫文章一樣完整。我們會停頓、重複、改口、漏標點,講到一半又補一句。這些內容如果直接貼出去,常常還要自己再手動整理潤色一次。
OpenLess 比較接近 Typeless 的地方,是它會在轉文字之後,再交給 LLM 做 AI 後修飾。這樣就可以把一段口語內容整理成比較像正式文字的結果,例如有標點、有分段、有條列,甚至可以依照不同風格改寫。
四種輸出風格,讓語音輸入更像寫作工具
OpenLess 原本就內建幾種輸出風格,這點我覺得是它很接近 Typeless 的原因之一。
目前常用的風格包含:
- 原文
- 輕度潤色
- 清晰結構
- 正式表達
這幾個風格不是單純改幾個字而已,背後其實就是不同的 prompt 設計。
舉例來說,如果我只是要快速回訊息,可能用「輕度潤色」就好。它不要幫我改太多,只要把語氣整理得順一點。
如果我是要口述一段文章大綱,那我可能會用「清晰結構」。這樣它會比較願意幫我分段、列點,把原本比較散的口語整理成可以繼續編輯的內容。
如果是要寫比較正式的信件或文件,就可以改用「正式表達」。
所以這幾個風格的價值,在於它已經把「語音輸入」往「語音寫作」推進一步。
即時翻譯與劃詞追問,讓它更像 AI 助理入口
OpenLess 另一個我覺得很有潛力的地方,是它也不侷限於一般語音輸入。
它也有即時翻譯和劃詞追問。
即時翻譯的使用方式不複雜。你可以先設定工作語言和目標語言,錄音時透過快捷鍵觸發翻譯,最後把翻譯結果插入目前的文字框。對需要回英文訊息、整理英文筆記,或把中文想法快速轉成英文的人來說,這個功能很實用。
劃詞追問則更像是一個小型 AI 助理。你可以在任何 app 裡選取一段文字,叫出浮窗後直接針對這段文字提問。這個方向很像 Typeless 後來強化的路線:讓語音從輸入工具,延伸成操作 AI 的入口。
當然,這裡也要先講清楚:OpenLess 的劃詞追問目前沒有調用外部 tool 或瀏覽器搜尋的流程。換句話說,它不會真的幫你即時上網查匯率、天氣或新聞。它比較適合針對你已經選取的文字做解釋、整理、改寫與延伸提問。
但即使如此,對於整理一段文字、解釋一段內容、幫忙改寫或延伸問題,這個功能已經很有價值。
BYOK:自帶 API Key 的彈性
OpenLess 對我來說還有一個很重要的優點,就是它走 BYOK,也就是 Bring Your Own Key。
講白話就是,你可以接自己的 API。
這點對一般使用者不一定馬上有感,但對我這種平常會測很多模型、很多 provider 的人來說,差很多。
商用工具的好處是開箱即用,但限制也在這裡。它的模型、額度、路由、功能怎麼開,很多時候都要看官方安排。
BYOK 的好處是,我可以自己決定要用哪個 ASR 模型做語音轉寫,也可以自己決定要用哪個 LLM 做後處理。速度、品質、成本可以分開考量。
例如日常語音輸入,我可能比較重視速度和低延遲。可是劃詞追問,我可能比較重視回答品質和推理能力。這兩個需求其實不一定要用同一個模型。
這也是後來我會做 OpenLess Unbound 的原因之一。
原版 OpenLess 我實際遇到的限制
OpenLess 原版已經很不錯,但我實際安裝使用後,遇到幾個對我來說蠻關鍵的限制。
第一個是劃詞追問。
我原本想測這個功能,但它當時跳出缺少火山 ASR 憑證的錯誤。問題是,我平常並沒有使用火山 ASR。我比較常用的是 Groq Whisper、OpenAI-compatible endpoint,或是透過 Codex OAuth 走不同模型。
火山 ASR 本身不是不能用。官方也有 語音識別 ASR 產品頁 和 帳號註冊流程文件。不過官方註冊流程需要手機號碼接收簡訊驗證,後續若要進一步體驗或購買雲服務,還需要完成帳號實名認證。對沒有中國大陸手機號碼、也沒有對應實名資料的台灣使用者來說,這個門檻就不太適合被設計成預設依賴。
這就有點可惜。
因為一般語音輸入明明已經可以設定其他 provider,可是劃詞追問如果還卡在特定 ASR provider,那對非中國大陸服務使用者來說,就會變成一個很大的門檻。
第二個是劃詞追問的回答模型。
我實際使用後覺得,一般潤色模型和劃詞追問模型最好可以分開。原因很簡單:它們的任務不一樣。
一般語音輸入常常只是把我講的口語內容變成順一點的文字。這時候我希望速度快、延遲低、不要太貴。
但劃詞追問比較像問答與推理。它可能要理解我選取的文字,還要接著我的問題做整理、解釋、延伸。這時候我反而願意用品質比較好的模型。
第三個是 Windows 繁體中文輸入法問題。
原版 OpenLess 安裝後,Windows 會多一個 OpenLess Voice Input 輸入法。但我當時看到它被放在「簡體中文(中國)」底下。對台灣使用者來說,這件事很容易干擾平常使用繁體中文注音輸入的習慣。
尤其我平常會用 Shift 在英文與繁中注音之間切換。如果語音輸入後系統被帶到簡中輸入法,那日常使用會很卡。
這裡牽涉到 Windows TSF 輸入法 profile 註冊語系,已經超過單純介面翻譯的範圍。
所以我做了 OpenLess Unbound
OpenLess Unbound 是我基於 OpenLess 做的 fork。
我沒有想把它包裝成完全不同的軟體。它的基礎仍然是 OpenLess,也保留原開發者資訊與上游來源。這點很重要,因為原專案已經完成很多底層工作,包含跨平台介面、錄音流程、ASR、LLM 後處理、快捷鍵與 Windows 插入後端。
OpenLess Unbound 的重點,是針對我實際使用遇到的限制做補強。
這次主要改了幾個方向:
- 劃詞追問不再強制依賴火山 ASR。
- 劃詞追問回答模型可以獨立設定。
- Windows TSF 輸入法 profile 改為繁體中文台灣。
- App identity 改成 OpenLess Unbound,資料夾也獨立。
- 劃詞追問回答可以選取局部文字複製,也可以一鍵複製整則回答。
- 同步部分上游 OpenLess 1.3.6 beta 改善。
GitHub 專案位置在這裡:
https://github.com/taoyutsun/openless-unbound
目前 release 版本可從這裡下載:
Unbound 解決了哪些核心限制?
第一個是劃詞追問 ASR。
OpenLess Unbound 讓劃詞追問可以跟隨目前已設定的 ASR provider。也就是說,如果你平常語音轉寫用的是 Groq Whisper 或其他 OpenAI-compatible endpoint,就不用為了劃詞追問另外去申請火山 ASR。
第二個是劃詞追問的回答模型。
現在你可以讓劃詞追問沿用一般潤色模型,也可以獨立指定 provider、model 與 thinking 設定。這樣就能把速度型模型和品質型模型分工。
第三個是繁體中文 Windows 輸入體驗。
OpenLess Unbound 把 Windows TSF profile 註冊為繁體中文台灣,目標是避免語音輸入後被切到簡體中文輸入法。對我這種平常使用繁中注音的人來說,這個修正非常實際。
第四個是劃詞追問回答可以直接拿來用。
原本問答結果如果只能看,實用性會差一點。OpenLess Unbound 的回答氣泡支援手動選取局部文字,右上角也有複製按鈕,可以一鍵複製整則 assistant 回答。這樣問完之後,如果某一段可以直接放進文章、訊息或筆記,就不用重新打字。
第五個是資料與 app 身分獨立。
OpenLess Unbound 使用自己的 app identity 與資料目錄,預設資料位置是:
%APPDATA%\OpenLess Unbound這樣就可以跟官方 OpenLess 分開獨立測試使用,不會直接覆蓋原版設定。
這次同步了哪些上游改善?
OpenLess Unbound 目前的版本是 v1.3.6-1。
這版除了保留前面提到的 fork 改動,也同步了部分上游 OpenLess 1.3.6 beta 的改善。
比較有感的包括:
- 本地 ASR 模型儲存管理。
- 多螢幕環境下,膠囊提示會跟隨目前輸入所在螢幕。
- Toggle 錄音結束後加入短暫冷卻,降低誤觸後馬上重新錄音的機率。
- 支援 MediaPlayPause 熱鍵觸發。
- Groq / OpenAI Whisper 使用 verbose JSON 過濾,降低靜音或極短音訊被誤判成文字的機率。
最後這一點我自己測試時有感。因為如果錄音太短,有些 Whisper provider 可能會把無聲音或雜訊誤判成像 Thank you. 這類文字。過濾後,這種情況會比較少。
我的個人參考配置
這裡先說清楚,下面只是我的個人配置,不是唯一正解。
我目前會把 OpenLess Unbound 分成三段來設定:
第一段是 ASR 語音轉寫。
我用的是 Groq 的 Whisper large v3。主要原因是速度飛快、延遲低,適合日常即時輸入。語音輸入最怕的是整個節奏被打斷。只要你講完後要等太久,這個工具就很難變成日常習慣。
第二段是一般文字潤色後處理。
我用 Groq 的 openai/gpt-oss-120b。這個模型的優點是回應速度飛快,拿來做一般口語整理很適合。日常輸入通常不需要每一句都用最高品質模型,只要它能把我的口語整理成有標點、有段落、語氣自然的文字,就已經很夠用。
第三段是劃詞追問。
這部分我會用 Codex OAuth 的 GPT-5.5。原因是劃詞追問比較像問答和推理,已經超過文字修飾的範圍。它需要理解選取內容,還要根據我的問題做整理、解釋或延伸。這時候我比較願意用品質更高的模型。
所以我的邏輯很簡單:
- 語音轉寫要快。
- 一般潤色要順。
- 劃詞追問要準。
三個任務不同,就不需要硬綁同一個 provider。
如何安裝 OpenLess Unbound?
安裝方式很簡單。
到 GitHub Releases 頁面下載最新版本:
https://github.com/taoyutsun/openless-unbound/releases
Windows 使用者會看到兩種主要檔案:
OpenLess_Unbound_<version>_x64.msiOpenLess_Unbound_<version>_x64_portable.zip
如果你是要長期日常使用,我會建議優先用 MSI 安裝版。原因是 OpenLess Unbound 有 Windows 輸入法後端,需要透過安裝流程註冊到系統裡。
Portable zip 比較適合短期測試或臨時使用。它不一定能提供跟 MSI 完全一樣的系統層整合體驗。
另外也要提醒,目前這個 build 還沒有 Windows code signing 簽章,所以第一次執行時,Windows 可能會跳出 SmartScreen 或未知發行者提醒。這不代表它一定有病毒,而是 Windows 對未簽章、下載量還不高的新執行檔比較保守。
如果你是公司電腦,或 IT 管控比較嚴格的環境,建議先確認公司政策再安裝。
第一次使用要設定哪些地方?
安裝後,第一個要看的地方是「設定 → 服務」。
這裡主要有兩類設定。
第一類是 ASR,也就是語音轉文字。
你可以依照自己習慣選擇 Groq Whisper、OpenAI Whisper-compatible endpoint、Foundry Local Whisper、Sherpa-ONNX local,或其他支援 provider。
第二類是 LLM,也就是文字潤色、翻譯和問答用的語言模型。
這裡可以設定 Codex OAuth、Groq、OpenAI、Gemini、OpenRouter,或自訂 OpenAI-compatible endpoint。
設定完 provider 後,建議先做一次連線驗證,確認 API key、Base URL 和 model name 都能正常使用。
如果你還不知道可以去哪裡找免費或高 CP 值的 provider,也可以參考我之前整理的這篇文章:想玩 AI Agent 自動化卻怕太花錢?9 個免費與高 CP 值雲端 API 來源一次整理。裡面有一些可以拿來搭配 BYOK 工具測試的 API 來源。
一般語音輸入怎麼用?
一般語音輸入的流程是:
- 把游標放到你想輸入文字的地方。
- 按 Right Ctrl 開始錄音。
- 再按 Right Ctrl 停止錄音。
- OpenLess Unbound 會先做 ASR 轉寫。
- 接著交給 LLM 依照目前風格做後處理。
- 最後把文字插入目前游標位置。
這裡有一個小地方要注意,就是錄音模式。
如果你設定的是「按住說話」,那 Right Ctrl 要按住不放,講完再放開。如果只是快速點一下,音訊太短,可能會顯示「沒有識別到語音」。
如果你比較習慣按一下開始、再按一下停止,可以改成 Toggle 模式。這比較適合長段口述。
詞彙表:讓工具更懂你的專有名詞
我自己很建議使用詞彙表。
因為語音輸入最常出錯的地方,通常集中在專有名詞,而不是一般生活用語。
例如:
- Codex
- Claude Code
- OpenClaw
- Typeless
- Wispr Flow
- 公司名、人名、產品名
- 專案名稱、客戶名稱、藥品名稱、品牌名稱
- 常見中英混合詞或縮寫
這些字如果沒有先放進詞彙表,ASR 或 LLM 很可能會聽錯誤判。OpenLess Unbound 可以把啟用的詞彙送進 ASR prompt 或 LLM prompt,讓辨識和後處理更容易命中。
即時翻譯怎麼用?
即時翻譯的操作大概是這樣:
- 到「翻譯」頁面選擇工作語言與目標語言。
- 用 Right Ctrl 開始錄音。
- 錄音中按一下 Shift 觸發翻譯。
- 再按 Right Ctrl 停止錄音。
- 翻譯結果會插入目前游標位置。
如果目標語言設定為不啟用,Shift 就不會觸發翻譯。
這個功能適合需要快速把中文想法轉成英文訊息的人。像我有時候要先用中文把想法講清楚,再讓 AI 幫我轉成英文,這種流程就蠻順。
劃詞追問怎麼用?
劃詞追問的流程是:
- 按
Ctrl+Shift+;開啟浮窗。 - 在任意 app 裡選取一段文字。
- 按 Right Ctrl 開始錄音提問。
- 再按 Right Ctrl 停止並送出。
- 可以繼續多輪追問。
- 按 Esc 關閉浮窗。
OpenLess Unbound 這裡與原版最大的差異,就是你可以讓劃詞追問使用獨立模型。
例如你平常語音輸入用 Groq 做快速潤色,但劃詞追問改用 Codex OAuth GPT-5.5。這樣就可以兼顧速度和回答品質。
另一個亮點就是問答結果也可以直接複製使用。你可以在回答氣泡裡手動選取其中一段文字,也可以按回答旁邊的複製按鈕,把整則回答複製到剪貼簿。
不過還是要再提醒一次:目前劃詞追問本身不內建即時上網搜尋,也沒有調用外部 tool 的流程。它可以整理你選取的文字,但不會真的即時查詢最新匯率、天氣或新聞。
OpenLess Unbound 適合誰?
我會覺得它適合幾種人。
第一種,是想找 Typeless 免費開源替代方案的人。
如果你已經認同 Typeless 那種「語音輸入 + AI 後處理 + 快捷鍵 + 跨 app」的方向,但暫時不想使用商用訂閱,OpenLess Unbound 可以試試看。
第二種,是已經有自己的 API key 或 OpenAI-compatible endpoint 的人。
這類使用者本來就會希望模型可以自由選,不想被單一平台綁死。
第三種,是 Windows 繁體中文使用者。
如果你平常使用繁中注音,而且不希望語音輸入後系統跳到簡體中文輸入法,那 OpenLess Unbound 的 TSF profile 修正會比較貼近你的使用情境。
第四種,是想把語音輸入放進日常 workflow 的人。
例如寫文章、回訊息、整理筆記、下 prompt、跟 AI agent 溝通。只要你常常需要輸入文字,這類工具就有機會幫你省很多力氣。
它目前不適合誰?
當然,這也不是每個人都適合。
如果你完全不想處理 API key,不想設定 provider,只想下載後馬上用,那商用工具還是比較省事。
如果你在公司電腦上不能安裝未簽章程式,或 IT 政策很嚴格,那也要先確認環境允不允許。
如果你非常需要內建即時搜尋、語音編輯、跨平台同步、客服支援和完整商用品質保證,那 Typeless 目前還是比較成熟。
OpenLess Unbound 比較像是給願意自己設定 provider、也願意接受開源工具仍在快速演進中的使用者。
小結:這是一個更自由,也更貼近繁中使用者的版本
我自己的感覺是,Typeless 目前仍然是整體體驗最完整的商用語音輸入工具。
但如果你想找免費開源替代方案,OpenLess 是目前很值得看的選擇。而 OpenLess Unbound 則是在這個基礎上,再把幾個我實際遇到的限制補起來。
它真正有感的地方,是這三件事:
- 劃詞追問不再卡特定 ASR provider。
- 一般潤色和劃詞追問可以用不同模型分工。
- Windows 繁體中文輸入體驗比較不會被簡中輸入法干擾。
如果你平常已經在用 Groq、Codex OAuth、OpenAI-compatible endpoint,或本來就在找 Typeless 的免費開源替代方案,那 OpenLess Unbound 值得試試看。
專案與下載頁在這裡:
留言
張貼留言