發表文章

目前顯示的是 5月, 2026的文章

用 AI Agent 自動查找 PubMed 文獻並下載 PDF:給醫藥職場人的低成本工作流

圖片
身為藥廠的行銷人員,無論是在業務端、行銷端,或是醫藥學術部門,我們時常會接到外部客戶或內部同仁對於醫學期刊、電子文獻查找的需求,而且很多時候會需要 PDF 檔。 有趣的是, 醫學文獻搜尋的大宗平台 PubMed 明明是公開且免費的 ,而且也有一定比例的文章可以免費下載全文 PDF。那為什麼我們還是常常收到這種 request? 我用 NCBI ESearch 在 2026-05-28 即時計算了一下。PubMed 約有 40,624,611 筆紀錄,其中 free full text [sb] 約有 14,230,055 筆,換算大約是 35.0%。也就是說,粗略來看, PubMed 上約三分之一左右的文獻,可以透過 free full text 路線找到免費全文。 這個比例其實不低。 可是實務上,request 還是照樣來。 原因主要有兩個: 意願 和 能力 。但很多時候,其實是人性,也就是「 懶 」。 不管是外部客戶或內部同仁,很多時候大家不是完全不會查,也不是完全不知道 PubMed 在哪裡。只是自己花時間打開電腦、查關鍵字、點進網頁、找 PDF、下載、再存檔,這一串動作很煩。如果發一個 request 給藥廠的 medical MSL 或 marketing PM, 下一個 prompt 或訊息,對方就會乖乖開電腦幫忙找 。何樂而不為? 當然,這時候通常要稍微包裝一下,讓這件事情看起來比較合理。 為什麼藥廠同仁需要無條件協助查找文獻 paper 呢?這件事其實不見得是我們 JD 上面的主要工作範疇。不過, 一旦想找的 paper 可以跟公司的產品扯上一點點毛邊,這件事情就會很自然地變成藥廠員工的份內任務。 包裝方式也很簡單。 如果這個 paper 是 off-label 的,就可以立馬丟給 Medical 去找。如果是 on-label 的,只要跟產品扯上邊,就可以叫 PM 去找。即使 下載文獻這件事情,其實完全沒有什麼技術難度可言。 講得直接一點,這就是一種職場裡很常見的「 把低階操作丟給看起來應該要負責的人 」。 所以,很多時候站在人性的角度來看,很多人 明明知道有免費全文電子檔,也不願意自己下載。 身為藥廠員工,如果我們時常收到這種 request,傳統做法就是自己守在電腦前面,打開網頁,搜尋關鍵字,點進原始期刊,點選全文下載...

OpenClaw Realtime Voice Conversation 實測:用 WebUI 和本地 AI Agent 即時語音對談

圖片
在前一篇文章, 【 用 Tailscale 從外部安全連回本地 OpenClaw WebUI:手機也能像 App 一樣使用 】,我們討論的場景是:當我們本人不在本機電腦旁邊,能不能用手機或另一台電腦,安全打開自己本機的 OpenClaw WebUI? 實測答案是可以。只要本地 OpenClaw Gateway 已經正常啟動,再透過 Tailscale 和 Tailscale Serve 把 WebUI 分享到自己的私人 tailnet 裡,外部裝置就能用瀏覽器打開完整的 OpenClaw WebUI。 這篇文章要往前再推一步。 既然手機或外部電腦已經可以打開 OpenClaw WebUI,那能不能直接 用說話的方式和 OpenClaw 互動 ? 也就是:不用只靠打字、不用只靠 Telegram bot、不用遠端桌面模擬滑鼠鍵盤,而是在 WebUI 裡按下 Start Talk,直接開啟 OpenClaw 的 Realtime Voice Conversation ,讓 本地 AI agent 變成一個可以即時語音對談的工作助理 。 我這次主要用 iPhone 手機透過 Tailscale 連回本地 OpenClaw WebUI 來實測示範。不過這個功能本質上並不侷限於手機。只要裝置能打開 OpenClaw WebUI,而且瀏覽器能取得麥克風權限,無論是本機電腦、外部筆電、平板,或手機,都可以用同樣概念操作。 先講結論 OpenClaw 的 Realtime Voice Conversation 主要適合從 WebUI / Control UI 使用。 基本使用流程大概是這樣: 打開 OpenClaw WebUI。 進入一個既有 session,或建立新的 session。 展開語音設定區。 選擇 Voice、Model、Sensitivity 等設定,或先維持 Auto / Default。 點擊左下方的 Start Talk。 允許瀏覽器使用麥克風。 直接開始說話。 如果是外部裝置,無論是手機或電腦,只要先用 Tailscale 連回本地 OpenClaw WebUI,後面的操作方式和在本機電腦上使用差不多。 這也是我覺得這個功能有意思的地方:OpenClaw 不再只是桌機上的文字操作介面。只要網路與權限設定正確,手機也可...

用 Tailscale 從外部安全連回本地 OpenClaw WebUI:手機也能像 App 一樣使用

圖片
上個月我有整理過一套 OpenClaw 一條龍(蝦)的本地部署方式,包含 Windows、WSL、Telegram bot、多模型供應商,還有一些基本啟動流程。那篇內容比較偏向是「先把 OpenClaw 在本機啟動起來,並且可以從 Telegram 跟它互動」的基礎建置。 延伸閱讀: 從零開始部署龍蝦 OpenClaw:Windows + WSL + Telegram + 多供應商入口 當自己使用了一段時間後,隨著認知邊界的提升,想像力往往就會驅動自己創造出更多元的使用方式。這個情境是這樣的: 如果當我們人不在電腦本機旁邊(其實也就是生活中大部分的實際場景),可不可以直接用手機或另一台電腦,連回家裡那台有 OpenClaw 的主機,並且能打開完整 WebUI 介面來用?而非單純只能靠 Telegram bot 這種單一對話入口來下指令呢? 當然除了傳統使用遠端桌面應用程式(ex. Teamviewer、DeskIn、AnyDesk、HopToDesk....),這種隔了一層砂的模擬人在本地的隔空操作方式之外,是否還有更直觀的方式可以實際打開 WebUI 使用完整的 OpenClaw 功能呢? 簡短的答案是:可以。(不可以的話,我就不用寫這篇文章了🤣) 這篇就來整理這個做法。重點是:並不是直接粗暴地從本地數據機打開 Port Forwarding,而是用 Tailscale 這類的免費虛擬區域網路服務,把 OpenClaw WebUI 放進自己的私人網路裡。這樣從外部遠端裝置可以安全連回來,而不需要把 OpenClaw 的連線大門直接暴露到公開網路上(也就是俗稱讓 AI agent「裸奔」)。 先講結論 如果只是要在外部裝置使用本地 OpenClaw,我目前比較推薦這個架構: 本地 OpenClaw 主機 -> OpenClaw Gateway 維持 loopback -> Tailscale Serve 提供 tailnet 內 HTTPS 入口 -> iPhone / Android / 外部電腦登入同一個 Tailscale 帳號 -> 瀏覽器開啟 OpenClaw WebUI 白話來說,就是把外部遠端裝置跟本地 OpenClaw 主機放進同一個 Tailscale 私有網路。只要任何裝置(無論是另一台手機或...