在一人顧問公司應用 LLM

應用的要訣：將任務的範疇縮減、給予總結型的任務

Oct 21, 2024

我問了 LLM ：

列舉 10 種最常見的，一人顧問公司應用 LLM 的方式？

得到如下的答案：

報告和提案撰寫
市場研究與洞察
自動化回覆與客戶互動
內容行銷與社交媒體管理
演講材料製作
知識管理與檔案整理
個性化客戶簡報製作
合約與法律文件撰寫
創意發想
翻譯與多語言支持

在這 10 項應用裡，只有第 2, 6, 9, 10 四項，我認為實務上可行，而且實務中運用之後，算是有提高生產力，而且同時在產量與品質都有提高。

市場研究與洞察

我有時候會遇到朋友請我給一些策略上的建議。(這種建議我給的不多，因為我主要的業務是做 IT 顧問，而經營管理這一塊則多半是友情協助。)

我通常會用友人的 {公司的官方網站} 與 {公司名稱} 先下這兩個 prompt ：

從網路上現存的資訊，分析 {公司的官方網站} 這家公司。
 
{公司名稱} 是什麼細分市場的領導者？

還有

根據網路上的資訊與 {公司官方網站} 的資訊，用簡短的 2 句話，講出 {公司名稱} 的價值主張。

有時候 LLM 會果斷地回答：「某某公司本身可能尚未成為特定利基市場中廣泛認可的領導者。」透過 LLM 幫我對朋友說出這一句話，讓我的感覺好過多了。

知識管理與檔案整理

多數的時候，已經有許多成熟的工具可以輔助知識管理、檔案整理，所以也用不太上 LLM 。

也有少數的例外，比方說：我需要對 Datomic 的 schema 畫出 ER diagram 圖。因為 Datomic 沒有簡單好用的繪製 schema 工具，於是我下這樣子的 prompt：

將以下文本的 Datomic schema 的簡易表示法，轉換成 Mermaid 的 ER diagram 表示法

創意發想

我有時滿討厭寫結論的，無論是書的章節又或是一般的文章。有靈感時可以很快地寫完。但是，大約有一半的機率會想不出好的靈感。偏偏我又強烈地覺得，用兩三句話把之前的重點再概述一次的這種中規中矩的寫法，非常無聊。

我有時候會下一個 prompt 來輔助：

接續前文，將結論寫完。

這種時候，大約有 99% 的機率，我將會看到一個我無法忍受的結論。當我在寫書，幾乎寫完了一個章節，談論在企業內部導入現代資料棧會是如何如何，組織可能會扺抗創新，該怎麼應對。叫 LLM 幫我寫結論之後，得到了一個正面、鼓舞人心、彷彿反攻大陸都可以成功的那種結論。我看完之後，內心中止不住地咒罵，『你是戒嚴時代打造出來的 AI 嗎？』

受到了 LLM 的刺激後，謬思終於醒來，下筆若有神助地寫下憤世嫉俗的版本：

少數的組織可以引領潮流，但是多數的組織，他們的變革多半是由外部的壓力帶來的。換言之，很有可能無論讀者做了多少的技術研究、提交了多少個版本的行動計畫、在公司內辦了無數次的技術研討會，上級卻始終沒有允諾變革。然而，某一天，當組織的同業一個接一個開始做技術變革時，上級又立刻下達六個月內完成變革的不可能指令。 …

應用的可行性分析

由於 LLM 的本質是資料與統計，如果要讓 LLM 來輔助工作，至少應該考慮兩個原則：

分配給 LLM 的任務應儘可能縮減為完整任務範疇的一小部分。因為大多數的時候，任務都需要人類判斷，除非任務被分解成夠小的部分，否則很少可以完全依賴機器而不需要人類判斷。
儘量讓 LLM 處理總結型的任務 (summarization)，即從多量的資料映射到少量的資料，而不是生成型任務 (generation)，即從少量的資料映射到多量的資料。總結型的任務如果有給予適當的上下文，其實準確度還不錯。

回到文章開頭的 10 種應用，像 1, 3, 4, 5, 7, 8 都是生成型任務，因此常常產生幻覺且錯誤率偏高。產量提昇的同時，會不會同時也降低了品質？

至於最後一項應用「翻譯」，我做了不少的實驗，整體而言算是可用。翻譯是屬於轉換型的任務 (transformation)，即將同樣的資料從一種形式變成另一種形式。多數的時候，我認為算是成功的。少數的時候，則是真的很不行。出乎我意料之外的，在沒有特別設計 prompt 的前提下，翻譯程式語言比翻譯自然語言失敗得多。

PruningSuccess

Discussion about this post

Ready for more?