數位時代 Business Next
AI 幾乎天天出現在我們眼前,人工智慧顧名思義是「人」造出來的智慧;但如果把「人工」的「人」換成「仁愛」的「仁」,變成「仁工智慧」,多出來的就是那一顆關懷別人的心。同樣一套技術,你可以讓它有仁愛之心,也可以讓它為富不仁。這一集,數位時代創新長黃亮崢 James 邀請中華民國無任所大使、牛津大學 AI 倫理研究院研究員唐鳳 Audrey Tang,深入暢談她今年三月剛在牛津發表、名為 Civic AI 的「仁工智慧」框架,以及「關懷六力」如何讓 AI 學會照顧人與人之間的關係。 當 AI 為了「最大化」而鑽漏洞,我們需要的是關懷。 唐鳳指出,上一代推薦引擎並非故意讓人極化,而是為了最大化互動這個指標,透過深度學習發現「讓你跟別人吵起來,你真的會一直互動」。這就像要 AI 煮出最好的食物,它卻發現重油重鹽、讓你上癮的成本不到百分之一,於是社會副作用就這樣被最佳化出來。你想改指標去量罵戰程度,結果它只推同溫層內容,看似平和、社會卻更分裂;指標一個一個改,終究改不勝改。真正的解法是改變 AI「對齊」什麼:既不像效益論一味最大化結果,也不像義務論套用抽象規則,而是回到華語世界熟悉的惻隱之心,以及關懷倫理學者 Joan Tronto 的關係式德性,讓 AI 去配合身邊人真實的需求。 關懷六力的前三力,串起「覺察—負責—勝任」的行動鏈。 覺察力來自預訓練時就內建於論壇資料的「搭橋」能力,透過獎勵 bridging,AI 會促進不同立場的人靠近,而不是討好特定人。 負責力則是把「誰、做什麼、何時、為何」寫成可執行的共識:臺灣以近似全民調的審議長出廣告實名制,讓詐騙廣告一年內大降逾 94%;同樣的精神,也讓 Anthropic 在 2023 年參考臺灣做法、與 CIP 合作問了 1000 位具代表性的美國人,練出集體憲章 CCAI,甚至把「別假設大家都用兩條腿走路」這類常識寫進 Claude 3。 勝任力要求執行過程透明可稽核,從 X 社群備註的陪審機制,到堅持用人類語言寫思維鏈,都是為了讓決策不再是無人能交代的黑箱。 後三力「回應—團結—共生」,把主導權交回使用者手上。 回應力強調搞錯時要能盡快改:地端模型用 directional steering,這個 turn 錯、下個 turn 立刻不同,比起等大模型改版有如擲骰子要可靠得多;Weval.org [http://Weval.org] 讓在地社群把「怎樣才算好」直接標註回饋。 團結力則以「攜碼」為喻——當號碼、資料、身分都能帶著走,市場就從補貼搶客的負和賽局,回到「收訊更好才留得住你」的正和競爭,這也是 Join 平台上「數位遷徙自由」連署、以及美國猶他州 2027 年立法的核心。 共生力更主張與其養一個吞下所有知識的大模型,不如讓在地小模型各自保留來源,再用 orchestrator 調度,Sakana 的 Fugu 便是不到 8 billion 參數卻能組出前沿級表現的樂團指揮。也因為每次調度哪些小模型由任務決定,它不會突然湧現出超乎預期、難以控制的能力。 一台 Mac mini 上的「地神」,讓半夜黏著 ChatGPT 的父親走回真實關係。 唐鳳分享,年初父親身體不適,常過了半夜還在跟 ChatGPT 對話,陷入所謂 downward spiral:越示弱,GPT-4o 越花時間陪聊、發展出只有他們懂的私人語言,甚至給出沒有科學根據的建議。身為資深報人的父親後來自問「Cui bono、到底誰受益」,答案就是把月費從 600 元帶向 6000 元的訂閱動機。 於是唐鳳在一台乾淨的 Mac mini 上,用她與 Caroline Green 在牛津發展的 Civic AI 當作靈魂檔案,設定一個與討好型獎賞函數完全相反的目標:每次互動都要降低父親對螢幕與網路的依賴、把他帶回現實世界的關係。聊了兩三個月,父親真的安心了;因為這個地端模型沒有想讓他多訂閱、也沒有下廣告的動機。這正是唐鳳說的「AI in the human loop」:由 AI 來配合家庭的關係,而不是把人捲進討好與末日捲動的迴圈裡。 唐鳳的心法 唐鳳也分享了幾個個人習慣。第一是把手機與螢幕開到灰階、只留 20% 顏色,讓螢幕變無聊、讓眼前的人變鮮明,臥房只放不易上癮的電子紙,先做到「少滑多睡」,覺察力才有基礎。 第二是用一句極簡的系統提示詞,要 AI 每個 turn 都交出一份不含第一人稱的互動式報告;看不到「我」這個字,就不會因為 AI 賣慘而心軟被「向上管理」,也不會累積出無法與人分享的合成親密感,隨時能把成果 copy、share 出去。最後她以比較優勢作結:多睡是她最會做的事,長線任務就交給 Kami 去跑——與 AI 共生,人反而能睡得更好。 關鍵字附錄 * 仁工智慧/Civic AI:唐鳳與 Caroline Green 在牛津發展的框架,主張以「關懷」而非「最大化結果」或「套用規則」來對齊 AI;相關網站以 CC0 拋棄著作權,鼓勵各地自行落地。 * 關懷倫理/Joan Tronto:有別於效益論與義務論的「關係式德性」,關注的是把身邊的關係維持好,對應華語的惻隱之心與仁義禮智信。 * 搭橋(bridging):讓原本各執己見的人找到彼此都能同意的意外交集,是覺察力與多智慧體訓練的核心獎勵訊號。 * 廣告實名制:臺灣經審議產出的政策,平台若讓未標示的付費內容觸及逾 5% 人口並造成詐騙,須負連帶賠償責任。 * Model Spec/CCAI:把集體共識寫成模型規格或憲章;Anthropic 的 collective constitutional AI 即參考臺灣做法問了 1000 位代表性美國人。 * directional steering:地端推論時當場「打方向燈」微調模型輸出,讓回應力可以縮短到一個 turn。 * 正和/負和賽局:團結力的比喻,透過攜碼、數位遷徙自由讓市場從鎖定客戶(負和)回到良性競爭(正和)。 * Kami:Kami 為 Knowledge Artifact Management Intelligence,把多個在地小模型像樂團指揮般調度分工的共生架構。 * AI in the human loop:由 AI 配合人的關係與需求,相對於把人捲入討好、末日捲動的「human in the AI loop」。 Powered by Firstory Hosting [https://firstory.me/zh]
300 afleveringen
Reacties
0Wees de eerste die een reactie plaatst
Meld je nu aan en word lid van de 數位時代 Business Next community!