裝了啥特別篇:少數(shù)派編輯部怎么用 AI 打工?
按:AI 對(duì)媒體的影響一直眾說(shuō)紛紜。少數(shù)派編輯部(套用一個(gè)經(jīng)典句式)可以說(shuō)是「站在科技和媒體的十字路口」,AI 對(duì)我們的日常工作不是一個(gè)「用不用」的問(wèn)題,而是「怎么用」的問(wèn)題。本期《裝了啥》中,我們就請(qǐng)編輯部的幾位成員介紹一下 AI 工具在日常工作中的實(shí)際應(yīng)用,或許也能對(duì)你有所啟發(fā)。
:在 ChatGPT 走紅之后我就注意到了這款工具。在我看來(lái),以 GPT 為代表的大語(yǔ)言模型最大的意義就是降低了人類(lèi)與機(jī)器溝通的門(mén)檻,電腦終于可以相對(duì)準(zhǔn)確地理解模糊的自然語(yǔ)言,并將其歸納成有條理的指令或結(jié)果。因此,當(dāng) ChatGPT 面向公眾開(kāi)放之后,我就開(kāi)始嘗試將其納入工作流。
我使用 ChatGPT 最高頻場(chǎng)景之一就是處理文字格式。有一個(gè)冷門(mén)但非常實(shí)用的用法,還是我跟甜食老師學(xué)來(lái)的——
在使用《Reaper》等工具剪輯播客時(shí),我會(huì)在剪輯的時(shí)候同步標(biāo)記時(shí)間戳,剪完之后就能直接導(dǎo)出,方便生成播客章節(jié)。但是,《Reaper》導(dǎo)出的時(shí)間戳格式是這樣的:
理論上來(lái)說(shuō),使用文本編輯器配合正則表達(dá)式進(jìn)行替換就能將之變成簡(jiǎn)潔、規(guī)范的格式,但對(duì)我這種代碼苦手來(lái)說(shuō)還是有點(diǎn)麻煩。而且寫(xiě)好的規(guī)則還得另行保存,以便每次用到的時(shí)候調(diào)取,需求本來(lái)不大,步驟卻增加了不少。
用 ChatGPT 就簡(jiǎn)單多了。只要先告訴 GPT 我想做什么:
Can you help me adjust the format of the text? Please remove the "M1,", "M2,", etc. at the beginning of each sentence, and remove the decimal part of the timestamp at the end of each sentence. Then, move the timestamp to the front of each sentence and format it as 00:00:00.
接下來(lái),它就會(huì)自動(dòng)處理:
使用 ChatGPT 更方便的一點(diǎn)是可以讓它記住以上操作,并且每次都做相同處理。一次寫(xiě) prompts,終生自動(dòng)化,省時(shí)省力。
類(lèi)似的操作在我的工作流中還有很多,尤其隨著 GPT 模型的升級(jí),除了其對(duì)話和理解力越來(lái)越強(qiáng)之外,每次對(duì)話支援的文本長(zhǎng)度也越來(lái)越多,我目前已經(jīng)可以把一整篇文章丟進(jìn)去讓它一次性清理格式、插入中西文空格、統(tǒng)一替換標(biāo)點(diǎn)符號(hào)等,大幅降低了重復(fù)性工作的時(shí)間成本。
:和編輯部的其他同事不同,我開(kāi)始使用 AI 工具輔助工作的時(shí)間其實(shí)算晚的。生成式 AI 爆火的那段時(shí)間,少數(shù)派后臺(tái)也有過(guò)不少直接由 ChatGPT 生成的投稿,那種「先說(shuō)結(jié)論+有序列表拆解原因+『總的來(lái)說(shuō)』式收尾」的結(jié)構(gòu)是那么顯眼,又是那么無(wú)趣——如果沒(méi)有高超的提示語(yǔ)引導(dǎo),AI 和「創(chuàng)作」二字在我看來(lái)完全沒(méi)有半點(diǎn)關(guān)聯(lián)——而我又沒(méi)那么多興趣和精力去鉆研提示語(yǔ)工程。
用王樹(shù)義老師在《如何高效使用 ChatGPT?》一文中的話來(lái)說(shuō)就是認(rèn)識(shí)沒(méi)擺正,再加上那段時(shí)間試用 ChatGPT 和 Bard(后來(lái)改名 Gemini)的體驗(yàn)確實(shí)也不算太好,「AI 解放生產(chǎn)力」這件事就因此擱置了。
直到去年 9 月,早前集成在 Bard 當(dāng)中的 Google 搜索功能從「話題探索」搖身一變成為了「事實(shí)核查」的輔助角色,我才正式開(kāi)始了將 AI 工具融入到文章寫(xiě)作的流程當(dāng)中。
我并不需要 AI 來(lái)幫我寫(xiě)作,但在稿件撰寫(xiě)過(guò)程中,我偶爾會(huì)先將寫(xiě)作話題拋出來(lái)讓 AI「跑一跑」,看看大模型們會(huì)如何針對(duì)這個(gè)選題展開(kāi)論述、它們用什么結(jié)構(gòu)梳理這個(gè)問(wèn)題,如果站在讀者的視角,哪些地方又是可以簡(jiǎn)化處理的。
當(dāng)然了,雖然在少數(shù)派的內(nèi)容創(chuàng)作一般而言還談不上什么 writer’s block,因?yàn)槟硞€(gè)特定細(xì)節(jié)不確定該如何展開(kāi)、或某些關(guān)鍵概念自己都不算特別明白的時(shí)候,文章的寫(xiě)作往往也會(huì)因?yàn)檫@些障礙陷入停滯。最后回過(guò)頭會(huì)發(fā)現(xiàn)遍地都是「想寫(xiě)但沒(méi)能填完的坑」。所以寫(xiě)作過(guò)程中我也經(jīng)常帶著一些更為明確的問(wèn)題去尋求 AI 的幫助,比如如何用盡可能通俗的方式解釋某個(gè)專(zhuān)業(yè)名詞、用比喻的方式說(shuō)明兩個(gè)概念之間的關(guān)系等。在一些帶有科普性質(zhì)的選題寫(xiě)作中,類(lèi)似的問(wèn)答自然也有被大模型那種「自以為是」的幻覺(jué)帶偏的風(fēng)險(xiǎn),因此在找到我認(rèn)為可以采用的內(nèi)容后,借助 Gemini 的 Google 搜索核查功能評(píng)估內(nèi)容和數(shù)據(jù)的可靠程度也是必不可少的一環(huán)。
Gemini 針對(duì)中文搜索核查的效果其實(shí)非常有限,但聊勝于無(wú)。并且因?yàn)槠綍r(shí)這種「你會(huì)怎么做」的用法和場(chǎng)景比較多,不久前我又開(kāi)始從 Gemini 轉(zhuǎn)向了和我使用場(chǎng)景更貼近、功能設(shè)計(jì)思路也更符合我對(duì) AI 工具期望的 Perplexity,它的「發(fā)現(xiàn)」功能在我看來(lái)就是一個(gè)更有趣的「維基百科」,時(shí)不時(shí)打開(kāi)掃一眼就能捕捉一些近期熱門(mén)的資訊和話題,在關(guān)鍵資訊的圖文和內(nèi)容排版上 Perplexity 也做得清晰、直觀,既是搜索引擎也是熱點(diǎn)「懶人包」。
說(shuō)到底在寫(xiě)作這件事情上,我覺(jué)得我需要的是一個(gè)能夠時(shí)不時(shí)閑聊幾句、期待在此過(guò)程中找到選題展開(kāi)思路的「寫(xiě)作搭子」,在做好事實(shí)核查、保證信息可靠性的前提下,它能讓你跳出自己積累多年的寫(xiě)作習(xí)慣和寫(xiě)作風(fēng)格,提供一些截然不同的創(chuàng)作視角以供參考。
就像王樹(shù)義老師說(shuō)的,擺正認(rèn)識(shí),在寫(xiě)作過(guò)程中擁有這樣一位輔助也不會(huì)反過(guò)來(lái)給使用者帶來(lái)太大的心理壓力——你看我還是沒(méi)有花時(shí)間去學(xué)習(xí)怎么寫(xiě)提示語(yǔ)。
:作為編輯部里的好奇星人,自從 ChatGPT 上線之初我就好奇 GPT 背后的技術(shù)原理,在通讀了相當(dāng)多的資料以后,我發(fā)現(xiàn) GPT 本身就是個(gè)串詞游戲——從上文中找到詞和與之關(guān)聯(lián)的詞,然后根據(jù)訓(xùn)練的素材,找到其他和之前詞有關(guān)的其他詞,最終根據(jù)一些優(yōu)先級(jí)將詞組拼接成句。這種存在一定「想象力」的輸出方式,讓我迫不及待地用在了一些簡(jiǎn)單改稿工作中。
在 GPT-4 模型發(fā)布以后,更大的模型也帶來(lái)了更豐富的想象力,這也驅(qū)使著我想要把生成式人工智能逐步融入我的工作流中。但直接用 AI 寫(xiě)東西肯定是不行的,哪怕是用盡 Prompt 提示詞優(yōu)化的手段也不行,畢竟模型永遠(yuǎn)不懂我們真正想要寫(xiě)的東西,車(chē)轱轆話也是真的多。所以目前 GPT 在大多是以助手的形式,參與到我的寫(xiě)稿工作流中。
以我最常寫(xiě)的科普文章為例,沒(méi)有任何技術(shù)背景的讀者在閱讀科普時(shí)最常遇到的情況就是讀不懂,所以科普文章最重要的就是通俗易懂。GPT 可以在 2 個(gè)方面輔助我,一個(gè)是在我準(zhǔn)備階段,幫我找出選題內(nèi)容中可能需要解釋的專(zhuān)業(yè)術(shù)語(yǔ),方便我在寫(xiě)作時(shí)提前避開(kāi)不重要的術(shù)語(yǔ),或者在更早的地方引入提前做出解釋。
比如我之前的一篇 Wi-Fi 7 技術(shù)的科普,我對(duì) Wi-Fi 技術(shù)的各個(gè)細(xì)節(jié)都有一定的研究,但我又吃不準(zhǔn)文章里的技術(shù)細(xì)節(jié)應(yīng)該寫(xiě)得多深入。在咨詢 ChatGPT 以后我得到了下面這樣的回應(yīng),在幫我錨定受眾的同時(shí),圈出幾個(gè)需要解釋的術(shù)語(yǔ)方便我提前做出規(guī)劃。
另一個(gè)就是寫(xiě)作階段,我需要 GPT 幫我找出和專(zhuān)業(yè)概念相似的、現(xiàn)實(shí)中比較常見(jiàn)的情況做例子,讓我能更生動(dòng)形象地向讀者介紹技術(shù)細(xì)節(jié)。不難發(fā)現(xiàn),這兩個(gè)方向其實(shí)都是從詞與詞之間的關(guān)系,找出下一個(gè)合適關(guān)鍵詞,都依賴(lài)于生成式模型的想象力。在后續(xù)寫(xiě)作的過(guò)程里,我也可以把技術(shù)細(xì)節(jié)和希望舉例的對(duì)象一起告訴 ChatGPT,讓 GPT 模型幫忙找出更易懂、更貼切的例子,方便普通讀者理解。整個(gè)寫(xiě)作流程比起以前寫(xiě)到一半,再去前面前面刪刪改改,或是想要找一個(gè)貼切的例子想到頭禿的情況比以前少多了。
當(dāng)然了,我整個(gè)工作流里 AI 仍然是以一個(gè)配角的形式出現(xiàn)的。正如那句知名的說(shuō)法「生成式模型是互聯(lián)網(wǎng)副本的有損壓縮」,我知道生成式模型「看過(guò)」的資料一定比我看過(guò)的多得多,但有損壓縮也意味著會(huì)丟掉很多關(guān)鍵細(xì)節(jié),加上生成式模型一直以來(lái)存在的幻覺(jué),只依靠生成式模型完成整個(gè)項(xiàng)目不亞于在脆弱的地基上建起高樓大廈。
與其指望生成式模型能在一個(gè)項(xiàng)目上做好,倒不如借助生成式模型本身的特性——「見(jiàn)得多」「能聯(lián)想」幫我處理推進(jìn)項(xiàng)目時(shí),很難在第一時(shí)間兼顧到的地方,讓我把精力放在更有意義的地方。
:準(zhǔn)備每天早上匯總科技新聞的「派早報(bào)」欄目是個(gè)說(shuō)難不難、說(shuō)簡(jiǎn)單也不簡(jiǎn)單的任務(wù)。理想情況下,一條資訊應(yīng)當(dāng)包含取自靠譜來(lái)源的基本事實(shí),并補(bǔ)充必要的背景信息,控制在三個(gè)自然段左右篇幅。對(duì)于產(chǎn)品發(fā)布、功能更新之類(lèi)的簡(jiǎn)訊,查閱一兩個(gè)官方或權(quán)威來(lái)源就夠了。但如果遇到一些重大、復(fù)雜且還在持續(xù)發(fā)展的行業(yè)事件時(shí),就可能需要匯總并整理很多來(lái)源的報(bào)道,才能寫(xiě)出一條準(zhǔn)確、清晰的資訊。在這個(gè)過(guò)程中,AI 能起到不少省事的作用。
例如,前不久的一個(gè)周末,IT 圈都被 CrowdStrike 軟件造成的重大事故「刷屏」了;這家安全軟件提供商推送了一個(gè)有缺陷的更新,導(dǎo)致設(shè)備藍(lán)屏死機(jī),重啟也不能恢復(fù)。顯然,這個(gè)新聞需要在周一的早報(bào)中有所反映。但因?yàn)槭录l(fā)生不久,后續(xù)進(jìn)展還在快速更新中,需要先廣泛收集各個(gè)媒體的報(bào)道,然后從中提煉出關(guān)鍵信息。同時(shí),考慮到少數(shù)派讀者并不都具有系統(tǒng)維護(hù)和信息安全方面的專(zhuān)業(yè)背景,還需要對(duì)這次事故的成因和原理做一定科普,才能讓讀者理解這次事件。當(dāng)然,這些信息必須足夠精煉,能夠容納在早報(bào)的有限篇幅中。
為此,我首先從自己平時(shí)??吹拿襟w(主流媒體和科技領(lǐng)域垂直網(wǎng)站皆有)找到了十幾篇報(bào)道,用瀏覽器插件 MarkDownloader 將其下載為純文本 markdown 格式,然后使用終端命令
將其合成單個(gè)文件。
為了首先讓自己快速獲得一個(gè)直觀印象,我將這個(gè)文件作為附件上傳給 Google Gemini 1.5 Pro 模型,然后加上下面這段提示詞:
Attached are 10 news articles about a recent major outage in the tech industry. Read through these articles and create a timeline of the events. For each event, include the time and date and a brief summary. Use markdown table in the output.
也就是讓它以表格形式整理一個(gè)時(shí)間線。輸出效果如下:
以這個(gè)表格為線索,我快速用搜索關(guān)鍵詞的方式讀了一遍原文中的相關(guān)段落(主要是因?yàn)椴荒鼙WC模型不會(huì)出現(xiàn)幻覺(jué))。然后,我用下面的提示詞讓模型幫我寫(xiě)一版初稿:
Using the information extracted from these articles, draft a brief summary of the events that have occurred so far, following the general structure of journalistic writing. Conclude with a brief introduction to the technical background and terms relevant to the event so that it’s easily understandable for the general public. The summary should be no more than four paragraphs and 600 words. Output in Chinese.
注意這里從內(nèi)容(事件概述加背景介紹)、風(fēng)格(一般新聞寫(xiě)作、大眾能夠理解)和格式(四個(gè)自然段、六百字以內(nèi)、翻譯為中文)幾個(gè)方面提出了要求。結(jié)果如下:
應(yīng)該說(shuō)這個(gè)效果還是不錯(cuò)的,中文翻譯效果也說(shuō)得過(guò)去。雖然沒(méi)有到可以直接用的程度,但至少提供了一個(gè)很好的起點(diǎn)和框架。
轉(zhuǎn)載請(qǐng)注明來(lái)自浙江中液機(jī)械設(shè)備有限公司 ,本文標(biāo)題:《裝了啥特別篇:少數(shù)派編輯部怎么用 AI 打工?》
還沒(méi)有評(píng)論,來(lái)說(shuō)兩句吧...