美國時間周四,OpenAI推出了Canvas功能,還沒真正用上呢,不少人看著展示視頻就紛紛喊著“炸裂”、“震撼”、以及“這就是AGI終極交互形態(tài)”。
作為AI領(lǐng)域的“流量密碼”,OpenAI每次發(fā)布新產(chǎn)品都會迎來一片喝彩,但“一邊倒”的熱捧真的有理嗎?
我們決定不跟風(fēng),在拿到Canvas的beta權(quán)限并且親自試用之后,才來和大家分享真實的使用體驗。
先說結(jié)論:Canvas并不如外界傳言般“炸裂”,更不是“AGI的終極交互形態(tài)”。
首先,我們來看看Canvas究竟是什么?簡單來說,是ChatGPT里一個內(nèi)置的新交互體驗,可以彈出頁面以更好地輔助用戶進行寫作(writing)和編碼(coding)。
你可以通過在提示中輸入“使用畫布(use canvas)”來手動打開,ChatGPT也會在檢測到可能有用的場景時,自動打開Canvas。
進入到Canvas的界面,它會在右下角有幾個用于寫作和編碼的快捷鍵。
對于寫作項目,用戶可以要求 ChatGPT 提供編輯建議或長度調(diào)整,或者要求它將一段文本的閱讀級別從研究生水平降低到幼兒園水平。它還可以添加“相關(guān)的表情符號以強調(diào)和著色”。
程序員可以讓 ChatGPT 審查他們的代碼并添加內(nèi)聯(lián)改進建議。它還可以用日志和注釋標(biāo)記您的工作,以幫助調(diào)試并使您更容易理解代碼。它還能夠在 Canvas 模式下修復(fù)錯誤并將編碼移植到不同的語言,例如 Javascript、Typescript、Python、Java、C++ 或 PHP。
更直觀的來說,Canvas的推出,就好像ChatGPT同時內(nèi)置了Notion和GitHub Copilot。
聽起來很強大是不是?畢竟Notion號稱坐擁1億用戶,年營收2.5億美元,而GitHub Copilot擁有130萬付費用戶,年營收20億美元。
僅僅一個Canvas就能同時提供這兩種服務(wù),這簡直就是“終極AGI交互的未來”啊,OpenAI的研究員Karina Nguyen最先在推特上發(fā)出了這樣的“感嘆”。
隨后,其他輿論也紛紛跟進,一邊倒的站在Karina Nguyen身邊。

我們從觸發(fā)Canvas這一步說起。
在展示視頻里,輸入“help me write an api webserver in rust”的prompt之后, ChatGPT自動跳轉(zhuǎn)進入了Canvas界面,并生成了代碼,就像VSCode的界面那樣。
我復(fù)制了一段html代碼,并要求ChatGPT幫我review一下,在輸入這些之后,并沒有觸發(fā)Canvas功能,還是停留在原本的頁面。
于是我改變策略,提出了“生成一個用來獲取納斯達克近年來的數(shù)據(jù),并進行分析的Python腳本”這樣的prompt。
這次才成功觸發(fā)了Canvas。

目前,ChatGPT并不能100%準(zhǔn)確的識別需要觸發(fā)Canvas的場景,但你可以通過“use Canvas”或者“open Canvas”之類的非常明確的prompt讓它直接觸發(fā)。
在周四公布Canvas功能的博客里,OpenAI也承認目前觸發(fā)Canvas的正確率分別在83%(寫作任務(wù)) 和 94%(編程任務(wù))。

編程體驗不如微軟的GitHub Copilot。
在讓ChatGPT Canvas生成代碼之后,同樣的,我要求微軟的GitHub Copilot也基于同樣的prompt——“生成一個用來獲取納斯達克近年來的數(shù)據(jù)并進行分析的Python腳本”——來生成代碼,得到了下面的結(jié)果:

兩者給出了具備基本功能的代碼,但ChatGPT生成的代碼看起來更細致一些。
在功能多樣性上,我們可以看到Canvas界面的右下角,有五個快捷鍵,分別是:

1.檢查代碼(Review Code):ChatGPT 提供內(nèi)聯(lián)建議,以優(yōu)化和提升代碼質(zhì)量。
2.添加日志(Add Logs):插入日志語句,以便調(diào)試和深入理解代碼的執(zhí)行過程。
3.添加注釋(Add Comments):向代碼添加注釋以使其更易于理解。
4.修復(fù)錯誤(Fix Bugs):檢測并重寫有問題的代碼。
5.移植到語言(Port to a language):將代碼轉(zhuǎn)換為 Javascript、Typescript、Python、Java、C++ 或 PHP 等編程語言。
這些功能GitHub Copilot也都提供,甚至更多。
初體驗上,Canvas和GitHub Copilot打個平手。
但真正超越Canvas的地方在于,GitHub Copilot與開發(fā)者的IDE(如Visual Studio Code)深度集成。
GitHub Copilot直接在IDE中工作,為開發(fā)者提供實時的代碼建議和補全。這種無縫銜接大大簡化了工作流程,省去了在聊天界面和編輯器之間來回切換的麻煩。
相比之下,Canvas依托于ChatGPT這樣一個聊天工具,開發(fā)者仍需要手動將它生成的代碼復(fù)制粘貼到IDE中,才能運行。
想想看,你是愿意對著一個聊天框苦哈哈地描述你想要的代碼,在它生成代碼后,手動復(fù)制粘貼到IDE里?還是希望在IDE里有個實時跟進的AI助手,在你敲代碼的時候默默地跟著你的思路,隨時蹦出補全建議?
自動補全功能也是開發(fā)者們認為GitHub Copilot優(yōu)于包括ChatGPT和Claude等提供AI代碼編寫功能的聊天機器人的地方。
Copilot可以根據(jù)開發(fā)者剛剛輸入的幾行代碼自動補全后面的代碼,這種“聯(lián)想式編程”極大地提高了代碼編寫速度,而ChatGPT則需要手動描述任務(wù)或詢問才能生成相應(yīng)的代碼。
另一方面,GitHub Copilot對項目整體的理解能力是優(yōu)于Canvas的。GitHub Copilot可以基于整個代碼庫或項目的上下文來理解代碼結(jié)構(gòu),識別變量、函數(shù)、類等內(nèi)容,而ChatGPT Canvas的代碼生成基于當(dāng)前對話的內(nèi)容,無法直接讀取用戶的整個代碼文件,因此對項目上下文的理解有限。
而ChatGPT盡管在生成代碼、解釋概念以及回答編程問題方面表現(xiàn)出色,但在編程效率和與開發(fā)流程的深度融合方面不如GitHub Copilot,而這正是開發(fā)者最需要的地方。
在文字生成方面,它有的功能Notion都有,而且更強。
為了測試Canvas的文字生成功能,我讓它幫我給一位六年多沒見的朋友寫一封信,表達我的思念之情。
輸入prompt之后,ChatGPT自動觸發(fā)Canvas界面,并且生成了內(nèi)容。

郵件內(nèi)容沒有什么可挑剔的地方。在界面的右下角依然是有幾個快捷鍵,分別是:
1.建議修改:ChatGPT 提供內(nèi)聯(lián)建議和反饋。
2.調(diào)整長度:根據(jù)需要縮短或加長文檔。
3.更改閱讀水平:調(diào)整閱讀難度,從幼兒園到研究生水準(zhǔn)。
4.最終潤色:檢查語法、清晰度和一致性。
5.添加表情符號:加入相關(guān)表情符號,增添強調(diào)和色彩。
我一一進行了嘗試,效果如下圖:

整體還是挺絲滑的,沒什么可以挑剔的。但我轉(zhuǎn)念一想,Canvas的文字生成體驗離讓我感到“炸裂”還是挺遙遠的,我常用的Notion早有這些功能了啊。
于是我讓Notion也給我六年不見的朋友寫封信,效果也不差。Canvas五個快捷鍵包含的功能,它也有,并且還有專門針對文檔協(xié)作管理的更多細分功能。(如下圖)

兩年前Notion就推出了beta版本的Notion AI,在上周正式向所有用戶開放。
Notion AI采用了包括OpenAI的GPT 和Antropic的Claude 在內(nèi)的多個大型語言模型,在多樣性和靈活性上顯然高于Canvas。
另外,Notion AI與Notion現(xiàn)有的組織、標(biāo)記和鏈接工具無縫結(jié)合,用戶可在同一平臺內(nèi)完成從內(nèi)容生成到組織的全過程,避免了在多個應(yīng)用間切換的麻煩;充分利用了Notion平臺的協(xié)作特性,支持團隊成員在共享文檔中進行實時協(xié)作。
這種無縫集成讓用戶能在熟悉的環(huán)境中直接使用 AI 功能,顯著提高工作效率,此外,Notion AI 對用戶工作環(huán)境的深入理解使其能提供更加精準(zhǔn)和相關(guān)的建議,這是像ChatGPT Canvas這樣的獨立AI工具難以企及的。
無論是Notion還是GitHub Copilot與Canvas的對比,都指向了關(guān)于AGI普及的兩種主要發(fā)展路徑的探討。
第一種路徑由OpenAI、Anthropic等大模型供應(yīng)商主導(dǎo)。
他們希望將大模型不僅作為基礎(chǔ)設(shè)施提供,還發(fā)展成為一個平臺,成為用戶接觸各類服務(wù)的主要入口。
這些公司致力于圍繞AI構(gòu)建更多的應(yīng)用,形成自有生態(tài)系統(tǒng)。例如,OpenAI的ChatGPT不再僅僅是聊天機器人,通過插件集成、與文檔和API連接,提供生產(chǎn)力工具的多樣化服務(wù),最近的Canvas更是OpenAI“野心”的直接體現(xiàn)。
另一條路徑則由軟件服務(wù)商主導(dǎo),思路是“為應(yīng)用加上AI”。
在這種模式下,AI作為現(xiàn)有工具的增強功能,而不是一個獨立的平臺,其作用在于優(yōu)化和提升現(xiàn)有軟件的智能性和效率。
微軟、Google等公司將大模型嵌入到生產(chǎn)力工具中,如GitHub、Word、Excel、Google Docs和Google Emails等,使得用戶在熟悉的工作流中享受到智能輔助,如文本自動生成、數(shù)據(jù)分析和智能建議等功能,更加貼近用戶需求,提升工作效率。
這種路徑強調(diào)的是“增強而非替代”——優(yōu)化已有工具和流程,而不是另起爐灶,創(chuàng)建一個新的平臺。目前來看,用戶更傾向于軟件服務(wù)商推動的這條路徑,因為它依托于大眾熟悉的工具,無需適應(yīng)新平臺,且實現(xiàn)了無縫的智能化增強。
正因如此,在HackerNews上,開發(fā)者們也普遍表達了類似的看法:
“這(Canvas)很酷,但我希望它能集成到已有的編碼和寫作工具中,而不是作為一個單獨的應(yīng)用程序。”

“如果Apple在Pages等應(yīng)用中添加類似功能,我一點也不會感到驚訝。看來他們對AI的態(tài)度是將其集成到現(xiàn)有應(yīng)用和體驗中,而不是制作獨立的AI應(yīng)用。我覺得這些獨立應(yīng)用更多是技術(shù)演示,展示了可能實現(xiàn)的功能,而不是最終普及的應(yīng)用形態(tài)。”

本周三,OpenAI宣布完成66億美元的新一輪融資,估值達到1570億美元。本輪融資由Thrive Capital牽頭,微軟、英偉達、軟銀、阿聯(lián)酋投資公司MGX等參投。
盡管這輪融資標(biāo)志著OpenAI的估值在九個月的時間里翻了一番,但也意味著更大的壓力還在前頭。
翻開《紐約時報》披露的財務(wù)數(shù)據(jù),就能看出問題所在:今年OpenAI預(yù)計能賺37億美元,聽起來不少了吧?可問題是,光是運營成本和七七八八的開銷,就能讓公司虧掉50億美元。
即便收入可觀,OpenAI依然“深陷”入不敷出的困境。
更要命的是,投資人也不愿意繼續(xù)不計回報的“燒錢”了,作為這輪融資的附加條件:公司必須在兩年內(nèi)轉(zhuǎn)型為營利性企業(yè),否則融資將轉(zhuǎn)為債務(wù)。
如果無法完成這一轉(zhuǎn)型,OpenAI將面臨多重挑戰(zhàn):現(xiàn)金流緊張、債務(wù)負擔(dān)加重、融資能力受限,甚至可能導(dǎo)致公司控制權(quán)的改變和創(chuàng)始人股權(quán)的稀釋。這些潛在風(fēng)險都將嚴重影響公司的發(fā)展軌跡。
因此,在本輪融資條件公布前,OpenAI已經(jīng)宣布了架構(gòu)重組計劃,從非盈利向營利部門轉(zhuǎn)型。如今看來,這更像是外部壓力下的被動選擇。
飛漲的估值也難以掩蓋OpenAI對于盈利的焦慮。
Canvas項目的推出是它拓展商業(yè)化路徑最新的努力,未來我們可能會看到更多類似嘗試。
隨著OpenAI增強其技術(shù)能力和商業(yè)模式獨立性,它與微軟之間的合作關(guān)系或許也會更多的演變?yōu)椤皩埂保鏑anvas與GitHub Copilot的挑戰(zhàn)便是一個例證。
然而,核心問題依然存在:AGI的規(guī)模化應(yīng)用何時才能真正實現(xiàn)?只有解決這個問題,才能從根本上降低運營成本、減少虧損。這不僅是OpenAI面臨的挑戰(zhàn),也是整個AI行業(yè)必須面對的課題。





京公網(wǎng)安備 11011402013531號