封面新聞記者 雷強
只需一句話,就能自動生成旅行攻略并規(guī)劃路線;30秒內(nèi)可創(chuàng)建一個個性化的交互式應(yīng)用;甚至只需將手機攝像頭對準一株植物,它不僅能識別品種,還能模擬與植物“對話”……
正如它的名字“靈光”那樣,在螞蟻內(nèi)部8個月的孕育下,一款“機靈”的App正式上線。
11月18日,螞蟻集團正式發(fā)布的“全模態(tài)通用AI助手”。上線首日靈光下載量破20萬,三天內(nèi)突破50萬,迅速沖上App Store總榜第七、工具類免費榜第一。一時間,這款獨立應(yīng)用在2025年的AGI混戰(zhàn)中,成功地完成了一次華麗蝶變。
靈光“靈”在哪兒,在眾多AI應(yīng)用中有著怎樣的差異化優(yōu)勢?在阿里內(nèi)部眾多的“賽馬型”選手中,靈光與其存在著怎樣的競合關(guān)系?11月20日,螞蟻集團CTO何征宇、靈光負責人蔡偉向記者解構(gòu)了其中的底層邏輯。
螞蟻集團CTO何征宇
“靈光”初現(xiàn)
致力于實現(xiàn)技術(shù)普惠
今年3月,螞蟻集團悄然組織了200多人的隊伍,要打造一個屬于自己的全模態(tài)通用AI產(chǎn)品,由CTO何征宇親自掛帥,這也標示著集團將該產(chǎn)品提到了內(nèi)部的優(yōu)先級。
11月18日,就在“通義千問”更新次日,“靈光”正式發(fā)布,首批上線“靈光對話”、“靈光閃應(yīng)用”、“靈光開眼”三大功能。這也是螞蟻集團自支小寶、AQ等AI應(yīng)用后,推出的第四款獨立AI應(yīng)用,彰顯其“AI First”戰(zhàn)略的加速落地。
“靈光的核心能力在于‘一句話生成響應(yīng)并立即執(zhí)行’,覆蓋運動健身、旅行規(guī)劃、健康飲食、理財建議乃至購物決策等日常場景。”蔡偉表示,與其他主流AI助手不同,靈光并非僅輸出文字,而是業(yè)內(nèi)首個完全基于代碼生成多模態(tài)內(nèi)容的產(chǎn)品,能動態(tài)產(chǎn)出圖文、3D模型、交互圖表等豐富形式。
靈光負責人蔡偉
蔡偉介紹到,靈光最具革命性的功能之一是“閃應(yīng)用”。用戶只需用自然語言描述需求,如“幫我做一個養(yǎng)車費用統(tǒng)計工具”,系統(tǒng)便能在30秒到1分鐘內(nèi)生成一個功能完整、可直接使用的個性化應(yīng)用。如果覺得界面不夠酷,只需說一句“改成《黑客帝國》風格”,界面立刻變?yōu)楹谏尘啊⒕G色代碼瀑布流樣式。
這一能力的背后,是代碼自動生成與多智能體協(xié)同調(diào)度技術(shù)的重大突破。過去,開發(fā)一個應(yīng)用需要產(chǎn)品經(jīng)理、設(shè)計師、前后端工程師通力合作;如今,普通人僅憑一句話就能完成整個流程。這種低代碼甚至無代碼的應(yīng)用生成模式,極大降低軟件開發(fā)門檻。“這真正實現(xiàn)了技術(shù)的普惠。”蔡偉強調(diào)。
此外,靈光還推出了“靈光開眼”功能。一個視覺交互入口,通過攝像頭,AI不再只是被動接收指令,而是主動“看見”并理解世界。“比如對準一棵植物,它能識別種類;拍一只狗,還能分析它的情緒狀態(tài)。”蔡偉解釋道,這種連續(xù)、自然的視覺交互方式,更貼近人類之間的溝通習(xí)慣,讓AI從“描述世界”邁向“感知世界”,成為用戶認知世界的智能伙伴。
AGI是一場長跑
“不能為了AI而AI”
對于靈光為何獨立支付寶這個巨大流量池存在?何征宇分享了他的觀點。
“我們不是不嵌入,而是不能為了AI而AI。”事實上,AGI能力早已悄然滲透進支付寶,舉個例子,用戶說一句“叫個代駕回西溪園區(qū)”,系統(tǒng)便能自動解析并執(zhí)行。這些東西已經(jīng)在支付寶主端開始慢慢落地了,只是它沒有發(fā)現(xiàn)一個界面上的東西,或者沒有單獨發(fā)一個APP,大家感知力沒有那么強。
何征宇進一步解釋到:“每個產(chǎn)品必須有清晰的主張。靈光解決的是信息獲取與任務(wù)完成的效率問題,而支付寶主端則聚焦支付、生活服務(wù)等場景。兩者協(xié)同而非替代。事實上,靈光的很多技術(shù)已經(jīng)慢慢擴散到螞蟻的其他幾大支柱產(chǎn)品了,包括螞小財、AQ等,未來用戶會感受到一股‘靈光味’。”
從時間上看,對文心一言、豆包等先行者,靈光是否起步太晚?
“早和晚是相對的,它不是一個絕對的時間。”蔡偉表示,就像抖音推出的時候,很多人說快手已經(jīng)搞了三四年了,其實是一個道理,模型能力在發(fā)展,用戶自己的品味也在發(fā)展,不管是從2022年算,還是從今年算,還是從之后算,大家也一直在思考,對大模型的時代,它整體的節(jié)奏是什么樣子的,很多人會把大模型的時代跟之前移動互聯(lián)網(wǎng)的時代去比,“我認為始終會有這么一個拐點,這個拐點就意味著大模型應(yīng)用的一個爆發(fā),目前的判斷,至少今天此時此刻還沒有到。”
“我認為從做應(yīng)用,做產(chǎn)品創(chuàng)造價值的角度,我們要做的不是等這個時刻到來。我們能做的是在這個時刻到來之前全力的狂奔,甚至我們在做的這個事情,也在加速著這個時刻的到來。所以,我相信對于大模型應(yīng)用來講,現(xiàn)在的這個時間拉長視角看,依然是一個非常早期的時間,未來還會有非常多的機會。”蔡偉說。
關(guān)于靈光與通義千問二者的競合關(guān)系,何征宇表示,前后腳發(fā)布時間純屬巧合,但技術(shù)上確實融合了千問及多個開源模型。
“我理解是應(yīng)該是共赴AGI的戰(zhàn)友和兄弟的感覺。”一個簡單的例子,在沙漠中要找水的話,一定不會把所有人都派到一個方向上,一定是好幾路一起去找,誰找到了大家一起分,應(yīng)該是一個這樣的邏輯。
商業(yè)化為時尚早
創(chuàng)造用戶價值是關(guān)鍵
從3月立項到11月上線,8個月時間對C端AI產(chǎn)品而言堪稱極速。面對未來商業(yè)化問題,團隊保持高度克制。
“現(xiàn)在談商業(yè)化,為時尚早。”在蔡偉看來,所有互聯(lián)網(wǎng)產(chǎn)品的一個規(guī)律,當能夠創(chuàng)造出足夠用戶價值,它帶來的結(jié)果就是用戶的黏性和使用的頻次到達一定的水位,當?shù)竭_這樣的水位,總能找到一個好的辦法去做商業(yè)化,這是一個自然而然的結(jié)果。“很多產(chǎn)品如果說商業(yè)化不太好、效率不高,我認為本質(zhì)上反映的是創(chuàng)造的用戶價值不夠大。”
“因為靈光上線才兩天,不可能讓一個2歲的孩子出來打工。”何征宇比喻道,當然,等他大學(xué)畢業(yè)了,可以找一個好的行當,看看他打那份工比較好。“我們相信AGI時代,它應(yīng)該有一種區(qū)別于現(xiàn)在所有傳統(tǒng)的商業(yè)模式出現(xiàn),這需要我們和行業(yè)一起探索”。





京公網(wǎng)安備 11011402013531號