![]()
智東西
作者 陳駿達
編輯 云鵬
智東西10月26日報道,生成式AI技術正在加速滲透至搜索、推薦和廣告領域,昨日,快手在一場技術沙龍活動中全方位解讀了生成式技術在快手推薦系統、電商搜索、廣告出價場景中的實踐與應用。
這場技術沙龍集齊了快手在推薦、搜索、廣告三大領域(簡稱“搜推廣”)的四位負責人,以及來自中國人民大學、香港城市大學的學術專家,共同探討生成式框架在搜推廣領域的潛力。
快手已經將生成式技術全面運用于搜推廣系統。推薦系統方面,快手的OneRec實現了從傳統判別式到生成式的全面躍遷,具備推理與思考能力,已在主站、電商、極速版等場景落地;短視頻推薦排序框架通過端到端多目標融合與對比學習,實現了用戶體驗的智能自進化。
搜索領域的OneSearch以生成式大模型取代“召回—粗排—精排”架構,顯著提升CTR、CVR和訂單量;廣告出價環節則引入生成式強化學習,通過GAVE與CBD范式實現高效、低延遲、全空間優化的自動出價。
圓桌對話環節中,來自學術界的徐君教授與趙翔宇副教授認為,生成式范式雖面臨挑戰,但其“將搜索與推薦從行為預測轉向意圖理解”的根本性創新,正在改變整個行業的技術邏輯。
徐君指出,“偽范式”的批評并不成立,因為快手等公司已在真實商業場景中驗證了其價值。趙翔宇補充道,大模型憑借自回歸學習能力與內置世界知識,能夠更精準地理解復雜行為序列,為搜索、推薦和廣告建立了新的理論基礎。
在關于成本與收益的辯論中,快手推薦大模型資深算法專家王詩瑤提出:“不能用昨天的尺子量今天的模型。”她認為計算成本持續下降、算法回報卻呈幾何級增長,關鍵不是算得起,而是配得上算力。
快手商業化算法部負責人蔡慶芃則強調,大模型基礎建設是一次性成本,而收益是持續累積的,只要ROI為正,就值得投入。快手貨架電商搜索與推薦算法負責人楊一帆進一步強調,這個賬其實能算清楚,機器成本會下降,算法收益會增長,核心是技術團隊要有長期視角——“要想著撬動新的收益,而不是只壓縮成本。”
一、快手搜推廣技術探索全揭秘,生成式方案展現潛力
快手在推薦、搜索、廣告領域的四位專家分享了快手在相關領域的最新技術進展。
1、OneRec:如何重構推薦系統的智能邊界與效率標準?
快手推薦大模型資深算法專家王詩瑤認為,大模型的興起讓推薦系統從傳統的判別式范式邁向生成式范式,為突破傳統推薦的智能天花板提供了可能。
快手在生成式推薦方面的重要探索為OneRec,其演進分為三階段。oneRec V1首次實現端到端生成式推薦,用單一模型直接生成待推薦內容的對應token,突破傳統多級判別結構。oneRec V2則針對算力在Encoder和Decoder側的不均衡分布進行了優化,提出Lazy Decoder Only架構,并采用強化學習,最終大幅提升計算效率與可擴展性.
最新的oneRec Think則將用戶行為日志視為新模態,與語言模型對齊,讓推薦系統具備推理與思考能力,能夠解釋用戶偏好并生成更具洞察力的推薦。
![]()
目前,OneRec已在快手主站、極速版及電商等多場景落地,帶來顯著的業務提升。王詩瑤稱,團隊將繼續探索生成式推薦與大模型的融合,推動推薦系統向更智能、更通用的方向演進。
2、下一代推薦排序:快手短視頻端到端多目標融合框架詳解
快手短視頻推薦算法鏈路機制策略技術負責人徐曉曉分享了團隊近半年打磨的成果——端到端動目標排序機制框架。這是快手近兩年在用戶體驗提升最顯著的推薦系統項目之一。
該方案以模型化替代傳統的人工設計融合公式,實現了推薦排序機制的端到端智能優化。通過聚焦“四大挑戰”:候選間比較關系、用戶滿意度定義、模型可解釋性及離在線一致性,團隊構建了系統性解決方案。
比較關系建模方面,該方案以請求為單位組織候選樣本,引入位置特征與Transformer結構,捕捉候選間相對關系。滿意度定義上,他們提出了“相對優勢滿意對度與“多維滿意度代理”,結合自進化的個性化動態權重實現多目標平衡。
![]()
為增強可解釋性,該團隊引入反事實樣本生成與對比學習,保障模型輸出與輸入特征單調性。同時,為了優化離在線一致性,他們定義了“互動效率”指標,消除觀看時長混淆,實現離線與線上指標統一。
落地結果顯示,模型在多個鏈路中顯著提升用戶體驗,特別是在快手極速版中,停留時長提升約2%,7日留存提升超3‰。項目標志著推薦機制從規則驅動邁向智能自進化的新階段。
3、讓搜索“一步到位”,快手端到端生成式搜索框架OneSearch
快手貨架電商搜索與推薦算法負責人楊一帆介紹了業界首個電商搜索端到端生成式框架OneSearch,該框架以生成式大模型全面取代傳統“召回—粗排—精排”架構,提升搜索系統的相關性與個性化體驗。
該框架的核心創新體現在三個方面:首先,關鍵詞增強層次量化編碼通過結合RQ與OPQ的五層層次編碼機制,為每個商品生成語義豐富的“智能身份證”,精準提取核心屬性并區分細微差異,有效解決了商品標題堆砌關鍵詞、屬性混亂等問題。
其次,多視角用戶行為建模將用戶的短期搜索與點擊行為顯式注入模型,同時隱式融合長期購買偏好,構建具有語義理解能力的用戶標識(UID),實現對用戶即時意圖與穩定興趣的精準捕捉。
最后,偏好感知獎勵系統(PARS)結合多階段監督微調與強化學習,對齊線上精排分布,并基于真實用戶交互數據優化排序邏輯,從而捕捉更細粒度的偏好信號。
實驗結果顯示,OneSearch在CTR、CVR、訂單量等核心指標上均顯著提升,訂單量提高3.22%、成本降低75%,在冷啟動和長尾查詢場景中表現尤為突出,標志著生成式搜索在工業級電商領域的成功落地。
![]()
4、生成式強化學習在廣告自動出價場景的技術實踐
快手商業化算法部負責人蔡慶芃介紹,快手廣告出價技術經歷了三次演進:從基于反饋調節的PID控制,到具備預測能力的MPC模型預測控制,再到多步決策優化的強化學習出價。
針對傳統強化學習在序列信息利用和探索效率上的不足,快手提出新一代生成式強化學習出價范式,融合生成模型與強化學習優勢。
為解決對高質量數據的依賴,快手推出了GAVE方法(Generative Auto-bidding with Value-Guided Exploration),通過Reture-To-Go模塊和價值引導探索機制,最終實現更好的出價;CBD方法(Causal auto-Bidding via Diffusion completer-aligner)則在生成時利用trajectory-level aligner更新序列,對齊優化目標。
![]()
實驗表明,該范式提升了廣告轉化與成本控制效果,推理延遲僅為毫秒級,可穩定在線應用。
二、六位專家激辯,生成式框架是未來還是偽范式?
在圓桌對話環節,中國人民大學高瓴人工智能學院教授徐君、香港城市大學副教授趙翔宇、快手推薦大模型資深算法專家王詩瑤、快手貨架電商搜索與推薦算法負責人楊一帆、快手商業化算法部負責人蔡慶芃就生成式框架在搜推廣領域的潛力展開討論,快手推薦模型部排序模型技術負責人唐睿明擔任主持人。
唐睿明稱,當前業內的一大討論是,在搜推廣系統,生成式框架到底是不是偽范式,有沒有取代傳統級聯架構的潛力?
徐君認為,“偽范式”的批評過于嚴重,因為快手等公司已經在大規模商業應用中看到了實際效果。生成式框架解決了傳統級聯架構的問題,如錯誤傳遞等。
此外,生成式框架將過去搜索與大模型之間“若即若離”的關系轉變為緊密捆綁,從而能更好地利用大模型的前沿技術。
雖然技術的迭代速度在不斷加快,一項技術的生命周期從幾十年縮短十幾年,再到幾年,但只要技術有用,就值得擁抱和嘗試。
趙翔宇認為,生成式范式的根本性創新在于,它將推薦系統的核心任務從傳統的行為相關性預測,轉變為了對用戶意圖的深度理解和推理。大模型憑借其自回歸的學習能力和內置的世界知識,能夠更精準地解讀用戶復雜的行為序列,從而為搜索、推薦和廣告建立了一個全新的、更為強大的理論基礎和實現模式。
而在工業界,現實情況則更為多元。盡管像快手這樣的先行者已經通過一個模型的統一范式取得了顯著收益,證明了其解決傳統級聯架構中目標不對齊、誤差累積和資源利用率低等問題的巨大潛力,但許多公司因現狀所限,短期內更可能將生成式推薦作為現有成熟體系的一種補充或增強。畢竟,傳統的級聯模式在低時延、高并發的場景下已經高度優化且穩定。
同時,生成式框架當前仍面臨即生成效率問題。值得欣喜的是,業界和學界已經涌現出許多工作來攻克這一難題。
王詩瑤認為,生成式推薦可能是未來,也可能只是通向更好技術的中間形態。如果未來出現更具優勢的新技術,她會毫不猶豫地擁抱變化。但此刻,生成式就是最值得用好的技術。
她舉例說,如今的推薦系統多是“瀑布式”的,被動展示內容,而未來可能進入對話式推薦場景,用戶會多輪表達意圖,這些意圖可能相互關聯、甚至矛盾。面對這種復雜輸入,傳統系統靠規則拼接是“技術的倒退”,而生成式模型能更自然地理解并生成結果。
她還提到,類似的技術演進已在其他領域出現,例如特斯拉用端到端模型替代了數十萬行手寫代碼,正是數據與模型驅動的勝利。王詩瑤認為,現在正是用好生成式技術的時刻。
楊一帆從搜索視角出發,認為生成式不是終局,但無疑是一次值得興奮的變革。他指出,在搜索中,對意圖理解、檢索空間與推理能力的要求更高,而生成式模型改變了傳統“篩選優化”的邏輯,轉向“智能生成”。
同時,生成式范式能更自然地與當下大模型的發展結合,引入推理、知識等能力。最后他強調,技術變革也會帶來產品形態的革新,如對話式搜索等新交互方式,未來的搜索推薦可能由此形成新的循環。
蔡慶芃從廣告角度出發,認為生成式架構的最大優勢是“全空間優化”。傳統多階段模型目標不一致、數據分散,優化上限受限。端到端生成能在完整空間中找到最優的廣告投放策略。
他提到,生成式方法與強化學習結合的潛力巨大,能更好地定義狀態、動作、獎勵,推動真正意義上的業務價值優化。過去廣告系統的割裂讓強化學習難以落地,而生成式范式能解決這個問題,讓廣告優化不再局限于局部模塊。
三、生成式范式經濟賬怎么算,工業界、學術界究竟需要何種人才?
在關于成本與收益的討論中,王詩瑤提出:“不能用昨天的尺子量今天的模型。”她認為算法同學往往被“算力固定”的假設束縛,但事實上計算成本持續下降,而收入增長潛力巨大。哪怕在高毛利要求下,公司也完全有能力承載更大的模型規模。她鼓勵技術人員更多去思考如何開發配得上算力的好技術,而不是過早自限。
楊一帆補充說,這個賬是能算清楚的。機器成本會隨時間下降,工程優化會不斷提升。關鍵是技術團隊要保持長期視角,通過算法創新撬動新的收益,而不是只想著壓縮成本。
蔡慶芃則認為,大模型的基礎建設是一次性成本,而收入增長是持續累積的。只要ROI為正,成本問題就不是阻礙。此外,他還強調,通過蒸餾等手段完全可以在保持收益的前提下用更小模型上線。
談到研究方向時,趙翔宇提到兩個重點:一是構建更通用的詞表,將語義、交互、地理等多模態信息融合進來;二是設計新的詞表評估體系,讓token層的質量與推薦效果形成可解釋的閉環。
楊一帆則希望探索更統一的多模態編碼,使不同物料(商品、視頻、直播)在同一空間中建模,同時提升模型的推理能力,從而催生新的交互形態。
蔡慶芃關注廣告出價與推薦中的生成機制,他認為廣告決策是連續的,需要新的生成結構,并對“非自回歸”生成方式非常感興趣——人類思考不是逐字生成,而是從核心意圖出發再補全細節。他還提到,可以通過推理能力更好地理解用戶心理,預測他們真正的興趣。
在對未來1到3年的展望中,徐君認為,未來搜索、推薦和廣告不再是分離的模塊,而會統一為“個人信息助手”的形態。屆時,用戶無需再區分搜推廣,系統將直接呈現他們真正想要的內容。
他還預測,下一代系統會從“語義匹配”升級到“語用理解”,真正理解用戶行為背后的動機,實現從工具到智能助手的演進。
蔡慶芃則認為,未來的最大機會不在于對現有模塊進行小修小改,而是用生成式技術重塑廣告系統,不只是提升ROI,而是重新定義廣告體系。此外,Agent在廣告場景的應用,有望實現從素材生產到預算投放實現全鏈路智能化。
王詩瑤進一步暢想,未來推薦也許由“個人助理”主導,這個助理深知用戶的偏好、經歷與購買記錄,能主動生成最契合的內容。同時,她提到視頻內容可能被“實時生成”,用戶不再被動瀏覽,而是看到“為我生成”的動態視頻世界。
最后在關于“學生培養與人才選擇”的話題中,趙翔宇認為,當下的學生需要具備縱向的算法深度與橫向的大模型工程能力。既要深入理解傳統搜推體系(協同過濾、矩陣分解、強化學習等),也要掌握大模型的全流程技術(微調、特征工程、prompt設計等)。他強調,最有價值的科研往往來源于真實問題,希望學生能在實習或合作中找到能落地的研究方向。
徐君補充說,基礎仍然是關鍵,特別是數學與邏輯的嚴謹性。學生要在“頂天立地”至少找到一個抓手,要么做理論深度的研究,要么能解決真實產業問題。他還提醒,科研的意義不應被論文數量綁架,而應關注實際價值。
楊一帆從企業角度指出,工業界看重的是業務理解力和快速學習力。搜推是高度業務驅動的領域,技術人員必須能抽象業務問題并將其轉化為模型。他建議學生保持好奇心和學習熱情,因為技術迭代太快,只有持續學習,才能不被時代落下。
此外,他也希望學生在學習前沿技術時,不應只停留在當下的應用層面,而應當了解技術發展的歷史與脈絡。如今很多“AI原生代”同學直接接觸的是Transformer、大模型等最新成果,卻不了解這些技術從早期模型一路演進的過程。他建議學生應多學習計算機與人工智能技術史,理解技術的迭代邏輯和背后的思想脈絡。
結語:生成式技術改變搜推廣
從端到端的推薦系統,到具備推理能力的搜索引擎,再到更為智能的廣告出價系統,生成式技術正在改變搜推廣的底層邏輯。
正如多位嘉賓所言,生成式不是終點,而是通往更智能系統的起點。未來,快手在該領域的探索,值得持續關注。
![]()





京公網安備 11011402013531號