3 月 28 日消息,微軟于 2024 年 12 月邀請 Copilot Pro 用戶測試之后,現(xiàn)已邀請非 Pro 的美國地區(qū)用戶,在 Microsoft Edge 瀏覽器中測試 Copilot Vision 功能。

援引科技媒體 Windows Latest 實(shí)測結(jié)果,顯示該功能雖能識別頁面內(nèi)容,但存在響應(yīng)中斷、交互受限、視野范圍狹窄等明顯缺陷,目前僅適合提取基礎(chǔ)信息,尚不具備實(shí)用價(jià)值。
Copilot Vision 功能原僅限 Copilot Pro 付費(fèi)用戶使用,現(xiàn)已擴(kuò)展至美國地區(qū)免費(fèi)用戶,但需通過 Edge 瀏覽器側(cè)邊欄調(diào)用。
操作流程是用戶在 Bing 搜索“Copilot Vision”并點(diǎn)擊匹配結(jié)果,接受條款后,通過側(cè)邊欄語音圖標(biāo)激活“眼鏡”按鈕,按鈕高亮即表示可掃描當(dāng)前網(wǎng)頁。
該媒體實(shí)測發(fā)現(xiàn)該功能目前仍屬于“半成品”,測試中多次出現(xiàn)回答中斷或陷入循環(huán),需重復(fù)提問才能獲取不完整答案。例如,要求描述網(wǎng)頁內(nèi)容時(shí),Copilot 中途停止響應(yīng) 15 秒后突然切換答案。
此外在交互方面,無法執(zhí)行點(diǎn)擊、播放視頻等操作,甚至拒絕用戶“停止說話”的指令,稱“無法訪問頁面元素”,此外僅能識別屏幕可見區(qū)域內(nèi)容。
在信息處理方面,依賴頁面現(xiàn)有文字,無法主動檢索網(wǎng)絡(luò)數(shù)據(jù),滾動頁面后無法關(guān)聯(lián)此前識別的相關(guān)信息。



該媒體認(rèn)為當(dāng)前 Copilot Vision 更像“半成品”,其掃描范圍窄、邏輯混亂等問題大幅降低實(shí)用性。微軟需優(yōu)化滾動瀏覽、跨頁檢索等核心功能,才能兌現(xiàn) AI 助手的潛力。免費(fèi)開放或許是為收集用戶反饋,但現(xiàn)階段僅建議用于簡單頁面摘要。



京公網(wǎng)安備 11011402013531號