騰訊混元OCR模型宣布開源參數僅為1B 多項核心能力達到SOTA效果

IP屬地中國·北京 智通財經 時間：2025-11-25 16:20:32

智通財經APP獲悉，11月25日，騰訊混元推出全新開源模型 HunyuanOCR，參數僅為1B，依托于混元原生多模態架構打造，獲得多項業界OCR應用榜單SOTA(最先進水平)成績。據介紹，HunyuanOCR 具有高度易用性，不僅體積小，便于部署，得益于混元原生多模態大模型“端到端”的理念設計，各項功能僅需單次前向推理即可直達最優結果，較業界級聯方案更高效和便捷，性價比高。
混元OCR專家模型依托于混元原生多模態架構打造，主要由三大部分組建構成：原生分辨率視頻編碼器、自適應視覺適配器和輕量化混元語言模型。
不同于其他開源的OCR專家模型或系統，HunyuanOCR模型的訓練和推理均采用全端到端范式，通過規模化的高質量應用導向數據，結合在線強化學習，模型表現出了非常穩健的端到端推理能力。
值得注意的是，混元OCR多項核心能力達到SOTA效果，其中在復雜文檔解析的OmniDocBench測評中，獲得了最高的94.1分，效果超過了谷歌的Gemini3-pro等一眾領先的模型;文字檢測和識別能力，在自建覆蓋了9大應用場景(文檔、藝術字、街景、手寫、廣告、票據、截屏、游戲、視頻)的基準上，大幅度領先同類開源模型以及商業OCR模型;在OCRBench榜單上，總得分為860分，以僅僅1B總參數的模型配置，取得了包括通用視覺理解模型在內總參數3B以下的SOTA成績。

免責聲明：本網信息來自于互聯網，目的在于傳遞更多信息，并不代表本網贊同其觀點。其內容真實性、完整性不作任何保證或承諾。如若本網有任何內容侵犯您的權益，請及時聯系我們，本站將會在24小時內處理完畢。

同類資訊

阿里千問緊急辟謠

力積存儲再度遞表沖擊港股IPO：近年累虧超5億元，利基DRAM布局下仍面臨多重挑戰

一加中國區總裁李杰：Turbo系列擁有“超巨量的電池”

華為云零售峰會2025：Data+AI雙引擎實效落地，共筑智能時代新零售

安卓上線“擴展深色主題”設置，專治堅守淺色UI的“不聽話”App

國產GPU四小龍IPO齊活！最后一個剛剛公布

全站最新

阿里千問緊急辟謠

力積存儲再度遞表沖擊港股IPO：近年累虧超5億元，利基DRAM布局下仍面臨多重挑戰

一加中國區總裁李杰：Turbo系列擁有“超巨量的電池”

華為云零售峰會2025：Data+AI雙引擎實效落地，共筑智能時代新零售

熱門推薦

阿里千問緊急辟謠

力積存儲再度遞表沖擊港股IPO：近年累虧超5億元，利基DRAM布局下仍面臨多重挑戰

一加中國區總裁李杰：Turbo系列擁有“超巨量的電池”

華為云零售峰會2025：Data+AI雙引擎實效落地，共筑智能時代新零售

安卓上線“擴展深色主題”設置，專治堅守淺色UI的“不聽話”App

國產GPU四小龍IPO齊活！最后一個剛剛公布

蚌埠滕湖機場完成驗證試飛！

中國新礦物團隊再添一員！“金秀礦”正式命名背后有多難？｜封面專訪

羅永浩吐槽后，上海電信：WIFI速率不達標原因很多

李禮輝：必須加快制度創新，確定金融智能體的法律地位

TikTok美國迎“大結局”：持股19.9%合資方案對TikTok意味著什么？

紫光國微：在商業航天領域，公司的FPGA等系列產品正陸續導入

上海電信回應“WIFI速率不達標”

TikTok內部信“泄密”：被反復討論的“美國協議”，到底發生了什么？

我國科學家實現新一代光計算芯片研究新突破

首頁

資訊

財經號

智能車

專題

電商資訊

人物資訊

滾動資訊

首頁

新科技

新金融

新零售

智能車

房地產

科技探索

人物資訊

網絡游戲

人工智能

騰訊混元OCR模型宣布開源參數僅為1B 多項核心能力達到SOTA效果

首頁

資訊

財經號

智能車

專題

電商資訊

人物資訊

滾動資訊

騰訊混元OCR模型宣布開源 參數僅為1B 多項核心能力達到SOTA效果

同類資訊

騰訊混元OCR模型宣布開源參數僅為1B 多項核心能力達到SOTA效果