騰訊混元OCR模型宣布開源:參數量1B 支持14種小語種翻譯
11月25日,騰訊混元于11月25日推出開源OCR模型HunyuanOCR,該模型參數量為1B,基于混元原生多模態架構構建,在多項OCR應用評測中取得當前最優效果。

該模型采用端到端訓練推理范式,通過單次前向推理即可完成多項任務,相比傳統級聯方案更具效率優勢。其架構由原生分辨率視頻編碼器、自適應視覺適配器與輕量化語言模型三部分組成。
在性能方面,HunyuanOCR在復雜文檔解析評測OmniDocBench中獲得94.1分,超過谷歌Gemini3-pro等模型;在涵蓋文檔、街景、手寫等九大場景的測試集上,其文字檢測與識別能力領先同類開源及商業模型。同時,該模型支持14種小語種翻譯,并在ICDAR2025文檔翻譯比賽中獲得小模型賽道冠軍。
目前該模型已應用于票據字段抽取、視頻字幕識別及拍照翻譯等場景,并正式對外開放源代碼。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為“我要久久發用戶上傳并發布”,本平臺僅提供信息存儲服務。
熱門文章
- 1024程序員節京東開放“零幀起手”數字人技術
- 新款藍電E5 PLUS來了!限時11.98萬,純電續航230公里,配FSD懸架
- 吉利豪越L中型SUV煥新登場,限時8.99萬起,大空間多座可選還配雙動力
- 12月車市盛宴來襲!6款熱門轎車扎堆上市 新款卡羅拉等重磅登場
- 9.78萬起的零跑Lafa5上市 搭載雙AI大模型與激光雷達
- 豐田GR GT跑車12月5日全球首發,大排量混動超跑劍指德系勁敵
- 捷尼賽思GV90或推雙版本車門布局 旗艦級純電SUV預計2026年末亮相
- 新款問界M7無偽諜照曝光!采用全新家族式前臉,尾部造型更精致
- 卡樂馳CARLOCS:都說新車別貼隱形車衣,到底是為什么?
- 長安福特新蒙迪歐12月4日上市:全新進氣格柵、隱藏式門把手
- 北京汽車制造廠212 T01混動版發布,外觀復古硬朗,明年一季度上市
- 銀河航天徐鳴:太空基建加速跑 6G通信與新場景引領產業新變革
- 高中生跳高視頻因酷似易烊千璽爆火
- 宛如畫卷!黑龍江一湖面現龍鱗冰奇觀
- 正直播NBA:鵜鶘vs勇士
- 電動自行車新國標將全面落地
- 2026年國考371.8萬人參加
- 村民用了多年的墊腳石竟是恐龍化石
- 跳水式降溫來了!全國多地冷到發紫
- 國考打破35歲門檻后 他們決定去考公