v3.403 最新版
v3.640.9944 最新版
v2.755.3658.7553 安卓免費版
v3.486.5138.387149 安卓版
v9.253.3608.802488 安卓漢化版
v2.369 安卓最新版
v7.546.8362 PC版
v6.403.3385 PC版
v3.650.1627 PC版
v1.977.2396 安卓免費版
v7.690.7735.660142 PC版
v8.653 安卓最新版
v4.536 安卓漢化版
v3.762.6994.126348 安卓免費版
v6.463.1287.543501 安卓免費版
v5.533 安卓最新版
v5.557 最新版
v4.982.4249 PC版
v3.810.8118.688831 安卓免費版
v5.637.2156 安卓免費版
v1.956.7411.348408 安卓最新版
v8.683.6012 安卓版
v4.506.8463 安卓免費版
v5.584.6413.283428 最新版
v6.574.4152.608698 PC版
v4.122.3183.393176 PC版
v9.503.8129.158426 安卓版
v5.239.4894.400759 PC版
v2.464.5521.487037 安卓漢化版
v3.314 安卓免費版
v3.696.1675.138387 安卓免費版
v9.596 安卓免費版
v1.868.7477 安卓免費版
v6.462.8528 最新版
v6.633.4711 安卓版
v4.505.1435.353780 安卓漢化版
v1.943.1880.273578 PC版
v4.775 最新版
v4.189.7301 安卓最新版
v7.86.9528.710137 安卓免費版
v7.796 IOS版
v1.162 安卓最新版
v2.441.4920.137827 安卓免費版
v1.559.38.269400 IOS版
v5.361.586 安卓漢化版
v8.616.3842.981604 PC版
v8.71.5845 PC版
v6.864.206 安卓漢化版
v9.586.3981 安卓免費版
v4.18 最新版
v5.704 最新版
v1.556 最新版
v4.672.5904.609796 最新版
v5.330.8293.396620 安卓免費版
v4.73 IOS版
v5.65.8267.893088 PC版
v3.822.5438.39108 IOS版
v2.358 安卓版
v7.690.9258.765015 安卓最新版
v9.547.3830.102373 PC版
v8.192.2768 安卓最新版
v5.136.816 最新版
v9.667.9208.535554 安卓免費版
v2.454.2183 IOS版
v5.215.5959.643543 PC版
v7.472.3257 IOS版
v3.151.8006.190500 安卓免費版
v7.137.8262 安卓最新版
v4.958.8745.840446 PC版
v4.208.6198.497125 安卓版
v2.495.2458 最新版
v4.454 安卓免費版
v7.904.962.180064 安卓免費版
v5.188 安卓免費版
v5.794.7974.233086 PC版
v4.646.776.174665 PC版
v8.710 安卓免費版
v1.174.9226.454478 PC版
v4.699.1833.1194 安卓漢化版
v9.522.9342.173747 安卓版
真金斗地主官方版
智通财经APP获悉,11月25日,腾讯混元推出全新开源模型 HunyuanOCR,参数仅为1B,依托于混元原生多模态架构打造,获得多项业界OCR应用榜单SOTA(最先进水平)成绩。据介绍,HunyuanOCR 具有高度易用性,不仅体积小,便于部署,得益于混元原生多模态大模型“端到端”的理念设计,各项功能仅需单次前向推理即可直达最优结果,较业界级联方案更高效和便捷,性价比高。
混元OCR专家模型依托于混元原生多模态架构打造,主要由三大部分组建构成:原生分辨率视频编码器、自适应视觉适配器和轻量化混元语言模型。
不同于其他开源的OCR专家模型或系统,HunyuanOCR模型的训练和推理均采用全端到端范式,通过规模化的高质量应用导向数据,结合在线强化学习,模型表现出了非常稳健的端到端推理能力。
值得注意的是,混元OCR多项核心能力达到SOTA效果,其中在复杂文档解析的OmniDocBench测评中,获得了最高的94.1分,效果超过了谷歌的Gemini3-pro等一众领先的模型;文字检测和识别能力,在自建覆盖了9大应用场景(文档、艺术字、街景、手写、广告、票据、截屏、游戏、视频)的基准上,大幅度领先同类开源模型以及商业OCR模型;在OCRBench榜单上,总得分为860分,以仅仅1B总参数的模型配置,取得了包括通用视觉理解模型在内总参数3B以下的SOTA成绩。
相关版本
多平台下载
查看所有0条评论>网友评论