当前位置:首页 → 电脑软件 → 中国体育代表团呼吁包容失误运动员 → 12bet网页版 v4.380.7437 安卓最新版
v3.47.1910.827760 最新版
v5.707.9400.344922 最新版
v2.50 最新版
v2.59.8594.210356 最新版
v8.206.7325.721865 PC版
v7.252.5404 最新版
v1.645 最新版
v6.307.6745.125566 IOS版
v2.5 最新版
v4.307 PC版
v8.298.6543.420818 安卓最新版
v1.695 PC版
v4.363.8176 IOS版
v8.307.1925 安卓版
v4.1.9620 IOS版
v8.527.5052.459267 PC版
v6.253.8992.70489 安卓最新版
v1.592.3861.461371 最新版
v3.455.4539 安卓免費版
v6.871.1260.654286 安卓免費版
v4.88.5147.210956 安卓漢化版
v6.419.854 安卓漢化版
v3.978.7857.66540 IOS版
v7.808 最新版
v2.0.6552.694790 安卓最新版
v4.946.6669.736059 PC版
v8.174 安卓漢化版
v3.533.6458.903401 安卓版
v5.398 安卓版
v3.362.8551.855139 IOS版
v9.10 安卓免費版
v9.76.8799 安卓漢化版
v3.301 安卓免費版
v3.527.8733.344141 安卓最新版
v6.833.3110.359744 PC版
v7.73 安卓版
v5.476.9731.671044 安卓免費版
v3.672.9657.754754 安卓免費版
v9.914.5681.11565 安卓漢化版
v1.861.576 PC版
v6.742.9352.107057 安卓漢化版
v7.540.685.494102 安卓漢化版
v9.407 安卓版
v5.503.5453.234013 IOS版
v5.276.4819.961317 安卓最新版
v4.71.7045.441974 PC版
v7.667.8286.438509 安卓最新版
v9.955.2540.885083 安卓漢化版
v2.55.6945 安卓免費版
v6.378.6808.210102 安卓免費版
v3.103 安卓最新版
v2.771 安卓最新版
v6.646.1323.13088 PC版
v3.822.8486.215248 安卓最新版
v2.625.8406.296372 PC版
v4.994 PC版
v4.512.2185 安卓最新版
v4.3.8383.61445 安卓最新版
v7.585.5643.529153 安卓免費版
v3.72.4948.232836 最新版
v4.31.5679 安卓版
v6.816 最新版
v5.308 PC版
v5.300.1707.35483 PC版
v8.847 安卓版
v6.187.2790.336187 安卓最新版
v9.83.2720.813922 IOS版
v2.149.2517.701748 安卓漢化版
v7.478.6686.381918 安卓最新版
v4.899.1745.80995 安卓免費版
v1.130.9904 安卓版
v8.611.5837.635422 安卓免費版
v4.575.8781.133251 PC版
v4.61 安卓漢化版
v3.451.6162 IOS版
v7.25.4608.110300 PC版
v1.604.2721 最新版
v2.38.4889.579326 IOS版
v5.918.428.792719 安卓免費版
v2.149.4749.20582 安卓漢化版
12bet网页版
智通财经APP获悉,11月25日,腾讯混元推出全新开源模型 HunyuanOCR,参数仅为1B,依托于混元原生多模态架构打造,获得多项业界OCR应用榜单SOTA(最先进水平)成绩。据介绍,HunyuanOCR 具有高度易用性,不仅体积小,便于部署,得益于混元原生多模态大模型“端到端”的理念设计,各项功能仅需单次前向推理即可直达最优结果,较业界级联方案更高效和便捷,性价比高。
混元OCR专家模型依托于混元原生多模态架构打造,主要由三大部分组建构成:原生分辨率视频编码器、自适应视觉适配器和轻量化混元语言模型。
不同于其他开源的OCR专家模型或系统,HunyuanOCR模型的训练和推理均采用全端到端范式,通过规模化的高质量应用导向数据,结合在线强化学习,模型表现出了非常稳健的端到端推理能力。
值得注意的是,混元OCR多项核心能力达到SOTA效果,其中在复杂文档解析的OmniDocBench测评中,获得了最高的94.1分,效果超过了谷歌的Gemini3-pro等一众领先的模型;文字检测和识别能力,在自建覆盖了9大应用场景(文档、艺术字、街景、手写、广告、票据、截屏、游戏、视频)的基准上,大幅度领先同类开源模型以及商业OCR模型;在OCRBench榜单上,总得分为860分,以仅仅1B总参数的模型配置,取得了包括通用视觉理解模型在内总参数3B以下的SOTA成绩。
相关版本
多平台下载
查看所有0条评论>网友评论