近期英伟达研究团队发表的本文指出,小语言模型(SLMs)在AI智能体(Agent)系统中展现出显著潜力,其性能可媲美甚至超越大语言模型(LLMs),同时具备更低的部署成本与延迟。研究认为,当前AI系统过度依赖大模型架构存在经济及环境可持续性方面的隐忧,而小模型凭借其高效的计算特性和较低的内存占用,更适合部署于智能手机、边缘设备等资源受限的终端环境。这一趋势也得到业界的积极响应,例如谷歌近期推出的270M参数Gemma模型,反映出行业对轻量化、高效率模型的重视。
在此背景下,源自麻省理工学院CSAIL实验室的LiquidAI公司推出了其首个视觉-语言基础模型系列LFM2-VL,致力于解决多模态模型因参数量过大而难以在终端设备部署的普遍问题。该模型系列旨在为智能手机、笔记本电脑、可穿戴设备及嵌入式系统提供高效、低延迟的视觉理解能力。目前,LFM2-VL的模型权重已在HuggingFace平台开源,极大便利了开发者和研究人员的使用与迭代。
LFM2-VL系列首批推出两种规格的模型,以适应不同硬件条件:LFM2-VL-450M具备4.5亿参数,面向智能手表及物联网节点等极端资源受限场景;LFM2-VL-1.6B则拥有16亿参数,适用于高端手机、PC及配备独立GPU的设备。据官方数据,该系列在GPU上的推理速度最高可达同类视觉语言模型的两倍,在图像描述、视觉问答等多项基准测试中表现优异,与更大参数模型相比毫不逊色,同时内存占用显著降低。
其性能优势源于LiquidAI自研的液态基础模型(LFM)架构。该架构借鉴动态系统与信号处理理论,在序列数据处理方式上与主流Transformer有所不同,从而具备计算效率的天然优势。LFM2-VL具体由语言模型主干、视觉编码器(采用SigLIP2NaFlex)和多模态投影器三大模块构成,实现了视觉与语言信息的高效对齐与融合。
为进一步提升效率,模型集成“像素解混”(pixel unshuffle)技术,可动态减少图像令牌数量,显著降低计算负荷。在图像输入方面,LFM2-VL支持原生512x512分辨率输入,无需裁剪或拉伸,避免常见失真问题。更大尺寸图像则通过无重叠分块处理,并辅以低分辨率缩略图编码以保留全局上下文,兼顾细节与整体语义理解。
该模型还具备良好的可调性与兼容性。开发者可在无需重新训练的情况下,通过调整图像令牌数量和分块策略,动态平衡推理速度与任务精度。LFM2-VL已集成至HuggingFace Transformers等主流框架,支持量化技术以进一步压缩模型体积,适应边缘设备的苛刻资源限制。
在许可策略上,LiquidAI对年收入低于1000万美元的企业提供免费商用授权,大型企业需联系获取商业许可。这一举措既降低了使用门槛,也体现出其对广泛生态建设的重视。LFM2-VL的出现为终端侧多模态AI应用提供了新的技术路径,其高效、轻量、可动态适配的特性,尤其契合AI智能体在边缘环境中的部署需求。
相关标签: lfm、 vl、 深度思考模型、 liquid、 多模态模型、
本文地址:https://www.dhslw.com/article/145.html
根据,日本经济新闻,2024年8月22日发布的文章,中国在气候变化与脱碳技术研究领域已展现出显著的国际领先地位,文章基于Scopus数据库对1992年至2024年间全球范围内约65万篇气候变化相关本文的分析,指出中国在本文数量、影响力及实际应用等多个维度均超越美国,成为该领域的核心力量,在本文产出方面,中国自2023年起实现历史性突破...。
嫦娥六号月球样品的最新研究成果为理解月球晚期地质活动提供了突破性视角,中国科学院广州地球化学研究所与香港大学合作团队通过对嫦娥六号返回样品的系统分析,揭示了月球在30亿年后仍存在火山活动的热动力学机制,相关成果发表于,科学进展,期刊,标志着我国月球科学研究取得重要进展,传统观点认为月球在30亿年前已基本结束火山活动,进入地质沉寂期,嫦...。
近日,鸿蒙智行智界系列产品总监@智界海蓝天在官方App中发布动态,透露智界R7车型的流媒体后视镜开发进度已进入加速阶段,并暗示团队仍在持续推进一项尚未公开的,重要事项,,引发广泛关注,尽管该总监未明确,那件事,所指为何,但其表述方式为品牌后续动作保留了较大的想象空间,也反映出智界在产品迭代和用户体验升级方面的持续投入,从技术层面来看,...。
东风风行星海V9越享系列的上市,标志着中大型新能源MPV市场正式进入20万元以内的价格区间,这一策略不仅重新定义了细分市场的竞争格局,也反映出当前新能源汽车行业,低价高配,的普遍趋势,新车以17.99万元和19.99万元的官方指导价推出两个版本,叠加国补和央补后,实际起售价进一步下探至14.99万元和16.99万元,显著降低了消费者入...。
苹果公司于当地时间8月21日宣布,其流媒体服务AppleTV,的月度订阅价格将上调至12.99美元,较原先的9.99美元上涨了30%,这一调整已于宣布当日在美国及部分国际市场正式生效,此次价格变动反映了苹果在流媒体市场竞争加剧的背景下,试图通过提高服务收入来平衡内容投入与用户增长之间的策略调整,从行业角度来看,此举可能对用户续订意愿产...。
哔哩哔哩,B站,近期发布的2024年第二季度及上半年财务数据显示,公司实现了自上市以来的首次半年度盈利,标志着其业务转型与财务健康度取得显著进展,从整体业绩来看,第二季度总营收达到73.4亿元,同比增长20%,净利润与调整后净利润分别为2.18亿元和5.6亿元,较去年同期净亏损6亿元大幅改善,创下历史新高,上半年总营收为143.4亿元...。
近日,有关东方甄选前CEO孙东旭或将离职的消息在社交媒体引发广泛讨论,相关话题一度登上热搜,引发市场与公众的高度关注,根据南方日报8月22日的报道,有知情人士透露,孙东旭目前正处于个人常规的年度夏季休假阶段,预计休假结束后将正常返岗,不存在离职计划,这一回应旨在澄清外界对其职业动向的猜测,强调其休假仅为惯例安排,而非职务变动的前兆,从...。
根据俄罗斯科学院院长克拉斯尼科夫于当地时间8月22日公布的信息,俄罗斯未来十余年的深空探测计划已进一步明确,其核心聚焦于月球与金星的系统性科学探索,整体来看,俄罗斯正逐步构建一个从绕月探测、着陆采样到长期科研的完整月球探索体系,而金星任务则因技术或资源调整有所延后,在月球探测方面,计划呈现出清晰的阶段性推进特征,2028年将发射,月球...。
关于东方甄选前CEO孙东旭的近期传闻及职业生涯回顾,可以从多个维度展开分析,针对2024年8月22日南方日报援引知情人士所称的,孙东旭目前仅为常规年度休假、无离职计划,的消息,需结合其过往职务变动及公司动态综合评估,尽管该消息强调其休假属个人常规安排,但考虑到2023年12月其CEO职务被免、后续复出直播等事件,外界对其职业动向持续关...。
iconfont-国内功能很强大且图标内容很丰富的矢量图标库,提供矢量图标下载、在线存储、格式转换等功能。阿里巴巴体验团队倾力打造,设计和前端开发的便捷工具
通义是一个通情、达义的国产AI模型,可以帮你解答问题、文档阅读、联网搜索并写作总结,最多支持1000万字的文档速读。通义_你的全能AI助手
文心一格,AI艺术和创意辅助平台,依托飞桨、文心大模型的技术创新推出的“AI作画”产品,可轻松驾驭多种风格,人人皆可“一语成画”
百家号,是百度为创作者打造的集创作、发布、变现于一体的内容创作平台,也是众多企业号实现营销转化的运营新阵地。
哔哩哔哩(bilibili.com)是国内知名的视频弹幕网站,这里有及时的动漫新番,活跃的ACG氛围,有创意的Up主。大家可以在这里找到许多欢乐。