从庞大到精巧 让AI大模型更接地气 报资讯
时间:2024-08-01 13:23:20来源:人民邮电报


(资料图片仅供参考)

人工智能大模型以其庞大的参数规模和海量的训练数据量著称,需要由数千块AI芯片组成的服务器集群来支撑其运算。相关数据显示,在10天内训练1000亿参数规模、1PB训练数据集,约需1.08万个英伟达A100GPU。这一数字揭示了AI大模型背后巨大的经济成本。

近日,AI初创企业Anthropic的CEO兼总裁达里奥·阿莫代(Dario Amodei)在一档播客节目中表示,目前公司正在开发的AI模型训练成本高达10亿美元,他预计,AI模型的训练成本在2027年之前提升到100亿美元,甚至是1000亿美元。

在此背景下,轻量化大模型的概念应运而生,对大模型进行量化、剪枝等压缩操作,已成为模型部署过程中常用的策略。这些技术旨在降低模型的计算复杂度和减少存储需求,从而加快模型推理速度,降低运行成本,并使其更易于在边缘设备或资源受限的环境中部署。这一理念不仅有利于实现“双碳”目标,也为AI技术的普及和落地应用开辟了新的道路。

知识蒸馏技术助力降低算力成本。近日,谷歌DeepMind开源了Gemma 2,这是其小型语言模型系列的下一代产品。谷歌团队在Gemma 2的架构上进行了多项改进,特别是引入了知识蒸馏(Knowledge Distillation,简称KD)技术。这是一种机器学习技术,主要用于模型压缩和迁移学习,其核心思想是通过将大型模型(即“教师模型”)的知识传递给小型模型(即“学生模型”),以提高小型模型的性能。这种技术在不牺牲性能的前提下,大幅减少了模型的计算资源需求,使得Gemma 2不仅在同类规模的模型中表现出众,甚至能与两倍于其大小的模型性能相媲美。

Gemma 2的发布,无疑延续了近年来小型、开源语言模型家族蓬勃发展的行业趋势。微软的Phi和Meta的Llama等模型,同样通过引入创新的架构改进(如GQA等)以及利用高质量的训练数据,实现了远超传统小型模型的卓越性能。这一系列模型的涌现,不仅是技术进步的结果,更是为了满足更广泛应用场景的需求。通过软硬件协同、算法优化和模型压缩等多种手段,大模型正逐步实现更高效、更经济、更亲民的目标,从而推动人工智能技术的广泛应用和发展。

创新模型量化方法,让大模型“瘦身”90%。此前,清华大学和哈工大的一项联合研究提出了大模型1bit极限压缩框架OneBit,包括全新的1bit线性层结构、基于量化感知知识蒸馏的深度迁移学习等。1bit量化模型在计算上具有优势,参数的纯二进制表示,不但可以节省大量的空间,还能降低矩阵乘法对硬件的要求。该架构首次实现大模型权重压缩超越90%并保留大部分(83%)能力,对于实现大模型在PC端甚至智能手机上的部署意义非凡。

轻量化大模型在端侧AI中的应用尤为重要。它降低了边缘计算的成本门槛,使更多应用程序和用户能够使用大模型进行推理计算,从而推动了AI向端侧场景的落地。小米集团NLP首席科学家王斌此前指出,大模型将逐渐演进为小模型,并在本地部署中发挥重要作用。这不仅符合技术发展的趋势,也有利于满足差异化的应用需求。

轻量化大模型之所以受到如此广泛的关注,是因为它解决了AI技术在实际应用中的诸多痛点问题。传统的大型语言模型虽然性能强大,但往往因为计算复杂度高、存储需求大而无法在资源受限的设备上高效运行。而轻量化大模型则通过减少模型的参数数量和降低复杂度,降低了对硬件资源的要求,使得AI技术能够更广泛地应用于移动设备、边缘计算和实时应用等场景。

标签:

  • 上一篇文章: 职业伤害保障需要尽快扩面
  • 下一篇文章: 最后一页
  • 生活指南
  • 中新健康|高温袭来热射病多发 专家:关注中暑前身体发出的警告

    中新网杭州7月4日电(张煜欢)4日杭州正式出梅,今年首个高温橙色预警

  • 国网息县供电公司:特巡充电桩 护航群众绿色出行

    “充电桩内接线无松动,充电枪无破损,可以正常充电。”4月28日,国网

  • 环球热推荐:驻马店市驿城区顺河街道开展春季田间管理暨病虫害防治、多花黑麦草清除推进会

    随着春季的到来,小麦病虫害问题日益突出,为保障小麦产量和质量,驻马

  • 【节日我在岗】大年初二 商丘交警全员上路坚守岗位保畅通护平安

    2月11日(农历大年初二),为确保春节期间道路交通安全畅通,让群众能

  • 共谋新篇|奥影与国家模检中心(广东)携手成立大湾区X射线工业CT联合创新实验室

    2024年1月10日,奥影正式入驻国家模具产品质量检验检测中心(广东)

  • 防治癌症 应该知道这些事_世界独家

    肿瘤已成为目前严重威胁人类健康的疾病。2019年1月,国家癌症中心发布

  • 全球资讯:邓州市彭桥镇:深入企业排查隐患 优化安全发展环境

    眼下,邓州市彭桥镇应急办进企业入商超开展了一系列隐患排查工作,旨在

  • 【新视野】感受科技魅力 体验探索乐趣 ——驻马店市第十一小学走进青少年活动中心实践活动

    为培养学生的创新意识,养成科学探究习惯,提高整体科学素养,2023年11

  • 奶酪市场调查:乳企深耕高附加值产品 本土化提速_当前快看

    在奶源供给充足的市场环境下,奶酪本土化是否将提速?国内以再制奶酪

  • “充值”800万后她接到留言:你的网恋聊天 已成诈骗团伙“教材”

    600余页的聊天记录,被远在老挝的诈骗团伙成员当做优秀案例传阅学习

  • ​罗山民警甘延尚:坚持“四心”工作法 用心用情服务群众 天天新要闻

    现年58岁的甘延尚,现任罗山县公安局莽张派出所社区民警、一级警长。多

  • 无偿捐献器官 他完成了人生最后一次“助人”

    无偿捐献器官他完成了人生最后一次“助人”---8月23日,在简短的告别仪

  • 银行“货币零钱组合”流动性风险引监管关注

    能够极大程度解决客户流动性问题、又帮助银行“留客”的一大理财利器,

  • 亚世光电:公司显示产品可应用于汽车电子包括车载自动变光遮阳板、汽车电子后视镜等

    每经AI快讯,有投资者在投资者互动平台提问:公司汽车在电子领域有什么

  • 美托股份2023年上半年净利1291.52万 同比增加68.86%

    美托股份2023年上半年净利1291 52万同比增加68 86%2023 8 2115:43:07挖

  • 8月24日起,澳门禁止日本10个都县区食品进口

    8月24日起,澳门禁止日本10个都县区食品进口,澳门,日本,福岛县,新潟县,

  • 民生
    • 今日热门!驻马店市驿城区南海街道:畅通消防通道 守护安全防线

    • 全球观热点:西平县柏苑道庄小学开展“法治进校园”活动

    • 光山警方捣毁一野外流动赌场 17人落网_环球热点评

    • 快看:平舆县人民检察院支持起诉 助孩子一臂之力