Hugging Face建言美国人工智能行动计划:开源技术对经济影响的乘数效应高达2000倍

前沿资讯 1742467844更新

0

Hugging Face就美国科学技术政策办公室(OSTP)制定人工智能行动计划一事提交了反馈意见。Hugging Face一直致力于通过开源和协作的方式,推动人工智能和机器学习的普及,其平台广泛用于机器学习系统的分享与协作,托管着大量机器学习模型和数据集,服务着700万用户,托管超150万个公共模型,覆盖语言、生物、机器人、法律、金融等多个领域。

Hugging Face指出,开源在人工智能发展进程中扮演着不可替代的关键角色。现代人工智能的进步,很大程度上依赖于多年来的开源研究成果。像PyTorch这样的开源框架,以及在transformer架构、注意力机制和训练方法等方面的开创性研究,都是商业巨头发展人工智能的重要基石。近年来,开源研究不仅能开发出与商业模型性能相媲美的系统,在特定领域的效率和性能方面甚至更具优势。人工智能的发展速度不断加快,两年前需要1000亿参数模型才能完成的任务,如今20亿参数模型就能实现,开源模式正推动人工智能朝着更易获取、更高效、更具协作性的方向发展。

从经济层面来看,开源为美国带来了显著的经济效益。研究表明,开源技术对经济影响的乘数效应高达2000倍,这意味着投入40亿美元到开源系统,有望为使用该系统的公司创造8万亿美元的价值。对国家经济而言,开源同样意义重大,若没有开源软件的贡献,平均每个国家的GDP将损失2.2%。欧盟在2018年因开源获得了650-950亿欧元的GDP增长,这一成果促使欧盟委员会制定新规则,以简化政府软件开源流程,充分彰显了开源在国家层面转化为政策行动和经济优势的巨大潜力。

在商业领域,开源模型受到广泛青睐,背后有着多方面的原因。其一,成本效益显著,从头开发人工智能模型需要巨额投资,而基于开源基础进行开发能大幅削减研发费用。其二,定制性强,各组织可以根据自身特定的使用场景,对模型进行调整和部署,摆脱“一刀切”的局限。其三,降低了对单一供应商的依赖,企业在技术选择上拥有更大的自主权。其四,开源模型的能力不断提升,部分已超越封闭的专有系统,如Hugging Face的Open R1项目中的Olympic-Coder,在编码性能上超越了Anthropic的最新专有模型Claude 3.7。这对于初创企业和中型企业尤为重要,它们无需大量的基础设施投资,就能获取前沿技术。银行、制药公司等众多行业都在利用开源模型满足特定市场需求,进一步证明了开源基础对商业生态的强大支撑作用。

基于此,Hugging Face提出多项政策建议以强化开源人工智能生态系统。在基础设施建设方面,应全面实施并扩展国家人工智能研究资源(NAIRR)试点项目,为研究人员提供计算资源、数据集和协作工具,同时,分配公共计算资源支持开源项目,降低小型团队和企业的创新门槛。在数据获取与管理上,要解决数据共享难题,创建可持续的数据生态系统,开发高质量数据集,加强数据访问框架建设,保障数据安全与合规使用。此外,还应投资多方驱动的创新项目,支持各行业开发定制化人工智能系统,并加强科学卓越中心建设,推动数据在模型性能和可靠性评估中的应用。

在人工智能的应用环节,Hugging Face着重强调了高效与可靠的重要性。当下,小公司和初创企业在采用人工智能技术时面临重重困难,高昂的成本和有限的资源成为难以跨越的障碍。国际数据公司(IDC)预测,到2028年全球人工智能支出将达到6320亿美元,但这一成本对于许多小型组织来说难以承受。与此同时,能源稀缺问题也日益突出,国际能源署预计,到2026年数据中心的电力消耗可能会在2022年的基础上翻倍,达到1000太瓦时,相当于日本的全年电力需求。

训练人工智能模型能耗巨大,而推理过程由于其规模和频率的因素,最终能耗可能超过训练。为确保人工智能的广泛应用,硬件优化和可扩展的软件框架必不可少。众多组织都在根据自身需求开发定制模型,美国在注重效率的人工智能开发领域占据领导地位,这具有重要的战略意义。美国能源部的“人工智能促进能源”计划,进一步支持了节能人工智能的研究,有助于在不过度增加计算需求的情况下推动人工智能的广泛应用。

开源人工智能工具不仅有助于解决能源和成本问题,还能为企业带来实际的财务回报。调查显示,目前使用开源人工智能工具的公司中,51%报告获得了正投资回报率,而未使用的公司这一比例仅为41%。Hugging Face的Ultra-Scale playbook等知识共享和创新项目,帮助各类组织利用现有计算资源高效训练自己的人工智能模型,避免了大规模的基础设施投资。像量化、剪枝和模型蒸馏等技术,在保持模型性能的同时显著降低了计算需求。此外,轻量化框架进一步推动了人工智能在边缘设备和资源受限环境中的部署。在机器人领域,开源技术同样发挥了重要作用,降低了成本,为硬件成本较高的研究和创新领域提供了支持。

可靠性对于人工智能的广泛应用同样至关重要。在关键领域,组织需要系统能够始终如一地按预期运行。然而,研究发现,部分医疗人工智能应用的错误率高达19%,通用人工智能系统往往难以满足专业领域的特定需求,这凸显了定制化解决方案的必要性。与通过API访问的专有模型不同,本地托管的开源模型在设计上更具可靠性,其版本稳定性能够满足关键应用场景的要求。

为此,Hugging Face建议加大对高效人工智能研究的投入,开发性能高、能耗低的模型;制定联邦标准衡量和报告人工智能系统效率,鼓励选择合适的技术工具;支持跨机构的专业知识协作,构建评估能力,投资开发具有代表性的评估框架,确保采购和部署的人工智能系统符合预期。

随着人工智能融入数字基础设施,安全和标准成为关键。Hugging Face认为,人工智能安全可借鉴网络安全经验,强化系统组件文档记录,推动“设计即安全”的开发实践。开源人工智能对美国关键基础设施安全意义重大,开放的基础设施、透明的模型以及安全格式存储的模型,有助于提升安全性和促进技术应用。同时,开源开发在制定全球标准方面发挥着重要作用,美国应重视开源人工智能在安全战略中的地位。

在具体政策建议上,要支持严格的文档记录和透明度标准,确保相关人员充分了解人工智能系统;提升政府内部开发安全人工智能系统的能力;建立公私合作的评估机制,优先推动开放开发;将现有网络安全实践扩展到人工智能系统。

Hugging Face表示,美国在人工智能研究、开发和部署领域保持领先,需抓住机遇,发挥开源技术优势。公司将继续通过开源工具、协作平台和研究项目为人工智能生态系统贡献力量,并期待与OSTP及政府部门进一步合作,共同制定有效的人工智能政策。

参考资料:https://huggingface.co/blog/ai-action-wh-2025