具有语音模式等多模功能的模型将在2025年1月推出
阿拉伯联合酋长国阿布扎比--(美国商业资讯)--阿布扎比先进技术研究协会(ARTC)下属全球领先的应用技术研究中心科技创新研究所(TII)发布了Falcon 3,这是该所最新一代的开源大语言模型(LLM)系列。本次划时代的发布树立了小型LLM的新性能标准,支持在笔记本电脑等轻量基础设施上高效地运行模型,从而实现了先进人工智能技术的民主化。Falcon 3引入了优异的推理功能并增强了微调功能,使其成为更强大、更好用的人工智能模型。
本新闻稿包含多媒体。此处查看新闻稿全文: https://www.businesswire.com/news/home/20241217098841/zh-CN/
Falcon 3旨在实现高性能人工智能的民主化,提供强大且高效的模型。该模型利用14万亿个词元进行训练,是上一代模型所用5.5万亿词元的两倍以上,在多个基准指标上都展现出超卓的性能。尤其是在全球可在单个GPU上运行的模型中位居前列。Falcon 3在发布时位列Hugging Face的全球第三方大语言模型排行榜第一,超越同等规模的其他开源模型,包括Meta公司的Llama模型。Falcon 3-10B模型在该类别的表现尤其耀眼,优于所有参数低于130亿的模型。
ARTC秘书长兼阿联酋总统战略研究与先进技术事务顾问Faisal Al Bannai指出:“人工智能颠覆性的力量不容否认。今天,Falcon 3系列文本模型的发布提升了我们对人工智能界的贡献,尤其是开源行业。本次发布是在Falcon 2基础上的进一步提升,标志着打造新一代人工智能模型的重大成就。我们坚定承诺确保不分地区,人人都能使用这些强大的功能,体现了我们建设全球平等和包容性创新的决心。”
Falcon 3系列
Falcon 3系列包含四种型号的模型,分别是Falcon3-1B、-3B、-7B和-10B。与上一代模型相比,该系列模型高度重视无缝集成。这些模型完全兼容各种广泛使用的应用程序编程接口(API)和库,大幅减少了集成工作并确保了易用性,最终让用户能够选择最适合自己需求的解决方案。Falcon 3在推理、语言理解、指令执行、代码生成和数学任务等领域都具有卓越的性能,定将树立人工智能功能的新标准。
每个Falcon 3小模型都一个基础模型和Instruct变种模型,在同等规模的模型中都位居世界前列。基础模型可完成通用性生成式任务,而Instruct模型则针对对话应用场景进行了微调优化。Falcon 3目前提供英语、法语、西班牙语和葡萄牙语版本。Falcon 3模型还提供各种量化版本,以优化在专门架构中的集成,成为可满足快速部署和推理需求的高效轻量级资源。
科技创新研究所首席执行官Najwa Aaraj博士指出:“我们专注前沿研究和吸引顶尖人才,促进了Falcon 3的开发。最终开发出的模型印证了我们对卓越科研的追求,进一步提高了效率并树立了人工智能技术的新标杆。”
科技创新研究所人工智能和数字科学研究中心(AIDRC)首席研究员Hakim Hacid博士指出:“人工智能在快速演变,我们很高兴能积极参与这一进程。Falcon 3进一步提升了小型LLM的边界,通过提供性能更强的人工智能,促进了开源社区的发展。我们坚信,这次最新的发布将打开无限的机会,带来极为深远的效益,以之前不可想象的方式支持企业和个人使用人工智能。”
Falcon 3可通过HuggingFace和FalconLLM.TII.ae立即下载,此外还提供了有关性能基准的详细信息。
科技创新研究所还推出了Falcon Playground,这是一个方便最终用户、编程人员、编码人员和研究人员在官方版本发布前探索Falcon 3的测试环境,从而让他们有机会进行试验和提供反馈。
Falcon 3依据TII Falcon许可证提供许可,这是一种宽松的Apache 2.0软件许可证,包含旨在促进以负责任方式使用人工智能的可接受使用政策。
2025年1月初,Falcon 3系列模型将推出强调多模功能的新成员,包括文本、图像、视频和语音模式等。
资料来源:AETOWire
本文链接:/hangye/28612.html