人工智能的基础理论由来已久,由深度学习引爆的第三次人工智能浪潮,以及算力的进步和数据的爆发,使得人工智能技术快速走向成熟。在传统产业转型升级的趋势下,人工智能产业加速向纵横拓展,不断催生着新产品、新模式、新业态,并开始带来显著的效益。
回望2021年,人工智能领域技术成果颇丰。以算力、算法、数据为代表的一批企业频繁的站在潮头浪尖,为加速人工智能全面产业化的到来,持续注入新动能。本篇文章就为大家盘点了各领域最具代表性的相关企业进行观察,它们或代表着当下人工智能发展的落地方向或技术成果,也充当着未来技术向上发展的基石。
AI模型,百度&鹏城实验室
作为当前人工智能发展的重要方向,预训练大模型已成为AI领域的技术新高地。中国工程院院士、鹏城实验室主任高文表示:“预训练模型对整个科学的发展、社会的发展、创新的发展都是非常重要的工具。运用这个工具,可以帮助做很多人工智能的赋能,不局限于某个领域,这对人工智能的发展是一个福音。”
今年,鹏城实验室与百度联合召开发布会,正式发布双方共同研发的全球首个知识增强千亿大模型——鹏城-百度·文心(模型版本号:ERNIE 3.0 Titan)。该模型参数规模达到2600亿,是目前全球最大的中文单体模型,在60多项任务上取得最好效果。同时,产业级知识增强大模型“文心”全景图首次亮相,从技术自主创新和加速产业应用两方面,推动中国人工智能进一步发展。
值得关注的是,鹏城-百度·文心是全球首个知识增强千亿大模型,在机器阅读理解、文本分类、语义相似度计算等60多项任务取得最好效果,并在30余项小样本和零样本任务上刷新基准。为解决大模型应用落地难题,研究团队还首创了大模型在线蒸馏技术,模型参数压缩率可达99.98%。压缩版模型仅保留0.02%参数规模就能与原有模型效果相当,为产业大规模应用打开了新窗口。
AI数据:云测数据
在多元化的人工智能场景落地背景下,推进AI数据质量向更高标准发展已成为行业广泛关切的重点。目前,行业内对训练数据需求类型的增加以及对服务标准要求的提高,产业链的专业化分工将愈加清晰。
随着算法模型、技术理论和应用场景的优化和创新,AI产业对训练数据的拓展性需求和前瞻性需求均快速增长。IDC中国助理研究总监表示:“ 市场竞争瞬息万变,引入AI基础数据服务有助于帮助企业快速进入AI模型开发”。
云测数据是人工智能领域数据服务企业中的杰出代表,连续两年获得了由中科院主管《互联网周刊》、德本咨询、eNet 研究院联合发布的“年度数据标注公司排行”榜首。在过去的一年中,其在技术研发、解决方案、服务能力等方面成果颇丰。
云测数据在2021年接连发布了云测数据标注平台、云测数据-AI数据及管理系统、行业训练数据解决方案等领先成果。通过云测数据的标注平台和数据集管理系统,AI企业能够一站式轻松解决企业AI数据训练需求,可助力AI数据训练综合效率提升200%、标注精准度最高可达99.99%,让企业AI能力快人一步。
这些成果,无一不展示了在数据资产已经成为企业核心资产背景下,云测数据基于行业前瞻和前沿技术服务积累,进一步拓展深化AI训练数据价值的领先实践。
AI芯片:瀚博半导体
人工智能行业随着持续的技术演进,算法模型的精度、性能等关键指标在众多领域不断取得突破性进展,已进入算法规模化应用落地阶段。全球范围内各行业数据中心对推理算力的需求在快速增长,下游客户多样化的算力应用场景,催生了多样化的AI计算加速芯片需求,然而市面上却鲜有主流GPU厂商外的其他更优解决方案。
根据Gartner的预测,全球人工智能芯片市场规模将在未来五年内呈现飙升,从 2018 年的 42.7 亿美元成长至343 亿美元,增长超过 7 倍。总体来看,国内外云端AI芯片战局愈发多元:NVIDIA(英伟达)的GPU产品仍是AI训练加速的首选,互联网巨头将芯片业务独立融资发展,初创公司亦是冲劲十足,从探索创新架构都迈向落地商用。
瀚博半导体作为一家研究AI高性能芯片的技术性企业,通过自主研发的人工智能及计算机视觉核心技术,提供适用于智慧城市、智能安防、智慧教育、智能医疗等领域的芯片设计以及相对应的软件开发平台产品,芯片解决方案覆盖从云端到边缘的服务器及一体机市场,并于近日完成了16 亿人民币的新一轮融资。瀚博半导体在7月发布其首款云端通用AI推理芯片SV100系列及VA1通用推理加速卡,可实现深度学习应用超高性能、超低延时的推理性能,可显著降低数据中心与边缘智能应用的部署成本。
2021年,人工智能领域涌现很多技术突破,也在交通、安防、医疗、金融、制造等领域收获了广泛肯定。不过,行业的发展总是机遇与挑战并存的,各行各业的想要实现真正的智能化转型还有很多难点需要攻克。但肯定的是,从技术兴起到资本热潮,再到回归理性,人工智能终于迎来了“见真章”的验证阶段。