AI模型的持续学习能力亟待提升
发布日期:2024年08月29日

      从自动驾驶到智能医疗,从金融分析到教育辅助,人工智能(AI)的应用已广泛渗透到日常生活的各个领域,并逐渐成为推动社会进步与产业升级的关键力量。然而,在AI技术日新月异的背后,AI模型在持续学习能力上的不足也逐渐成为制约其进一步发展和应用的瓶颈。

  AI模型的“学习困境”

  当前,主流的AI模型大多基于神经网络架构,这些网络模仿了人脑神经元的工作方式,通过大量数据的训练来优化自身性能。然而,一个不容忽视的事实是,这些模型在初次训练完成后,其学习能力便相对固化,难以像人类大脑那样具备持续的自我学习和进化能力。这意味着,每当面对新的数据环境或需求变化时,科技公司不得不投入巨额资金,重新训练整个模型。

  加拿大阿尔伯塔大学Shibhansh Dohare团队的一项研究发现,许多AI模型在经历多次重训后,会遭遇“神经元死亡”现象,即大量神经元陷入零值状态,失去学习能力。“如果把它比作你的大脑,那就像是90%的神经元都死了。” Dohare说,“剩下的不足以让你学习。”这一发现不仅限于图像识别领域,还广泛存在于自然语言处理、强化学习等多个AI应用领域,凸显了AI模型在持续学习能力上的普遍困境。

  企业面临的双重挑战

  对于科技企业而言,AI模型学习能力的受限无疑带来了双重挑战。首先,随着数据量的爆发式增长和市场需求的快速变化,企业需要不断更新AI模型以保持竞争力。

  以零售行业为例,消费者的购物偏好和购买行为数据正以前所未有的速度累积。为了精准捕捉这些变化,并为用户提供更加个性化的购物体验,电商平台不得不持续优化其基于AI的推荐系统。这意味着它们需要定期调整模型参数,引入新的算法和数据源,以确保推荐内容既符合用户的即时需求,又具备前瞻性和创新性。

  而在智能制造领域,AI模型在生产线质量控制方面的应用同样面临着持续更新的需求。随着生产规模的持续扩大和产品复杂度的不断提升,生产线上的数据量急剧增加。为了维持产品质量的高度一致性和稳定性,企业需要根据生产环境的变化灵活调整AI模型的监控范围和预测精度。这不仅要求企业具备强大的数据处理能力,还需要在AI模型的迭代升级上保持高效和灵活。

  然而,重新训练模型不仅成本高昂,还耗时费力,特别是在处理大规模数据集时更是如此。此外,在快速迭代的商业环境中,时间成本同样不容忽视。若企业无法及时响应市场变化,更新AI模型,可能会错失宝贵的市场机遇,甚至被竞争对手超越。

  因此,如何在保证模型精度的同时提高模型的更新效率并降低成本,成为科技行业亟待解决的难题。

  如何提升AI模型“学习能力”?

  面对AI模型在学习能力上的瓶颈,科研人员正积极寻求解决方案。其中,Dohare团队的研究提出了一种新的算法,该算法在每个训练轮次后随机激活一些“死亡”的神经元,从而恢复其学习能力。这种算法虽然初步显示了有效性,但还需要在更大的系统中进行进一步测试和优化。牛津大学的Mark van der Wilk表示,该算法看起来很有前景,但还需要在更大的系统中进行测试。

  “AI模型持续学习的解决方案简直是一个价值数十亿美元的问题。”他说,“一个真正的、全面的解决方案将允许你不断更新模型,从而显著降低训练这些模型的成本。”

  此外,模块化设计和增量学习也被视为提升AI模型持续学习能力的有效策略。模块化设计通过将AI模型拆分为多个独立模块,实现了任务处理的灵活性和高效性。当面对新数据时,企业只需更新相关模块即可,无须对整个模型进行重训。而增量学习技术则允许模型在保留旧知识的基础上学习新知识,实现了知识的累积与传承。

  更为长远的是,科技企业之间的合作与共享将成为推动AI技术持续发展的关键力量。通过构建开放的生态系统,企业可以共享数据、算法和模型资源,降低研发成本,加速技术创新。同时,这种合作模式也有助于形成统一的标准和规范,推动AI技术的普及和应用。 (作者 吴双)

来源:人民邮电报