麦肯锡全球研究院发布的一份重磅报告指出,人工智能(AI)的发展正逼近一个关键的“最后突破阶段”。这一阶段并非意味着技术探索的终结,而是预示着AI将从实验室和有限场景的试点,迈向大规模、深层次的社会经济融合与应用爆发期。在这一历史性进程中,报告特别强调,高质量、易获取的人工智能公共数据,正成为推动这一突破不可或缺的基石与加速器。
一、何谓“最后突破阶段”?
麦肯锡报告所定义的“最后突破阶段”,核心在于AI技术成熟度与应用壁垒的消除。此前,AI在算法模型(如深度学习)、算力基础设施等方面已取得长足进步,但在广泛落地时仍面临数据、成本、信任和集成等多重障碍。当前,这些障碍正在被快速攻克:
- 技术民主化:开源框架、云服务和预训练大模型的普及,极大降低了AI开发与部署的门槛。
- 成本下降:算力成本持续降低,边缘计算等模式使得AI应用更加经济可行。
- 生态成熟:围绕AI的开发者社区、行业解决方案和投资生态日益繁荣。
报告认为,跨越这些障碍后,AI将像电力或互联网一样,渗透到各行各业,驱动全要素生产率的显著提升。
二、公共数据:突破阶段的“燃料”与“轨道”
技术的普惠并不自动带来价值的普惠。AI,尤其是需要大量数据进行训练和优化的模型,其效能高度依赖于数据的规模、质量和多样性。在此背景下,人工智能公共数据的价值被提到了前所未有的战略高度。
- 创新的“燃料”:公共数据,如政府公开的统计数据、地理空间信息、科学文献、公共医疗影像、交通流量数据等,具有覆盖面广、权威性高、历史序列长的特点。它们为AI模型提供了丰富、多元的训练素材,能够帮助AI更好地理解复杂的社会运行规律,催生更智能、更普适的解决方案。例如,利用城市交通流量公共数据训练的AI,可以更精准地进行交通疏导和城市规划。
- 公平的“轨道”:私营部门的数据往往存在壁垒,可能导致AI发展中的“数据寡头”和创新鸿沟。高质量公共数据的开放与共享,能够为中小企业、研究机构和公益组织提供平等的创新起跑线,促进更加活跃和多样化的AI创新生态,防止技术垄断,确保AI红利的社会共享。
- 治理的“基石”:在自动驾驶、智慧医疗等高风险领域,基于广泛、真实的公共数据训练的AI,其决策透明度和可靠性更高,有助于建立公众信任。公共数据也是监管机构开发和测试AI审计、评估工具的重要基础,为AI的负责任发展提供支撑。
三、挑战与行动方向
尽管前景广阔,但充分发挥公共数据对AI的推动作用仍面临挑战:数据质量参差不齐、格式标准不一、隐私与安全保护机制不完善、跨部门共享存在壁垒等。
对此,报告为政策制定者与行业领导者提出了关键建议:
- 构建国家/地区级AI公共数据战略:将高质量公共数据的采集、治理、开放与利用,上升为支持AI创新的核心基础设施战略。
- 投资于数据基础设施与标准:建立统一的数据标准、开放平台和交换协议,确保数据可用、可互操作。
- 创新数据治理与协作模式:在保障个人隐私和国家安全的前提下,探索“数据信托”、隐私计算等技术,在数据可用与隐私保护间取得平衡。鼓励政府、企业、学术界建立数据协作联盟。
- 培育数据素养与人才:提升全社会,特别是公共部门对数据资产价值的认知,培养兼具AI与数据管理能力的复合型人才。
###
麦肯锡的报告清晰地描绘了一幅图景:人工智能的浪潮已抵达规模化应用的前夜,而人工智能公共数据的开放与利用水平,将在很大程度上决定这场突破的广度、深度与公平性。它不仅是技术问题,更关乎创新生态、经济竞争力和社会治理的未来格局。为公共数据“修路架桥”,就是在为智能时代的全面到来铺设最关键的基础设施。各国与各组织能否抓住这一机遇,将决定其在下一轮智能化竞赛中的位置。