在人工智能近年来取得许多重大进展的背景下,特别是微软推出 ChatGPT ,取得惊人效果的情况下,许多同志对人工智能在产业技术革命中可能扮演的角色产生了兴趣。今天我想从一个相关专业大学生的视角出发,来看一看目前人工智能技术发展的现状,并且对未来人工智能技术的应用做一些展望。 首先需要说明的是,人工智能技术仍然是一种信息技术,促使它产生的是不断增长的计算能力和互联网时代庞大的数据。目前人工智能主要的研究领域包括计算机视觉、自然语言处理、计算机语音、分子生物学等等。不论是哪一项研究,都需要先收集大量的数据来建立模型。除了数据之外,大模型的应用对计算提出了越来越高的要求,以 GPT-3 等为代表的一系列表现优异的大模型都在计算上投入了大量成本。因此,作为信息技术,人工智能技术首先仰赖信息基础设施的应用,包括高性能计算机、计算机网络等等,因此,要在任何一个产业应用人工技术,首先要保证产业高度信息化。目前,可以说除了互联网行业本身建立在信息化的基础上,几乎没有任何行业完成了高度的信息化,大部分企业的信息基础设施建设水平停留在美国 2005 年左右的水平。在从事软件、通信等行业的企业中,信息化尚且不完善,在一般的政、商和工业企业中,推进信息化更是举步维艰。作为尖端技术的一个代表,一方面,对基础科学技术要求高,而我国缺乏高性能计算的尖端技术(例如,美国队中国禁运的 NVIDIA 计算卡),另一方面,大部分的资本没有条件做快速的积累、提供信息化所需的庞大建设资金。因此,只有互联网企业能够借助自身在社交媒体等平台的垄断优势,人工智能技术的研究只能在少数垄断互联网企业中开展。 人工智能技术的另一大困境是基础理论的匮乏。现阶段的人工智能技术是典型的受到资本需求推进而快速发展的技术(整个学术界都受到这种导向的伤害,因而我们的基础研究将长期落后),其重心在于快速投入产品。这种趋势,反过来,将严重限制人工智能技术在非信息领域的应用。物理学、数学能够推动产业进步,依靠的就是两者的基础性。物理学、数学的原则,放之四海而皆准,无论在哪一个具体的领域或产业,总是绕不开这两者的研究,任何新技术的突破,总要从数学、物理的角度出发开始论证、设计。与之相比,人工智能技术的应用充满了投机性。大部分人们不关心每个模型背后的原理,而流于软件行业常见的“套用、抄袭”模式,这导致人工智能的主流研究方向极端狭窄,局限在视觉、语言、语音等领域的几个主要模型。实验中,实验者无法把握模型的优化方向,只能使用试错的方法,以至于这一过程被人们戏称为“炼丹”。在学术领域,人工智能几乎是一门“民间科学”,虽然背后有一定的数学原理,但在模型结构的解释上,其研究水平还不如上世纪的 SVM,绝大多数人是一股脑的投入试错过程中去,呈现出一种发展不平衡现象。 总的来说,与很多人对人工智能抱有的乐观态度相反,我认为人工智能技术还需要经历一个长期的、缓慢的发展过程。在这样一个过程中,只有垄断的互联网资本有条件发展人工智能技术,而资本垄断带来的逐利性和封闭性,将阻碍人工智能技术的快速发展,使其成为只有少数公司才能提供的、神秘的黑盒服务。人工智能在本世纪初能够发展,更多是得益于更基础的计算技术的提高。神经网络很早就被提出,然而由于计算能力的限制,始终无法在90年代乃至00年代取得关注。在经历了10年代开放式的快速发展之后,如今计算的瓶颈又一次显现出来,大模型的计算需求将许多高校的研究者从前列排除出去,这一成本只有诸如 Google、Mircosoft 这样的公司才能够负担。指望这样的公司挑起全社会产业升级的大任,恐怕是不现实的。即使在美国,互联网产业与制造业和其他实体产业的矛盾也足以抑制这种趋势。 人工智能取得了许多令人瞩目的成就,但是,我们也应当认识到,与许多人吹嘘的相反,当下,人工智能并非是生产力发展的“灵丹妙药”。 |
一方面,人工智能如若要得到长足的进步,的确如这位作者所表达的,需要在数学上获得更进一步的突破。如果无法取得彻底的数学解析,那么就是在开黑盒
E_mail: redchinacn@gmail.com
2010-2011http://redchinacn.net