英国皇家工程院院士、欧洲科学院院士、IEEE(美国电气电子工程师学会)会士,香港科技大学首席副校长。他在机器学习算法及医学
语言大模型是网络的信息压缩和提炼。它是所有互联网信息的一个压缩、一个编码,通过这一个编码,可以生成语言、文本、图片等
大家好。已经深入人心,今天我来讲一讲,的飞跃现在起步,它未来会怎么发展。
首先,人工智能得以发展,是因为有了一项伟大的技术,叫作神经元网络。人工智能主要是通过神经元网络来模拟人脑。
1942年,奥地利心理学家赫布发表了一篇重要的文章,其中讲了大脑神经元的连接原理。当大脑受到刺激后,大脑中的一些神经元就会发生连接,如果不断刺激它的话,这些连接会慢慢的加强。神经元的连接其实就是刺激的结果,如果把学习看作一种刺激,那么神经元之间的连接就是学习的表现。神经元网络就是一种模仿大脑神经元之间连接的计算模型。我们不断地给它输入数据,构造不同神经元网络的连接,不断去改变连接的强度,从而使模型的输出能够很好的满足我们的要求。
第一类是判别。要知道数据是属于哪一类,先进行数据标注,用标注好的数据来训练模型。有了模型,输入一个不知类别的数据后,模型能够准确的通过特征判定它属于哪一类。图像识别就是一种典型的判别。
另一类是生成。不需要数据标注,我们把所有的数据都输入计算机,它自己来总结数据的特征,再把这个数据来进行聚类,有了类别以后,我们就能要求计算机生成某一种类别的东西。比如,我要计算机生成一棵树,因为模型知道树的特征,它就可以生成一棵它没见过的树。
有了生成式的大模型,人工智能被改变了。原来的人工智能都是解决具体问题的。比如要下围棋,就做一个下围棋的模型。而现在,我们做的是一个基础模型。把所有在网络上能够得到的文字数据、图像数据、声音数据都输入计算机,让它学习这一些数据,学完以后,就可以生成各种图片和语言,这就是一个基础模型。在这个模型的基础上,能形成各种各样的垂直应用。比如,要生成一幅国画,要生成一部医学文献,要生成一个戏剧剧本,都能够最终靠输入特别的样本,对基础模型进行微调,来形成相关的应用。
有人说,ChatGPT不就是一个人工智能的语言对话系统嘛,为什么它如此重要?我想从两篇文章讲起。
第一篇文章是《计算机械与智能》,其作者是大名鼎鼎的被誉为“人工智能之父”的图灵。还有一篇是“控制论之父”、美国数学家维纳的文章《人有人的用处——控制论与社会》。这两篇文章都是1950年发表的,可以说,它们开启了人工智能的研究之路。
图灵说:机器有没有智能?怎么界定机器的智能呢?一个界定方法就是,当一个机器跟人对话的时候,你不能区别对话者是机器还是人,这就表明机器有了智能。这个测试方法被称为“图灵测试”。
维纳在文章中提出了两个问题。首先,他认为机器一定会具有智能,当机器具有智能以后,人和机器在社会存的一个重要形式就是人机互相交流、互相对话。其次,这样的机器是怎么产生的?维纳第一次提出,当复杂度达到某些特定的程度时,机器会“涌现”出这样的智能。
为什么图灵会用语言来界定机器有没有智能呢?维特根斯坦有一句名言:“我语言的边界,就是我世界的边界。”语言不仅是交流的工具,更重要的是,语言是思想的体现。语言是我们对世界的“表达模型”,是对客观世界的主观编码。从这个意义上来讲,语言的重要性非同寻常,计算机能够讲人类的语言,就从另一方面代表着它有了和我们相似的智能。
此外,语言还决定了思维方法。如果语言不同的话,我们的思维方法也会不一样。人类的语言不仅仅是思维的编码,人类的语言还有感情,还有能量。人类语言的精髓在于,语言的内涵是信息,语言的外延是能量。
大模型到底是什么?语言大模型是网络的信息压缩和提炼。它是所有互联网信息的一个压缩、一个编码,通过这一个编码,可以生成语言、文本、图片等。
大模型现在可以做什么呢?我们把各种各样不同的信息——语言、图像、文本进行输入,通过编码对齐,能够获得多模态的结果。比如,我们给ChatGPT看一张图,然后问它可以用图片上的这些原料做什么。它通过判别,发现图片中有鸡蛋、牛奶、面粉等,然后它会告诉你,用这些原料可以做煎饼、吐司、蛋糕、面包、饼干等等。现在的大模型越来越倾向于多模态,由多种数据协同推理。
未来,大模型的发展的新趋势是什么?在我看来,大模型发展的必然趋势是拟人化,越来越像人。从输入来说,它不仅会听,还能看;从模型来讲,现在它会理解,慢慢地它还会思辨;从输出方面来说,它不仅会表达,未来还会有行动,比如看见东西要掉下去了,知道怎么样把它接住。未来,计算机科学会变成机器行为学,这是我们应该研究的一个重要方向。
那么,现在的AI已经发展到了什么样的水平?2024年5月14日,OpenAI公司发布了GPT-4o,现在的GPT已经有了情绪对话的能力,它还可以打断你。它可以在短至232毫秒、平均320毫秒的时间内对音频输入做出一定的反应,这几乎已经跟人一样了。
目前,我们在香港进行生成式人工智能的研究。我们不是做很多模型,我们只做一个基础模型,主要是为香港的AI企业和香港社会服务,各种研究机构、企业、创新公司都可以到这样的平台上进行开发、应用。这个基础模型叫“香港仔”。
我来讲讲人工智能的技术挑战。技术挑战包括三个方面,一个是算法,一个是数据,一个是算力。
从数据来讲,最大的问题是我们几乎已经穷尽了数据,我们把世界上几乎所有的数据都拿来训练大模型了,数据总是有限的,但我们应该更多的数据、更多的信息来训练大模型。
从算力来讲,有一个叫作扩展律的概念,就是说能力越大,效能越好,但是算力总是有限的,而且我们目前还受到芯片的制约。
从算法来讲,主要有三个问题。首先,我们应该研究怎样避免重复的学习,怎样保证大模型对新的数据不进行重复训练。其次,既然模型是数据的完美压缩,那么高阶的学习将是在模型上学习。最后,机器智能和人类智能的培养、训练方法是相反的。未来算法最具有挑战性的是,怎样让机器拥有价值观,怎样让机器学会常识。
我认为,大模型是一个基础设施。因此,要建设一个上海基础大模型,形成产业生态,可以在这个公共平台上开发各种不同的垂直应用和社会服务,在教育、政务、医学、金融、文创等领域做出世界水平的应用实例。
更重要的是,以上海丰富的学术资源为基础,逐步加强基础研究,研究新的算法。
最后,人工智能的治理很重要。上海作为国际化大都市,应当建立一个开放性的人工智能治理研究机构,做出人工智能治理的国际典范。