在6月1日举办的2021北京智源大会上,一位虚拟学生“华智冰”的亮相引发了汽车软板厂的关注。作为一个诞生没多久,甚至未曾参加过高考的学生,华智冰就已经被清华大学破格“录取”。这一虚拟学生究竟有何能耐,对人工智能领域的发展又意味着什么呢?
琴棋书画,样样精通
在智源大会上现场播放的视频中,华智冰展示了自己创作的音乐、诗词和绘画作品。华智冰由北京智源人工研究院、智谱AI和小冰公司三方合作开发,以智源人工智能研究院的“悟道2.0”为核心模型,并由小冰公司提供框架,并负责声音和形象的开发。
“悟道2.0”是北京智源人工智能研究院发布的超大规模智能模型,其参数规模达到1.75万亿,这个数字是OpenAI打造的GPT-3的三倍,此前的纪录保持者为Google Switch Transformer,这是目前全球最大也是中国首个万亿级的智能模型。
华智冰的声音与形象归功于小冰公司,但其展示的诗词书画等作品却是由“悟道2.0”来打造的。国际上主流的大模型基本都基于英文的语料进行开发,而“悟道2.0”模型拥有4.9TB的中英训练数据库WuDaoCorpora2.0,包含了中英文本数据和中文图文数据。
清华大学教授、智源研究院学术副院长,同时也是华智冰在清华的导师唐杰表示:“华智冰是数据与知识双轮驱动的人工智能,其学习能力主要在于从数据中抽取知识,机器可以处理数据,从而实现可持续学习。”
据汽车软板厂了解,目前华智冰基于“悟道”的文源和文澜两大模型已经实现了上述的诗词创作,未来会继续往认知层面发展,在清华大学计算机系知识工程实验室“进修”之后,掌握编程等其他技能。
为虚拟AI形象注入生命
目前AI形象已经开始在多个领域浮现,比如虚拟歌手和虚拟画家等。小冰公司是去年微软小冰业务拆分出来的独立运营公司,“悟道”的存在为华智冰赋予了自然语言处理能力,而小冰框架则为其赋予了交互和语音能力。
就拿小冰旗下的X Studio歌手软件来说,小冰框架以及为其打造了多名虚拟歌手,每位歌手都具备不同的音色和音域,而近期发布的X Studio 1.7.0中,华智冰也正式入籍,解锁了演唱技能。
之所以华智冰能够“入学”清华,不单单是因为其专业技能,也是因为华智冰会与清华的师生产生交互,并与其建立更好的师生同学关系,加强其情感交互能力。这种情感交互和对话推理能力,和AI少女小冰类似,也是源于小冰框架。
“悟道2.0”这种大模型和训练数据是搭建一个AI平台的基石,但训练成本也相当高。比如独家授权给微软的GPT-3就要用上1万片GPU,而智源人工智能研究院的介绍中也提到了这一点,华智冰所需的GPU比任何一个清华学生都要多。
华智冰拥有的才艺和创作能力需要庞大的训练数据支撑,但仅靠这部分数据产生的交互能力依然是有所欠缺的,因此华智冰在清华的校园生涯也是一个必要的学习过程。汽车软板厂认为,AI裁判和AI主播等,未来还会出现更多的AI主体在我们的生活中充当不同的形象。