“杨辉,你们来这边也一个多月了,通过这段时间的接触下来,你感觉现在的‘小智’在机器人实际控制方面怎么样?”寒暄了一会之后,陆哲来到一个正常工作的机器人的旁边,开口问起了正事。
正在机器人的身体呈白色圆柱形,上面安装着4只机械手,顶着一个圆圆的球状脑袋,有4个高精度广角摄像头的均匀分布在脑袋四周,底下则是使用4个万向轮子支撑着一个圆盘移动。
虽然机器人整体造型看起来有些怪异滑稽,但是在实用上还是很不错的。
倒不是说陆哲不想往人形机器人上靠,而是目前很多人型机器人的难点需要团队花时间去解决,这也不是短时间能解决完的,所以为了使机器人尽快和“小智”结合起来,只能尽量往实用性上面靠,例如尽可能的提升机器手的反应能力和灵活性。
“小智”其实就是智灵公司的两个多模态大语言模型中的一个,另一个大语言模型“启灵”则是掌握在陆哲自己的手里。
随着超级计算机规模的扩大,算力的巨大提升,这就让模型训练的速度越来越快,再加上训练所需要的数据源充足,如今的“小智”参数已经达到了1000多亿,而陆哲的“启灵”参数更是达到了恐怖的3000多亿。
当然,模型的智能程度和性能并不一定和参数的数量成正比,只是相对来说,参数量大可能会让模型更好的应对更多复杂的场景。
另外,除了参数数量也要考虑到训练数据的质量,如果训练数据质量差,可能几万亿参数的模型还不如几百亿参数的模型性能效果好。
此外,参数量过大可能还可能导致过拟合的情况发生,也就是说模型过于复杂,在训练数据上可能表现不错,但是在未知数据表现出一坨的情况。
“小智”的参数其实也不是不能达到“启灵”那种程度。
只是被陆哲私底下限制了参数增长的速度,并且在某些领域添加了一些干扰因素,比如对话领域,让小智在对话领域看起来没那么智能,甚至还不如chatgpt刚推出的版本。
比如基于“小智”推出的小灵同学,表现出来的智能水准就不是太高。
不过以“小智”如今所表现的智能程度,已经可以达到令全世界瞩目的程度了,毕竟人工智能领域现在还处于发展初期。
如今陆哲已经让人工智能团队放缓了训练急速堆参数的节奏,而是结合实际用户的反馈来对模型进行相对应的优化,比如梳理“小灵同学”使用用户的反馈数据。
而下一步,他打算模仿chatgpt当初的历程,推出一个简化阉割版本的智能聊天机器人程序,有些东西,是要一步步推出的,这也是一种营销手段。
到时候也是以会员订阅制为收费方式,收割全球财富的同时,利用先发优势,提前让全球的使用者帮助自己这边训练模型,另外,他打算提前在人工智能领域提前建立一个护城河,就算是暂时的也行。
不过这些都是陆哲的初步计划,详细的计划还要进一步规划,比如如何应对来自国外那些科技巨头的围剿,亦或者如何应对来自国等欧美国家的制裁。
因为他清楚,以国外大公司的科技积累,如果全力以赴,并且找对门路的话,可能要不了多久,就能迎头赶上,而陆哲要做的就是在这些国外的科技巨头反应过来的这段时间,在人工智能领域取得绝对领先的优势。
比如利用先发优势,提前收购相关公司,比如deepd,也就是开发出阿法狗(alphago)的科技公司,并且把相关人员挖到自己在国外创立的分公司中,从而极大延缓国外在这方面的研究进度。
按照陆哲的想法,人工智能这一个能够改变人类进程的大利器当然是掌握在自己手上比较好。
目前在智灵科技公司内,模型训练的核心代码依然只掌握在陆哲手中,而现有训练好的两大模型也只能在特定操作系统上才能正常运行,他这样布置的目的就是防止代码的泄露。
毕竟从代码中读取大模型的研究思路和从0开始研究大模型所花费的时间是截然不同的。
而他不是说陆哲信不过他越大,人心本就不可测。