0.01粗糙版数字永生
最近ChatGPT
开放了API
,最新的定价也出来了,据说比以前的版本便宜了挺多。于是写了几段代码试着调用一下。跟网页版类似,提出一个问题(写一段话)就会得到一个回答。然而如果只是这样的话可以说毫无意义,用网页版就得了还写代码干啥?
ChatGPT作为大语言模型,最擅长的是自然语言处理。很多人使用ChatGPT已有的知识来帮助写文章,然后自己修改,或者自己写了让ChatGPT来润色以达到省时省力的效果,也有人会让它按某名人的风格写一段文字等。前者是最基本的应用,后者则纯粹为了好玩。但网络中大多数文章对ChatGPT能做啥和不能做啥的评论其实都只停留在使用网页版的层面。有的人发现ChatGPT能给出些是似而非的答案就大喊狼来了,人工智能要抢人的工作,有的人则发现ChatGPT其实不万能,甚至在一些简单的问题上犯错后就认为这又是一个类似元宇宙那种乱七八糟圈钱的东西。
对普通人来说ChatGPT也许就是个好玩的东西,普通人不可能也用不着成为人工智能专家,包括绝大多数程序员,但这并不妨碍我们从用户的角度去思考ChatGPT到底能为人类做些什么。
以前说过,ChatGPT必定会成为人与工具之间的智能接口,这已经在发生。但这样的例子即便发生再多这也只是语言模型类AI
一个方面的应用——即通用工具智能接口,也就是一个在线系统摆在那里,所有人用的都是同一个东西。但AI
可以做的其实远远不止这么一点。
回到前面的例子,ChatGPT熟悉鲁迅就能用鲁迅的风格写一篇像模像样的文章,但它不熟悉你的风格,因为没训练过。但显而易见它能模仿鲁迅的风格自然也能模仿任何一个人的风格,所以理论上任何一个人都可以拥有一套为其量身定制的个性化ChatGPT,写出来的文章就是那个人的味道。
本文开头说我写代码测试调用API
,初衷是如果能让ChatGPT学会我写文章的调调,那以后就能省很多事,这是通用版做不到的。网页版可以理解为千人一面的众生相,而定制化的版本则只此一家别无分号。ChatGPT的上千亿个参数可能只需要很小一部分就能满足这样的要求。从ChatGPT编程接口的文档来看也确实提供了更高级的fine-tune
模式,可以喂数据给它来训练,那么配合每个人的唯一API
Key,得到的就是每个人独一无二的版本。还没想好该怎样训练,但接下来心中猛然蹦出的想法让我意识到其实还有更广阔的天地——0.01粗糙版的“数字永生
”几乎已经就在眼前。
首先需要为“数字永生
”下一个定义。如果说数字永生
是《流浪地球2
》里面丫丫那种形态的话,还有很远的路要走。电影中图恒宇要的并不仅仅是丫丫以数字化形式存在于网络中,而是丫丫作为一个真实的生命以数字化形式存在和演化下去。不过如果把条件放低一点,把它限定成“数字化的可交互回忆
”,情况就会大不相同。人类发明了文字、书本、留声机、照相机、摄像机等等能够记录历史的工具,但都只能看到听到而不能与之沟通。ChatGPT的出现让只读模式的历史或者回忆变得可沟通,甚至在一定程度可写成为了可能。试想如果每个人都拥有一个学会了自己的思考和表达方式的聊天机器人,也就在一定程度上拥有了一份自己的数字化备份,那么就能把这个聊天机器人作为数字遗产留给需要的人。这样一来思念斯人的时候能在微信上接近真实地聊聊天,听听父母老生常谈的唠唠叨叨对有些人来说也许是很治愈的事。
只要有足够的数据,ChatGPT就可以解决碰到一个提问该“说什么”和“怎样说”的问题。至于那种逼真且可以动起来的人的形象,已经有了相当多的研究成果可以看到。语音早已不在话下,每天刷的抖音视频里的解说旁白十有八九已经来自于机器合成,所需要的只不过是为专人作训练和定制。如此一来以ChatGPT作为大脑,相关的视频和音频技术作为输出手段,一个永生的数字化人的基础模型就有了,而且是在保有原始数据基础之上能够逐步完善的那种形态。
还缺了最关键的一环,那就是训练。收集训练数据是重中之重,大胆预测一下,不需要多久人们就会造出方便易用的“观察者模式
”人工智能设备或者应用,在得到许可的情况下不间断地收集目标主体的音容笑貌等数据并把数据用来迭代ChatGPT这样的数字化大脑,最终交付一个近似真人的永生的数字化虚拟实体——甚至是离线版本(比如语音合成已经有离线版本可用,无需网络),如果只需要文字聊天,那么对专业人员来说几乎隔夜就能实现。在大多数人只会在网页上指挥调侃ChatGPT的时候,也许已经有人在做这样的尝试了。
先想办法训练一下ChatGPT学习我写东西的调调,其它的拭目以待。