《AIGC:智能创作时代》 陈章鱼解读
《AIGC:智能创作时代》| 陈章鱼解读
你好,欢迎每天听本书,我是陈章鱼。今天我要为你解读的这本书叫《AIGC:智能创作时代》,这是2023年3月出版的一本新书,而在4月的得到破万卷节上,这本书就被得到用户票选为年度推荐的十本书之一。
为什么大家这么关注这本书呢?因为这本书讲的是一个和我们现代生活息息相关的科技问题:人工智能会如何改变我们的工作?
我们先从书名里的“AIGC”说起。“AI”就是人工智能,“GC”代表的是“Generated Content”,翻译成中文是“生成内容”。这里说的“内容”可以是一段文字,可以是一张图片,也可以是一段音频和视频。在AI的加持下,这些内容的生成正在变得更快捷、更简单,甚至可以自动生成。
你可能会问,这个人工智能生成内容,和我有什么关系呢?我也不打算写小说、拍电影、搞音乐,那AI生成文本、图像,感觉和我也没有太多交集啊?并不是,虽然这本书的书名里边有“创作”两个字,但是它聊的其实是更广的话题。咱们翻开这本书,你就能感觉到。
这本书不是很厚,除去前言、后记、推荐语这些,主体内容大概是两百页。翻开这本书,其中重点部分讲的是AIGC的应用,你看各小节的标题就会发现AIGC其实和我们各行各业的工作都相关:《AIGC与产品研发》《AIGC与市场营销》《AIGC与管理协作》,还有AIGC在咨询、影视、电商、教育、金融、医疗各行业的应用。我觉得这部分内容是这本书的重点,你能看到很多启发,怎么把AI嵌入到自己当下的工作中。
除此之外,这本书还描绘了AIGC产业的产业地图,上游、中游、下游都有什么样的机会。我觉得这一部分也很重要,如果想杀入这个行业,可以告诉你机会在哪里。
这本书的作者有两位,杜雨和张孜铭。杜雨老师是中国社科院的经济学博士,同时还是一位科技领域的投资人。张孜铭老师是北大管理学硕士,也是一位新科技的研究者。
这期音频,我们重点来聊聊这本书中的两部分内容:在当下,人工智能都能在哪些方面帮助我们?如果我想进入人工智能的行业,在未来,我又应该从哪里寻找机会?
除了这本书中的内容,我在解读时,还会补充更多的信息。在动笔写这篇稿件之前,我已经和ChatGPT“玩耍”了一个月,我也会把自己的体会分享给你。
我们先进入第一部分,来看看在当下人工智能都能在哪些方面帮助我们?
这本书做了一个总结,在智能创作时代,在AI的加持下,创作者生产力的提升主要表现为三个方面:第一,代替创作中的重复环节,提升创作效率;第二,将创意与创作相分离,内容创作者可以从人工智能的生成作品中找寻灵感与思路;第三,综合海量预训练的数据和模型中引入的随机性,有利于拓展创新的边界,创作者可以生产出过去无法想出的杰出创意。
说得通俗一些,你可以把重复劳动交给AI,让你完成任务更快;你可以让AI在你的指导下生成更多的内容,从中找到更多思路;你还可以和AI一起,做一些以前做不到的事情。
咱们一个一个来说,先来说更快。
书中举了个例子,像是一些格式清晰的文字工作,对于内容的深度没有那么高要求,但是对于速度有要求,就非常适合交给AI来做。比如快速的新闻报道。
在2014年,洛杉矶发生了一次地震。仅仅三分钟后,《洛杉矶时报》就迅速发布了一篇关于地震的报道。这得益于他们从2011年开始研发的一款名叫Quakebot的机器人。这个机器人能够利用美国地质调查局的数据,自动写出新闻文章。
我国也有相关的尝试。2016年,四川绵阳发生4.3级地震时,中国地震台网开发的地震信息播报机器人在6秒内写出了560字的快速报道;2017年,当四川省阿坝州九寨沟县发生7.0级地震时,机器人撰写的报道,不仅有地震发生地、周边的人口聚集情况、地形地貌特征、当地地震发生历史以及发生时的天气情况,还配有5张图片,全过程不超过25秒;这个机器人在后续余震的报道中,从开始写作到发布,最快的纪录是5秒。
许多媒体机构已经开发了内部AI,比如英国广播公司(BBC)、《华盛顿邮报》。像是财经媒体彭博社,他们现在发布的内容已经有将近三分之一是由AI系统生成的。国内的媒体,比如新华社、第一财经、南方都市报等等,也都已经有这种类型的“AI编辑”。
你可能会问,我又不是新闻记者,这和我有什么关系呢?这本书告诉你,有关系。前边这个例子说明一件事情,目前AI在生成文字时,最擅长的是“结构化写作”,也就是像新闻简讯那样,文字有比较强的规律性,需要严谨、客观,不需要太多个人色彩。我们在工作中,很多场景都是在进行“结构化写作”。
比如程序员有一个不得不做,但是又特别不爱做的事情:给自己的代码写注释。有人说,程序员最讨厌的事情是给自己的代码写注释,但是同样讨厌的事情是看别人写的、注释不清晰的代码。这种活儿就适合交给AI。它可以生成全面、准确和规范的代码描述,为开发人员理解和处理复杂的代码和程序提供巨大帮助。除此之外,AI还有一个特别的优势,它能够自动根据代码和程序的发展做出调整,程序员改一遍代码之后,注释也能随着更新。
再举一个更常见的例子,开完一个会,总结会议要点,写会议纪要。借助AIGC,企业可以自动化个过程,帮助员工快速把握关键信息。
以前开会,需要有专人把要点都记下来,怕遗漏的话还得一边开会一边录音,回去再听两遍写纪要。现在可以把录音交给AI,让它通过智能语音识别技术将会议内容转换成文字,提炼出关键要点。这就给我们节省了大量的时间。
书中还引申出来一个应用,说实话我之前没有想到,就是可以借助AI安排会议。如果你是在一个大公司里边工作,那你肯定知道,要想拉上一些不同部门的同事开个会,执行起来可能是个非常麻烦的工作。要是同事在不同城市,那就更费劲了。
这个工作,也可以请AI帮忙。AI能通过分析来自电子邮件和日历邀请的数据,了解不同团队成员的空闲时间和会议时间偏好。基于这些信息,AI可以自动生成一个会议时间表,从而最大限度地提高出席率和工作效率。甚至将来AI可以自动和每个参会者发邮件打电话沟通,再去协调时间,保证每个人都能参加。
由此,我们还能举一反三,想到工作中的更多场景:商务邮件往来、项目周报总结、大量文件的整理和分类,等等。天下武功唯快不破,对于不需要那么多创作力的工作,又快又准确就是最好的。这一点,AI就能帮到我们很多。
我们再来说第二点,你可以让AI在你的指导下生成更多的内容,从中找到更多思路。
前边说的是“快”,这里说的是“多”,这一点上AI真的是任劳任怨。比如你跟我说,“现在咱们需要一个广告文案,你先拟50条作为候选。”我估计就该和你掀桌子了,但是你和AI说,它就一声不吭给你生成50条,你说再来50条,它就老老实实再给你来50条。
就拿这期音频举例,你在这个音频的产品页上能看见一句推荐语:“AI如何激发创作者的想象力?”这句话就是ChatGPT帮我想的。我和它说,我要推荐一本关于AIGC的书,请你帮我列10个推荐语。它就反馈了10条结果。这10条我觉得都不能直接用,不过有一条提到“想象力”,我觉得这个点不错,于是又请ChatGPT再生成10条,每条都带上“AI”和“想象力”这两个关键词。这就有了这句推荐语。
不过如果是更复杂的任务,比如一篇文章的布局谋篇,AI目前更适合作为辅助,还不能直接来用。比如在写这篇解读稿之前,我就问ChatGPT,我想写一篇文章介绍AIGC,请帮我拟一个大纲。
ChatGPT就真的给我拟了一个大纲。第一部分是引言,简要介绍AIGC的概念、应用范围和影响力。第二部分讲AIGC的种类和应用,文字、图像、音频、视频各占一部分,每个部分下边举例说明,比如文字可以讲创意写作、新闻报道和广告文案,音频可以讲音乐创作、语音合成和声音效果。第三部分聊AIGC的优点。第四部分聊AIGC面临的挑战和道德问题,像是知识版权保护,还有道德和法律责任。第五部分聊对未来的展望。第六部分总结AIGC的重要性和影响,强调关注AIGC的发展与重要性。
这个大纲很全面,但是你听音频的时候也发现,我没有直接套用。因为20多分钟的音频,我必须把握好你的注意力,控制好节奏,让你愿意跟着听,不那么累,还能感觉不断有新的启发和收获。如果直接套用这个大纲,那很可能讲了5分钟,就把你讲睡着了。
所以,在这个阶段,比较复杂的内容,还是由人的能力上限决定内容质量的上限。
不过书里提到了另一种玩法,借助AI能生成大量内容,原本千人一面的场景可以变得千人千面。比如,使用AIGC提供客户支持,让AI给客户写信息。与预先写好的回复不同,AIGC能够根据每个客户的具体需求生成独特和个性化的回复。这种水平的个性化服务有助于建立信任和提高客户满意度。
再比如,早在2015年淘宝的“双十一”促销活动后,阿里巴巴团队就开始探索利用算法和大数据为用户提供大规模的、个性化的商品推荐。他们开发了一款名为“鲁班”的产品,这是AIGC在创意营销方面的一个尝试。
在2017年,“鲁班”就能在一天内制作4000万张海报。 2018年,“鲁班”累计设计了超过10亿次海报。平均下来,“鲁班”每秒钟能创作8000张海报,这可能比一位设计师,整个职业生涯创作得都多。这个例子说明,AIGC在营销领域具有巨大的潜力和优势。今天的购物平台能提供商品的个性化推荐,也许不远的将来,点开商品之后,页面的排布、商业要点的列举,甚至是介绍的视频和图片,也都能根据每个人的口味进行个性化的生成。
这是这本书中提到的,AI可以帮助我们的第二个方面,你可以让AI在你的指导下生成更多的内容,从中找到更多思路。
第三个方面是,你还可以和AI一起,做一些以前做不到的事情。
著名的科技预言家凯文·凯利有个观点,我们可以想到某个新技术替代旧技术的场景,但是更多衍生的场景,我们其实想象不到。比如,马车的时代,人们就在想象不用马作为动力的车辆。所以汽车替代马车,人们可以想象到,但是更多衍生的场景,比如汽车电影院,那就是马车时代的人们根本想象的机会。
AI时代,也是如此,一些简单替换的场景我们可以想到。比如说AI配音员,现在短视频平台有很多3分钟解说电影的视频,开头往往是“注意看,这个男人叫小帅”“注意看,这个女孩叫小美”。抑扬顿挫的男声搭配一些电影的高潮情节画面,再加上相似的解说套路和背景音乐,用户只需3分钟就可以了解一部电影。你会发现这些音频好像是一个人配音的,因为都是由AI生成的。
这个场景其实我们可以想象到。但是由此衍生出的更多可能性,我们就未必能想象到了。在解读这本书的时候,我还在网上刷到了一段音频,是一位网友录制的一段单口相声,再借助AI技术,把音频变成相声大师马三立的声音。
相声行当里有个术语叫“尺寸”,发声的语气、停顿、轻重、缓急,都是“尺寸”的一部分。每个相声演员都有自己的特点,别人没法完全照搬。有很多相声演员模仿马三立,最成功的也只是能做到形似,没法完全乱真。但是听到这段音频的时候,我震惊了。作为一个听了二十多年相声,几乎能背诵每一段马三立相声的爱好者,我确实感觉是马三立复生。
这位网友正在做另一个尝试,单口相声大王刘宝瑞有一个经典作品《官场斗》,据说当年录制了全套的录音,可惜因为库房保管不善,现在只残留了一部分。对于很多相声爱好者来说,残缺的《官场斗》就想好像是残缺的《红楼梦》一样,是心里永远的痛。而前边提到的那位网友,正在尝试借助AI,用刘宝瑞大师的声音去弥补这个遗憾。
你看,这就是我们不容易想到的应用场景了。其实不只是相声迷,戏迷、歌迷、影迷,每个人心里边可能都有这样的遗憾,现在借助AI,这些遗憾在未来可能就不再是遗憾了。
不过,说到这,我猜你心里会有个越来越大的担心,AI这么厉害,干得又快又多,又有很多想象不到的事情它都能做到,我们会不会被AI取代呢?
目前来看,还不会。因为人相对于AI有个绝对的优势,是AI至少在短期内赶不上的——那就是人更理解人。
举个我最近和ChatGPT玩耍的例子。我父母最近去海南玩,住在我姑姑家,我就想着应该给我姑姑发个微信感谢一下。我就问ChatGPT,应该怎么写这条信息。下面是ChatGPT给出的结果:
“亲爱的姑姑:
您好!我想要特别感谢您在我爸妈在海南期间对他们的关照。他们跟我分享了在海南度过的美好时光,对您的热情款待赞不绝口。我觉得非常庆幸有您这样关心他们的亲人。
您带他们游览了许多美丽的风景,让他们感受到了异地的温馨。您的陪伴让我爸妈充分体会到了家人的关爱。我知道您在繁忙的生活中抽出时间照顾他们,我真的非常感激。
请务必让我知道如何回报您的关照。下次您来我们这边,一定要告诉我,我想亲自为您准备一顿丰盛的晚宴,让您也能感受到家的温暖。”
怎么说呢,我要是真的把这条信息发给我姑姑,她肯定一个电话就打过来,问我最近是不是有什么大病。经过多次调试,我也没有办法让ChatGPT帮我写出一个更亲切的版本。你看,在这种细微分寸的拿捏上,AI与人之间的差距,还是巨大的。
所以,还是那句话,在当下,人的能力上限决定内容质量的上限。
第一部分咱们说的是AI怎么帮助我们做好自己的工作。第二部分咱们来聊聊AI创造的新机会。
AIGC未来会变成一个巨大的产业,我要想切入到这个产业当中,应该从哪里寻找机会呢?这本书给我们描绘了一张产业地图,在AIGC产业的上游、中游和下游,都蕴含着我们可以挖掘的商机。
产业的上游是数据服务。今天也好,未来也好,人工智能的发展离不开数据的驱动。我们可以做个类比,如果把人工智能比喻成一个人的话,那么他就是靠“吃”数据获得营养茁壮成长的。民以食为天,所以食品加工行业才有了那么多的商业机会。而AI把数据当做食物,所以围绕数据也会产生很多的商机。
比如,数据在被“喂”给机器之前,常常会涉及查询与处理、转换与编排、标注与管理这些前置步骤,这就像是我们的食物之前要经过各种加工烹饪一样。人吃东西要讲卫生和安全,AI的数据也一样,所以在整个数据的使用过程中也离不开治理与合规方面的管理工作,这又是一个机会。
上游的机会围绕着数据,中游的机会则围绕着AI的算法模型。
人工智能之所以能判断,能分析,能创作,都是因为算法在支撑。于是,训练算法模型成为这个产业中最有技术含量的一环,换句话说,也是这个产业中最有商业潜力的环节。为了让AI的算法模型更聪明,各种人工智能实验室应运而生,最著名的就是研发出AlphaGo的DeepMind,还有ChatGPT背后的OpenAI。各大互联网巨头,像微软、阿里、百度、华为,也都组建了自己的研究机构。
总之,人工智能产业的中坚力量,就集中在算法模型的领域。
你可能会觉得,上游的数据,中游的算法,这两块专业性还是太强,门槛太高了,我一个普通人不好找切进去的机会。没关系,这个产业还有下游,就是人工智能的应用拓展。所有经过数据训练的算法模型,最终还是要学以致用。这个领域,是种类最丰富,机会也最多的领域。
前边咱们说到过内容包括文本、图像、音频、视频,每一个方向,都值得用AI重新改造一遍。也就衍生出各种各样的机会。 像这本书当中,就列出了19个方向,目前已经有清晰商业模型的公司,就列举了将近40家。我就不一个一个给你念一遍了,咱们挑几个有趣的方向来说。
比如在文本领域,有一家创业公司专注的是营销文案的生成,他们基于GPT的大模型,你只需要输入标题和文案大意,他们就能帮你生成营销文案。还有一家公司,他们在做的是帮助企业改进电子邮件写作,通过AI分析收件人喜好,帮助销售人员写出更吸引人的商业邮件。
更有趣的是在音频和视频领域,比如让用户不需要昂贵的设备,就能制作出音乐和动画。还有一个,就是可以生成几乎可以乱真的声音和影像。如果你想获得一个直观的了解,我推荐你去搜一下刘润老师的视频号,短视频里边的刘润老师,都不是录像,而是AI生成的。我的感受,完全看不出和本人的区别,如果不是连着刷了几十条,发现这半年的视频里刘润老师从来没有换过衣服,我真的看不出破绽。
其实,除了列举的这些,还有更多的机会,在等待有人借助AI把它变成现实。比如在教育行业,乔布斯曾经发问:“为何IT技术几乎改变了所有行业,却在教育方面建树不多?”这个问题放之当下的AI领域,似乎也并不过时。当下已经有成功的尝试,比如北京联合大学特殊教育学院就引入了AI系统,通过手语、口型、文字讲义的配合,帮助听障人士高效学习。
但是还有一个更大的机会在等着有人把它变成现实,就是借助AI提供千人千面的教育。
以往的教育都是大班制,一位老师带十几位、几十位学生,那么在未来,借助AI技术,可能帮助人类实现教育的终极理想:因材施教,大规模开展高度个性化的教育,让每个人都以最适合自己的节奏,在最合适的方向上进行自由发展,充分发挥自身的潜力,这也是经过多年发展的自适应教育的终极形态。
如果未来这样的设想能成为现实,那这个智能时代真的值得我们去憧憬。
到这里,这本《AIGC:智能创作时代》,我就为你解读完了。
AIGC是AI产业的其中一部分,如果你希望对人工智能有更全面的了解,我在最后向你推荐几本书。
如果你想了解人工智能的发展历程,我向你推荐《智能时代》;
如果你想了解AI算法和原理,我向你推荐《深度学习》;
如果你想了解人工智能的局限,我向你推荐《人工不智能》;
如果你想知道更远的未来可能会出现怎样的变化,我向你推荐《必然》和《奇点临近》。
这些书在得到听书都有解读。
最后,和你分享一段话。著名的AI图像生成模型Midjourney的创始人大卫·霍尔兹是这样评价人工智能的:“AI是水,而非老虎。水固然危险,但你可以学着游泳,可以造舟,可以造堤坝,还能借此发电;水固然危险,却是文明的驱动力,人类之所以进步,正是因为我们知道如何与水相处并利用好它。水给予更多的是机会。”
划重点
-
在智能创作时代,在AI的加持下,创作者生产力的提升主要表现为三个方面:第一,代替创作中的重复环节,提升创作效率;第二,将创意与创作相分离,内容创作者可以从人工智能的生成作品中找寻灵感与思路;第三,综合海量预训练的数据和模型中引入的随机性,有利于拓展创新的边界,创作者可以生产出过去无法想出的杰出创意。
-
在当下,虽然AI可以辅助生成内容,但是内容质量的上限,还是由人的能力上限来决定。
3. AIGC产业的上游是数据服务,中游是算法模型,下游是应用拓展,每个环境目前都蕴含着机会。