明略科技吴明辉：大模型不仅仅是AIGC，将把营销数据的价值提升100倍-秒针系统-营销实效管理专家

2023营销科学大会

明略科技吴明辉：大模型不仅仅是AIGC，将把营销数据的价值提升100倍

| 明略科技吴明辉：大模型不仅仅是AIGC，将把营销数据的价值提升100倍

2023-11-20

2194

吴明辉

第七届营销科学大会

明略科技创始人、董事长兼首席执行官吴明辉

编者按：2023年11月15日，由秒针营销科学院发起，明略科技集团及旗下秒针系统承办，以“‘大’有可为”为主题的2023第七届营销科学大会，于上海安莎国际会议中心圆满落幕。大会汇集了40多位营销科学的实践者，共同为超过1000+位现场参与者和过百万在线观看人次，带来了一场对未来营销科技的深度探讨。

在本次大会中，营销科学实践者的精彩分享让我们洞察到了未来营销的无限可能：中国“大”市场有可为、出海、破圈… 新品类、新品牌层出不穷；“大”需求有可为，消费升级与消费分级并重，高性价比品牌、高附加值品牌并驾齐驱；“大”模型，有可为，我们正处于一场深刻技术变革浪潮的开端，AI将有望在各个领域提升生产力效率。这不仅为品牌带来营销效率，也将为整个生态带来新生；营销“大”生态有可为，虽然当前行业挑战很大，在更深刻的层面思考，在产品、生意模式的源头去创新破局，联动更广泛的伙伴，巨大生态繁荣发展，共建美好品牌；最后，数据安全、隐私保护，一切以消费者为中心，“大”责任，更有可为。

明略科技创始人、董事长兼首席执行官吴明辉，在2023“大”有可为第七届营销科学大会上发表了主题为《大模型时代的营销智能：数据、知识、与人的全新组合》的演讲，深入浅出地探讨了大模型时代营销数据的价值，及企业实现差异化的关键要素。

以下为明略科技企业级一站式大模型Copilot“小明助理”，辅助编辑整理的演讲全文，希望为您带来更多启示和灵感。

其他精彩内容，将在后续文章中呈现，尽请期待。

生成式人工智能是一个更广阔的课题

Generative AI > AIGC

我相信，2023年将成为科技史上的一个重要里程碑。我们每个人都深刻地感受到，今年是人类历史上的一个重要年份。ChatGPT引领了大模型技术的发展，让我们重新审视未来的工作和生活规划。同样对营销科学产生了深远的影响，为我们开启了一种全新的、以数据和生成式AI为驱动的营销模式变革。

我于2000年在北大读数学，2004年研究生转向计算机系，专门研究人工智能。在北大期间，我的硕士论文写的就是语言模型，当时还没有使用”大模型”这个词，只有语言模型的概念。然后在2019年，我返回北大，继续攻读我的博士学位，发现我之前学习的一些内容已经不再适用，被视为上一个时代的技术。

在过去的半年里，人工智能的发展主要集中在内容生成的领域。各大商业公司都在不断地迭代并发布他们的模型，特别是在多模态领域，迭代的速度更是快速。全球最杰出的一群人每天都在努力推动这项技术的发展。然而，这也引起了许多营销科学工作者的忧虑，他们担心强大的人工智能可能会威胁到他们的工作机会，广告公司也因此感到不安。

作为一个学习人工智能的人，我仍然坚定地相信自己的价值。舍我其谁呢？当然，我也清醒地意识到，在大模型的基础技术上，中国实际上稍微落后于美国，这项技术依然是硅谷的原创。

今年8月，我去了趟美国，停留了超过两周的时间。在这期间，我首先拜访了皮克斯公司，这是迪士尼的全资子公司，也是全球第一个全面使用计算机生成动画片的公司，堪称内容生成领域的领导者。

我怀着满心的期待来到他们公司，然而在我约见他们的导演组负责人时，他告诉我他们公司实行了一项明确的AI保护措施：人工智能不能用于编写或者修改文学材料，而且AI生成的材料也不会被视作MBA（基础协议）下的原创作品。我听后感到非常意外。

他解释说，现在好莱坞正在经历罢工，演员和制片人都认为大模型将会颠覆我们的行业，因此编剧们拒绝“为AI打工”。他们希望只将ChatGPT等生成型人工智能作为一个辅助研究或者促进脚本创意的工具，而不是用来替代他们的工具。

更大的问题在于，像皮克斯这样以IP知识产权为核心盈利模式的公司，如今面临着一个困境：在美国，人工智能生成的内容并未受到版权保护。即使版权得到保护，也存在很大的挑战。例如，我编写一段代码，可以一次性生成上万个内容，如果这些内容都受到版权保护，那么后续的创作还有何意义？对于像皮克斯这样的公司来说，这是无法接受的。因此，他们对使用人工智能生成内容的态度极为谨慎，其中最核心的考虑因素就是版权问题。

虽然像皮克斯这样的公司并未在内容生成方面领先如我所想，但在美国，依然有许多公司在大模型技术的应用上做得非常出色。我参观了一家金融公司，标准普尔公司，在和一位同学的交谈中，他告诉我他现在对大模型非常看好。

自从毕业以来，他已经积累了至少十年以上的金融行业分析模型的编程经验。然而，在过去的半年中，他已经全面放弃了这些传统的代码，转而使用大模型，结合计算机语言对它们进行了重构。经过重构后，他现在每天只需要花费半小时的时间，就能完成原本一整天的工作任务。

过去，他编写的所有代码都是静态的，而市场的变化却是动态的，金融行业也同样充满了各种变动。他每天的工作就是根据金融市场的动态变化，不断调整他的代码，并每天运行一次。然而现在，他直接使用GPT进行调整，让人工智能自动适应外部环境的变化，这样他每天只需要半小时就能完成所有的工作任务。

如今，使用人工智能技术最出色的公司，并不仅仅是那些专注于内容生成的企业。在我与许多朋友的交流中，我们经常会提到一个词——AIGC，也就是人工智能生成内容。然而，对于营销行业的从业者，特别是营销科学的从业者来说，仅仅了解这个词是远远不够的。我们应该去深入理解生成式人工智能，Generative AI。

事实上，人工智能可以生成几乎所有类型的智力活动，包括编写代码、数据分析，甚至协助企业的高级管理者进行各种智慧决策和战略规划。作为明略科技的首席执行官，我虽然不需要亲自撰写广告文案或进行绘图，但我每天都会使用我们公司的人工智能产品超过20次。

生成式人工智能是一个更广阔的课题，AIGC不仅仅是指ChatGPT，营销行业从业者对它的认知必须超越生成内容的范畴。尽管由于版权原因，您所在的组织可能无法直接使用它来生成广告，但仍然有许多其他事情可以做。

人工智能本质上就是在构建函数

大模型的推理能力才是企业落地AI的关键

在过去的半年中，大模型的迭代发展持续进行。那么，它的核心迭代是什么呢？一个多月前，我有幸与智谱AI的创始人唐杰教授进行了一次交流，他向我解释说，核心在于推理能力，而不仅仅是多模态或生成图像的能力。

那么，什么是推理能力呢？让我举一个例子来具体解释，每当新版本的大模型发布后，我总是会提一个问题进行测试：“美国有哪些州与其他州不接壤？”标准答案应该是阿拉斯加和夏威夷。然而，在测试后，我发现虽然许多人声称他们的模型已经非常接近GPT-4，但能回答正确这个问题的模型却寥寥无几。

这就是一个涉及逻辑推理的复杂问题，它不仅需要理解美国的地理知识，还需要明白“接壤”这个概念，以及什么样的情况下可以被定义为“与其他州不接壤”。

在过去的几年中，大模型在人工智能领域曾经有些像“人工智障”，但现在却突然变得聪明起来，这主要得益于大模型已经学习了人类在互联网上公开的大量基础知识。然而，就像人类一样，即使掌握了所有的知识，使用这些知识时仍然会遇到许多问题，其中最核心的就是推理问题。大模型的推理能力是一阶还是二阶，将直接影响到它在数学等领域的表现。

即使是今年最先进的大模型GPT-4，在数学水平上也只相当于中国普通初中生的水平。很多人都听说过大模型有几十亿或上百亿个参数，但很多人并不清楚参数的作用。今天我想用简单易懂的方式，用初中数学的方法和大家一起探讨一下这个基础原理。

所有的人工智能本质上就是在构建函数。举个例子，如果我今天的演讲被录了下来，语音识别技术就能将这个语音文件转换成文本，这就是一个函数。这个函数的输入x是语音文件，输出y是一段文字，这个过程就是将声音波形转换为文字。同样地，图像识别也是一个函数，比如，如果摄影师今天在这里拍了一张照片，上传到云相册时，系统会判断这张照片里是否有吴明辉。输入的x是一张照片，输出的y是判断结果——有或没有。

如今的GPT也是一个函数，所有的人工智能最终要解决的问题，就是要找到那个函数。我们一起来看一道初中数学题，一次函数的表达式为y=ax+b，如果给定这个函数经过两个点，我们就可以确定出a和b这两个系数，并将其代入函数中。a和b被称为参数。一旦a和b确定了，我们再给定任何一个x，都可以计算出对应的y值，这就是人工智能的本质。

然而，真正的ChatGPT并不是简单的一次函数，它的解析并不只需要两个数据求出a、b两个参数。例如，GPT-3.5拥有1750亿个参数，并且这是一个非线性函数。它并不像一次函数那么简单，它是分层的，每一层在深度学习中都是复合函数的一部分，形成了函数嵌套的过程。第一层是f1，第二层是f2，第一层函数的输出结果作为第二个函数的输入x，第二个函数的输出y又作为第三个函数的输入z，据说GPT-3.5有96层，GPT-4则有120层。对于这样的非线性方程，我们需要寻找近似解，进行曲线拟合。这时，为了求解出1750亿的参数，我们可能需要借助100万亿的数据。但无论如何，这个过程的本质仍然是在解方程。

OpenAI的伟大之处在于，它是全世界第一家敢于投入数千万乃至上亿美元来解方程的公司。这需要有足够的资金，同时也需要有足够的胆识。

大模型时代的营销智能，核心之核心是数据

一定要积累大模型所没有的数据

今天，GPT之所以如此强大，是因为他们使用了互联网几乎所有的数据。为什么以前没有人想到这一点呢？因为互联网上的数据太杂乱了，没有经过标注，以前所有的人工智能都使用的是经过标注的数据。而今天聪明的人们终于意识到一个事实，互联网上的数据实际上已经被标注了。

我们画小猫、小狗或其他动物植物，为什么能够画出来呢？因为我们将互联网上的所有网页都截取下来了。例如，周杰伦在百度百科上的页面，周杰伦照片和照片下的描述，这不就是x和y吗（照片与名字关联）？

互联网上有非常丰富的数据，这些数据的规模不是几百万或几千万，而是数百亿级别的。今天大模型之所以如此强大，就是因为它利用了这些海量数据。作为营销科学工作者，我们需要思考的问题是，我们的公司应该积累什么样的数据？如果我们没有积累大模型所缺乏的数据，那么我们的团队以及公司可能都将失去价值。

谈到数据，我们还需要考虑数据、知识和人的组合。在人工智能领域，有一个非常经典的模型叫做DIKW模型，它阐述了从数据到信息，从信息到知识，从知识到智慧的转化过程。

知识是什么呢？无论是ChatGPT还是国产的大模型，如果你直接问它明略科技的创始人是谁，每天的答案可能都会不同。可能有时它会回答是李开复，有时又会说是李彦宏，但它从未回答过吴明辉。这是因为大模型的学习基于互联网上的网页和公开课程的PDF语料，虽然这些内容中可能包含明略科技和吴明辉的信息，但在它的学习过程中，这些正确信息的权重都相对较低，所以它并没有充分掌握这些知识。

并且，很多我们想了解的知识，实际上是在大模型学习训练之后才出现的互联网内容。例如，前几天ChatGPT发布了一些最新的功能，大模型肯定是不知道的，因为它还没有学习过这些新的信息。

一个企业或组织想要充分利用大模型，需要解决企业知识积累的问题，专注积累那些大模型尚未掌握的知识，并且要想办法将大模型已经学过但没有每天运用的知识唤醒。否则，你会发现它只是一本正经地胡说八道。

大模型可以把营销数据的价值提升100倍

从结果数据到过程数据

我们常常打个比方，一个基础大模型相当于一个清华北大本科毕业生，他来到你们公司，什么都不知道，如果不给他公司现有的知识，他什么也做不了。我们需要帮助每个客户重新治理他们企业的数据和知识，包括陈述性知识和程序性知识。这两类知识可以简单地描述为Know-what和Know-how。例如，在服装行业中，了解最热门的趋势是Know-what，如果我作为一个北大本科毕业生，让我写一个关于美拉德妆容的文案，包括美拉德妆容的图片样式，这些都属于Know-what。

每个企业都应该投入一些资源来解决知识积累这个问题，这也是我们明略科技和秒针系统的商业机会，我们帮助客户解决这些问题。明略科技和秒针系统的定位非常简洁，就是帮助大家建立连接器，持续为企业提供数据治理和连接服务，帮助企业连接基础大模型和和内部数据、知识，并形成反馈闭环。并在这个闭环中持续积累新的数据，树立企业的独特价值。

以往更有价值的是结果数据，而如广告监测搜集的数据、小程序搜集的数据等中间过程的数据，大家只是简单地看一下这些数据，然后结束了。但有了大模型之后，我们完全有机会将我们过去积累的这些营销的中间过程数据的价值放大100倍。面对拥有非常复杂维度的过程数据，以前的人类数据分析师可能很难深入地了解每个维度、参数与最终结果之间的关系，但今天有了大模型，只要你将数据原理告诉它，数据治理的过程它就可以帮你完成。

模型会越来越强大，我们不用纠结于使用哪个模型，我们应该关注的是，我们公司的数据资产是什么样的，我们如何进一步治理数据，真正将其与大模型连接起来。

大模型时代营销科学工作者的独特作用

与消费者情感绑定的品牌，永远不会被AI取代

今年年初，陆奇博士曾经分享了一个观点，他说我们迎来了一个新的范式。过去，互联网和移动互联网引入了信息系统，现在，以ChatGPT为代表的大模型则引入了决策系统和模型系统，我们的认知能力和感知能力结合在一起，最终转化为行动。

在许多行业中，行动是非常复杂的。例如，在工厂中，即使模型做出了决策，生产制造仍然没有实现柔性制造，无法实现智能制造的流水线，无法形成新范式。但在广告行业，广告投放本身就是基于程序化的基础设施，每个互联网平台都提供了程序化投放的接口，新范式的形成就相对容易。在反馈闭环、内容生成、数据决策等方面，我们还没有做得很好，我们虽然拥有海量的数据，但是我们还有很多工作要做。

我们需要清楚地知道，在营销场景中，AI的应用处于哪个阶段。借助大模型的帮助，我尝试给营销智能的L0~L5定义。首先，我在互联网上找到了一篇文章，文章的标题是“无人驾驶的L0~L5”。接着，明略科技的一站式大模型Copilot“小明助理”阅读并理解了这篇文章，根据自动驾驶AI的L0～L5的逻辑标准，推导出了营销场景下的L0～L5描述，我只对其中的10%的细节进行了修改。我还询问了小明，L2和L3有什么区别，它告诉我L2只是确定好目标人群后就结束，而L3则可以实时优化，在投放过程中每秒都能观察到消费者的反馈，并进行自动调优，我觉得它的描述已经非常到位。

人工智能的能力是真实而强大的。过去，我们以为人工智能只能帮助我们完成那些我们不愿意做的工作，而复杂和高级的工作仍需要我们来完成。然而，现在我们可以看到，人工智能几乎能够做任何事情，无论是逻辑推理，还是对人类情感的理解，它都能胜任。它现在甚至能创作音乐，写诗。因此，作为营销人员，我们应该思考在未来我们应该做什么。

在思考这个问题的时候，让我们回顾一下2010年我刚开始接触广告领域时看到的一张图，这张图展示了北美数字广告中各个角色的分工情况。

前几天，我又看到了美国最新发布的一张图，未来的情况可能是GPT将所有的角色都兼顾了，你没有什么事情可做，甚至整个公司可能无事可做。现在的方向是人工智能AGI，通用算力，未来机器人也将进入通用的行动类机器人，最可怕的是，它们还可以制造自己，工厂也将失去价值，所有的东西都可以由机器生成指令，工厂实现自动制造，制造业也将被颠覆。

那么，人类到底能做什么？这是我最近陷入深深哲学思考的问题。我阅读了许多书籍，比如著名的数学家、人工智能认知科学家，控制论的创始人，写的这本《人有人的用处》。

马克思讲到了商业社会产品价值由人类的无差别劳动决定。这句话可能需要改变，应该说，商业社会产品价值由人类加上人工智能的无差别劳动决定，计算机可以复制的东西将失去价值。

作为营销科学工作者，我们真正可以积累的独特优势是什么？我觉得可能有两个点。

首先，我们企业和品牌能够在自己的业务场景下积累的独特数据。我们应该重视并妥善管理这部分数据，而不是整天只关注模型的问题。其次，是消费者对企业品牌的情感绑定。如果今天消费者与企业品牌的绑定是功能性的，你今天可能会卖得很好，但未来所有产品的能力都会极大丰富，只有情感的绑定才能持续地在消费者的记忆中存在。品牌广告还要使劲打，不能天天想着效果广告，品牌建设很重要。

明略科技和秒针系统，将帮助企业持续建设自己品牌的第一方数据资产，连接各种各样的数据，并将这些数据和能力与原有的IT系统和外部系统、与大模型进行连接。

企业使用大模型时，需要关注数据的保密性和推理任务的复杂性。处理的任务特别复杂，但处理任务所需的数据保密程度低，那么放心大胆地调用在线最牛的大模型即可，不用担心数据安全的问题。处理的任务没那么复杂，但数据是公司高度机密的数据，那么部署智谱这样的私有化模型，简单地调优后在自己的云上调用更好。处理的任务较简单，且处理任务所需的数据保密程度低，调云上的大模型还是私有化模型都可以，优先考虑成本为问题。最难的是，数据需要非常复杂的人类智力参与，一起做数据脱敏，把数据做好脱敏后再调用大模型的能力，这也是明略科技和秒针系统未来持续为企业提供的服务。