大数跨境
0
0

【AI问爱答】首期干货:大模型商业化,怎么落地才有用还好用?

【AI问爱答】首期干货:大模型商业化,怎么落地才有用还好用? 阿里云云栖号
2024-07-26
0
导读:【AI问爱答】首期栏目上线了,欢迎关注,欢迎提问!

概述

【AI问爱答】是阿里云首档AI问答栏目,让阿里云AI专家答疑团为您一网答尽关于AI的热点、难点、突破点。每周四晚7点,在阿里云官方媒体平台和量子位视频号上线。

首期由栏目由阿里云通义大模型业务总经理徐栋回答网友提问,阿里通义实验室观沧主持。大模型商业化的技术方向选择几何?大模型在智能客服、电商、游戏等场景落地难点?个体如何抓住AI红利? 更多内容请解锁原片。




Timeline
start-16:53

深度问答


16:53-end

快速问答



问答环节
深度问题1

Q:传统企业和新入局的企业,如何选择大模型赛道?

A:怎么样在一个水涨船高的阶段,做好那艘船,而不是要做好那座山,因为水涨高了之后可能山会被淹没,所以怎么样用好模型可能是最重要的事情,这是企业和新入局的玩家要重点思考的。一是做好业务的梳理,做好知识的封装,用Agent去体现。还需要清楚业务的应用场景到底是实时链路还是离线链路,这会影响到模型的选择和Agent的搭建。

Q:如何提升大模型在智能客服场景中的用户体验?
深度问题2

A:智能客服一开始就具备比较强的泛化性,它跟知识库问答并不矛盾,也并不冲突。我相信未来所有的智能客服都会用到模型。今天有了模型,智能客服不需要去输入更多的代码,对上下文有一个比较完整的一个理解,通过system prompt的方式来去提升它的拟人化能力。估计三个月以内,或者说目前已经可能市面上已经有很多智能客服,已经开始慢慢替代了原有的这种商业逻辑。

深度问题3

Q:如何保持AIGC内容的原创性、个性化,避免千篇一律的产出?

A:电商目前应用到的大模型可能主要是在两个方向。一个是偏语言模型的使用,如对商品做打标,做评论的提取等等。另外就是生成内容后直接通过渠道分发,比如以富媒体方式发出。用AIGC生成内容上,最重要一件事情其实就是精度。其实所有的内容你希望它不要变的就不要去变,你希望它变的尽可能变化足够大,可控式生成是我们在努力的一个方向。

Q:未来游戏场景中是不是会有大模型生成的NPC?
深度问题4

A:游戏里NPC本质上是一个数字人。我们发现大模型是必要要素,但它只占30%,产品、运营人员也会有影响,所以这个领域目前还是一个探索阶段。我们看到很多像星座类的一些大的IP,其实已经开始在应用数字化分身的方式去做。游戏NPC因为涉及到他对剧情的推动,以及可能会出现的不可控的幻觉,导致的流程无法继续,会出现一些挑战。随着模型的精度越来越高,业务人员参与越多,游戏NPC会取得比较大的一个发展。

深度问题5

Q:AI生成视频有哪些技术难点呢?有哪些商业化可能性?

A:视频生成我觉得可以分成两种,一种是类似于文生视频,基于语义去生成视频,还有一种是对视频内容做编辑。我们观察到今天对于视频编辑的需求特别大,尤其是以人的身体面部表情的编辑为最主要的一种尝试方向。基于人的肢体的动作驱动一张图片,还有一个是针对人脸,驱动他的整个面部表情,甚至包括上半身的手势,我觉得第二条技术路线对于视频编辑控制方向有非常大的商业化可能性。所以这块我们会做的多一些,我相信可以跟文生视频结合在一起。

Q:个人创业者如何抓住AI大模型的红利?
深度问题6

A:模型的能力越来越好,大家就做好一件事情就是做应用,这已经是大家的一个共识。大家都希望做一个native LM的一个超级APP,但我觉得这个方向现在已经很多人尝试了,其实只要有用户留存,它能够持续迭代,我觉得就是一个非常好的一个现象。从我的角度来看的话,它本质上还是个 Agent,你怎么样去做知识的封装是你独到的能力,另外我觉得比较重要的是要做好整个产品的一个交互逻辑。


快速问题1

Q:Qwen2开源了,更多尺寸1.8B、14B、32B什么时候出?

A:根据过去时间来看,我们基本上一个月开源一次或者两次。开源模型的甜点区在7B和72B,然后其他的模型,我们会根据社区的反馈去动态的更新。

Q:通义在文生图,尤其是视频理解的能力如何?
快速问题2

A:通义会持续迭代,在原有的VL 的模型上面做叠加,推出视频流的理解能力,此外,我们也会增强在VL上面的SFT的一个能力的开放,帮助用户更好的去用好VL的模型。

快速问题3

Q:基础模型训练到效果足够好时,是否可以完全取代行业小模型呢?

A:小模型的生存空间是在端侧,端侧放在手机、PC里面。考虑到成本和性能,比如说要低延时,然后推理成本希望足够低,那就可以通过小模型去做微调实现。

Q:短剧很火,有可以和AI商业化相结合的商业想象空间吗?
快速问题4

A:短剧是个非常复杂的媒体生成的工作流,建议创业者可以总结一下工作流。每一个工作流可能会有一些不一样,不同工作流可以嵌入不同的Agent,然后做整个短视频或者短剧的一个生成方法。

快速问题5

Q:互联网的部分工作已经由大模型来完成了,将来它会替代产品经理和程序员的工作吗?

A:今天我们看到现实的情况是一个员工带着五个数字员工会越来越普遍,但整体的方向还是要有一个真人来去做控制。

Q:Multi-Agent目前有什么新的进展?
快速问题6

A:建议大家先关注单Agent准确率。因为Multi-Agent的挑战在于你多次交流之后,如果你的准确率是90分,如果乘以2个90分就是81,所以它的准确率会下降。


快速问题7

Q:Transformer注意力模型的函数如何帮助智能客服场景下的模型上下文记忆?是否可以通过Memory的算法架构技术来实现?

A:从技术路线来看这两者是不一样的,Transformer注意力机制来自于你输入的所有的内容,也就是你的prompt或者query里内容的上下文。而memory其实是对query本身做一种补充。它可以把用户问的问题结合前面的记忆做一个增强,把上下文描述的更加准确。今天memory的一个机制是怎么样去把历史上的多轮对话去做很好的一个记忆,其实是可以通过微调的方式去实现的。


AI问爱答,来听干货来提问!


有机会获得栏目周边礼品!欢迎广大网友们来提问!


点击文末「阅读原文」即刻登录栏目官网提问或发送#AI问爱答+问题#至“阿里云云栖号”后台,问题被栏目选中的提问者,将收到栏目文化衫和精美礼品一份!


第二期即将上线,8月1日晚7点,锁定阿里云视频号,关注量子位视频号,一起来听干货!

【声明】内容源于网络
0
0
阿里云云栖号
云栖官方内容平台,汇聚云栖365优质内容。
内容 3553
粉丝 0
阿里云云栖号 云栖官方内容平台,汇聚云栖365优质内容。
总阅读10
粉丝0
内容3.6k