叙述ai数字人入侵直播间虚拟主播,虚拟主播人工智能近期图片、视频、文字等资讯信息。

ai数字人入侵直播间虚拟主播,虚拟主播人工智能插图

  撰文|新皮层小组编辑|吴洋洋基于生成式AI(GenAI)开发的商业化产品越来越多。本周,Google考虑对基于AI的搜索服务收费、TikTok将推出AI虚拟主播的消息先后传出,有着「全球首款AI原生硬件」之称的AIPin也于本周开始发售,售价699美元。与上一代用基于规则的算法开发出来的菜单式应用相比,这些新产品都开辟了新的交互方式,让用户可以通过直接与AI对话获得服务。不过,这些GenAI原生应用的商业化进度比预想中来得慢,一大原因仍然是模型能力的局限。模型测评机构Vals.AI的测试结果表明,在从各种维度展开测试的榜单中,GPT-4的排名依然不是第一就是第二,仅在部分情况下Anthropic的最新最大size模型Claude3Opus会超过它AI虚拟数字人的市场分析,虚拟数字人的发展。也就是说,GPT-4这个发布于一年前的模型仍然是目前全球最「聪明」的。这种状况对OpenAI算是好事,但对整个行业来说则相反。不够高的准确率使得GenAI很难进入财务、税务、法律等更具生产力的领域。Vals.AI的测试显示,在财务相关任务中,只有GPT-4、Claude3Opus、Claude3Sonnet等3个模型的准确率超过了60%;而在税务相关任务中,表现最好的模型GPT-4的准确率也只有54.5%,其余大部分模型准确率不到40%;法律相关问题是大模型表现相对较好的任务,比如在法律推理任务上,包括Claude3Opus和GPT-4在内的5个模型准确率都超过了70%,其中GPT-4准确率在该任务上达到了77.7%。然而无论60%还是77.7%,这种准确率水平的AI都不足以在财务、税务、法律等严肃场景中商用。自动驾驶同样如此。业内已逐渐形成共识,即以GPT为代表的GenAI缺乏真正的推理能力,各大公司也都计划在接下来推出的新模型中解决这一问题。本周,OpenAI和Meta的高管都表示,他们正准备推出下一个版本的大语言模型。「今天的人工智能系统非常擅长一次性的小任务。」OpenAI首席运营官BradLightcap称,下一代GPT将在解决推理等「难题」方面展现进步。Meta的首席人工智能科学家YannLeCun则表示,Meta正在开发AI「Agent」(智能体),让它可以计划和预订从巴黎某人的办公室到纽约另一个办公室的旅程的每一步行程,这种智能体需要强大的推理和规划能力,才能完成对任务的拆解、排序和执行。和OpenAI计划今年夏天发布GPT-5类似,Meta也准备在未来几个月发布一系列型号尺寸的Llama3,其中小型号的Llama3下周就会上架。GenAI能否兑现资本市场对它的估值,就看GPT-5、Llama3等新一代号称有推理能力的模型是否能兑现其承诺了。否则,GenAI的商业价值就要大打折扣——作为一个语言、图像翻译工具,还是作为决策工具,对应不同等级的产业价值。以下内容为过去一周值得关注的智能新闻摘要,由《新皮层》团队制作,欢迎关注。KeyPoints大模型篇Cohere推出新模型CommandR ,更强调RAG;Meta计划下周推出小版本Llama3;苹果又发布了一款试图读懂手机屏幕的大模型「Ferret-UI」;应用篇Google考虑对基于AI的搜索服务收费;TikTok将推出图片分享应用「TikTokNotes」;TikTok将推AI虚拟主播;AIPin发售,售价699美元;Vals.AI要做大模型评测生意;人才与资金篇微软在伦敦新设AI中心;xAI寻求以180亿美元估值融资30亿美元;面壁智能完成数亿元融资。大模型篇Cohere推出新模型CommandR ,更强调「检索增强」4月5日,Cohere官宣其新一代大模型CommandR ,这距离其推出上一代大模型Command-R仅过去不到1个月。CommandR 的参数量达1040亿,上下文窗口可支持128K,并具备英语、中文、法语、德语等10种语言能力。Cohere称,CommandR 性能高于MistralLarge,仅次于GPT-4Tubro。相较于前代模型,CommandR 强化了其内置的RAG(检索增强生成)能力。「新皮层」此前报道,Cohere的目标正从追逐最前沿模型转向RAG(检索增强生成)。此前,Cohere曾将大量资金花在了追逐OpenAI和Anthropic的最新模型能力上,然而近期Cohere的领导者决定不与OpenAI等公司竞争,不再将开发最大、最先进的AI模型作为首要指标,转而专注于强化大模型的RAG技术。Meta计划下周推出小版本Llama3Meta即将推出新款大语言模型Llama3,对标OpenAI开发的GPT-4。该公司计划下周推出两个小尺寸的Llama3,最大尺寸的版本计划今年夏天推出。区别于即将发布的两个小尺寸模型,最大版本的Llama3是多模态的,可能拥有超过1400亿参数。上个版本的Llama2推出于2023年2月,也拥有3个不同尺寸。苹果又发布了一款试图读懂手机屏幕的大模型「Ferret-UI」4月8日,苹果发布专为理解移动UI屏幕而定制的多模态模型Ferret-UI,它能够「看懂」手机的UI界面并执行相应任务。经过训练的Ferret-UI能够通过不同的输入格式(点、框、涂鸦)和基础任务(查找小部件、查找图标、查找文本、小部件列表)在移动用户界面屏幕上执行任务,如小组件分类、图标识别和光学字符识别等。Ferret-UI是苹果为AI理解UI所开发的第二款大模型,新皮层曾报道,苹果3月29日发表的一篇论文表示苹果已开发一个名为「ReALM」的模型,该模型可以理解手机屏幕上的信息,苹果认为,这是实现用Siri等语音AI操作手机的关键一步。目前,苹果正在考虑引入第三方模型以便在iPhone上实现智能功能,而Google的Gemini和百度的文心一言都是潜在的合作对象。ReALM和Ferret-UI两款模型发布意味着苹果并没有放弃用自研模型控制手机。应用篇Google考虑对基于AI的搜索服务收费据报道,Google正在考虑对其主要盈利来源——搜索引擎进行改革,包括在其高级订阅服务中添加基于AI的搜索功能,每月向订阅用户收取20美元费用。自2000年开始,Google搜索业务的收入来源主要是广告,而这一改革举措可能会成为Google有史以来最大的变革之一ai虚拟数字人央视,虚拟数字人技术架构。Google的AI搜索服务能够根据搜索内容生成完整答案后再提供给用户,而不是像传统搜索引擎那样只是把一系列相关网页陈列出来。Google从去年5月开始测试这种AI搜索服务,如今,Google考虑把这一服务加入其高级订阅服务中。目前,Google高级订阅服务月订阅费为20美元,用户可以在该服务中使用最新的GeminiUltra1.0聊天机器人,能够在Gmail、Docs和Sheets等生产力套件中使用由Gemini提供的AI能力。如果AI搜索也加入该订阅菜单,将是Google第一次将自己的核心业务置于付费墙之后。TikTok将推出图片分享应用「TikTokNotes」当地时间4月9日,TikTok用户收到的应用弹窗显示,公司将推出一款用于分享照片的新应用,名为TikTokNotes。TikTok随后证实了这一消息,称公司正在开发一款照片分享的专属空间,但尚未最终确定TikTokNotes的设计和发布时间。TikTokNotes是一个用于分享照片的App。按计划,其初始内容源自TikTok上已发布的图文帖子。不过,TikTok用户也可以打开拒绝按钮,选择不让这些照片共享至新应用。上个月曾有消息指出,这款应用原本被命名为TikTokPhotos。因发帖格式和内容均集中于照片形式,TikTokNotes也被视为Instagram的竞争对手。但相较于Instagram富于包装感的社区风格,TikTok主打非批判性、即拍即发的社交调性或将帮助Notes吸引更多群体。TikTok将推AI虚拟主播4月11日,有报道称TikTok正在考虑利用AI为广告商生成虚拟主播,这些主播将在短视频中担任主角并介绍广告上的产品,甚至可能与真人主播竞争广告交易。TikTok正在开发的功能将根据广告商提供的提示生成视频广告脚本,以及生成在视频中执行脚本的虚拟人物。该功能不仅面向广告商开放,TikTok商店中的商家也可以使用该功能来推广商品。目前,这项功能已经测试数月,但离正式推出还有一段距离。知情人士称,根据目前测试结果看,这些AI生成视频产生的交易数量远远少于人类主播创造的交易数量。不过,该功能仍在开发过程中,最终版本可能会发生变化。AIPin发售,售价699美元4月11日,初创公司Humane宣布其首款AI硬件产品AIPin正式发售,起售价为699美元。除了购买基础硬件外,用户还需要订阅24美元/月的服务,才能使用设备基础功能。「新皮层」曾报道,去年11月,Humane宣布推出AIPin。这款设备的主要特点是没有屏幕,交互方式包括语音、敲击等。比如用户长按即可与语音助手AIMic对话,完成查询信息、翻译语言或播放音乐等操作。目前,Humane已经完成2.3亿美元融资,OpenAICEOSamAltman持有该公司最大的外部股份客服中心ai虚拟数字人采购,数字虚拟人技术。除了AIPin,Humane后续还计划推出其他AI硬件产品。今年1月,初创公司Rabbit也推出了一款AI语音助手硬件产品R1,支持对话实现查询、打车、购物等操作。这款产品在CES上亮相后,5天内就卖出了超过5万台。不过该产品自推出以来面临不少争议,最大争议是其提供的功能通过App就能解决,不需要为此单独设计和购买一款硬件。Vals.AI要做大模型评测生意4月11日,Vals.ai发布对多个大模型的第三方行业评测。每有新的大语言模型发布,其开发者都声称他们的模型表现与GPT-4相当或更优,但测试结果缺乏独立性。随着越来越多公司考虑是否将AI用于特定任务,市场对「无偏见的测试」需求更加强烈。PearVC合伙人ArashRakhteh称,企业需要更多的「细微差别」来了解特定人工智能模型是否「表现更好」或「能够以更低的成本处理任务」。各大模型在税务、法律和金融领域的表现评测报告已在Vals.ai官网发布。数据显示,不同模型的性能可能因行业而异。例如,Anthropic的Claude3Opus和OpenAI的GPT-4在法律推理任务上的准确率皆为77%左右,远高于它们在税务问题上的表现。人才与资金篇微软在伦敦新设AI中心4月8日,微软宣布,新组建的AI机构MicrosoftAI计划在伦敦设立AI中心,由Inflection、DeepMind前AI科学家兼工程师JordanHoffmann领导。后续,MicrosoftAI伦敦中心将与微软旗下AI团队、OpenAI协作开发大语言模型及其支持性基础设施。微软也将开始在伦敦为新的AI中心招聘人才。JordanHoffmann不久前才随着微软「雇用式收购」Inflection而加入微软。TheInformation提供的最新交易细节显示,微软CEO纳德拉是3月19日在一家凯悦酒店与Inflection所有员工面谈的,那场面谈后,Inflection三位联合创始人中的两位和70名员工中的60位都加入了微软,剩下10位员工只是留下来维护Inflection面向既有企业客户的toB服务。xAI寻求以180亿美元估值融资30亿美元4月5日消息称,马斯克的人工智能公司xAI正在进行新一轮融资,融资金额30亿美元,融资完成后公司估值将达到180亿美元,融资条款尚未最终确定。风投公司Gigafund和投资人SteveJurvetson正考虑参与这轮融资。Gigafund和SteveJurvetson都与马斯克有很深的渊源,Gigafund的创始人LukeNosek曾是PayPal的联合创始人之一,SteveJurvetson是特斯拉前董事会成员、SpaceX现董事会成员。此前1月,就有外媒报道称xAI正在以200亿美元的估值筹集60亿美元资金,当时马斯克公开否认该消息。面壁智能完成数亿元融资4月11日,AI初创公司面壁智能宣布完成新一轮数亿元融资,春华创投、华为哈勃领投,北京市人工智能产业投资基金等跟投,知乎作为战略股东跟投。面壁智能由清华计算机系长聘副教授刘知远于2022年8月创立,团队核心成员来自清华大学自然语言处理实验室。2023年4月,面壁智能获得知乎领投的数千万元天使轮融资,智谱AI跟投。6月,知乎合伙人、CTO李大海出任面壁智能CEO。举报/反馈

ai数字人入侵直播间虚拟主播,虚拟主播人工智能插图1

读了文章ai数字人入侵直播间虚拟主播,虚拟主播人工智能有什么相关的感受或者感悟没,都可以联系我们叙说。

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注

本站所有资源版权均属于原作者所有,这里所提供资源均只能用于参考学习用,请勿直接商用。若由于商用引起版权纠纷,一切责任均由使用者承担。更多说明请参考 VIP介绍。

最常见的情况是下载不完整: 可对比下载完压缩包的与网盘上的容量,若小于网盘提示的容量则是这个原因。这是浏览器下载的bug,建议用百度网盘软件或迅雷下载。 若排除这种情况,可在对应资源底部留言,或联络我们。

对于会员专享、整站源码、程序插件、网站模板、网页模版等类型的素材,文章内用于介绍的图片通常并不包含在对应可供下载素材包内。这些相关商业图片需另外购买,且本站不负责(也没有办法)找到出处。 同样地一些字体文件也是这种情况,但部分素材会在素材包内有一份字体下载链接清单。

如果您已经成功付款但是网站没有弹出成功提示,请联系站长提供付款信息为您处理

源码素材属于虚拟商品,具有可复制性,可传播性,一旦授予,不接受任何形式的退款、换货要求。请您在购买获取之前确认好 是您所需要的资源