一起来回顾上周生成式AI领域的热门新闻:
近日,社交平台X上多名网友发现GPT-4变得“懒惰”,难以给出能正常运行的完整代码,而是告诉用户“应该怎么做”。据网友所述,似乎从11月6日GPT-4大更新起,就开始出现这种情况了。沃顿商学院教授Ethan Mollick也亲自上手测试了一下,结果似乎表明这是真的。他重复了一系列之前用代码解释器(Code Interpreter)做过的分析,GPT-4虽然知道该怎么做,但会一直提示“去完成工作”,导致原本的一个步骤变成了许多步骤,而且有些步骤很奇怪。Mollick猜测,这可能是系统负载过高的暂时问题。OpenAI技术人员Will DePue昨日回应称,刚刚将这些问题转发给团队,后续消息会及时通知。

微软广告和网络服务负责人Mikhail Parakhin近日在X上称,团队正在积极改善Copilot(Bing Chat),在解决某些问题之后,会升级到OpenAI的GPT-4 Turbo上。Parakhin称,在升级GPT-4 Turbo之后,字符长度会进一步提升,目前最高输入字数为4000字。

SuperCLUE发布了《SuperCLUE中文大模型基准测评报告,2023》,基于过去一年对国内外大模型发展趋势和综合效果的实时跟踪,通过多维度综合性测评,对国内外大模型发展现状进行观察与思考。报告显示,目前国内外大模型差距依然明显。GPT-4 Turbo以总分89.79分遥遥领先,高于国内所有大模型及国外代表性大模型。

字节在海外上线了一款名为“ChitChop”的大模型产品,开发运营公司是POLIGON,字节旗下海外社交产品Helo同样由该公司运营,目前已上线独立APP和网页版。据悉,ChitChop是一个AI助理工具,可以为用户提供多达200+的智能机器人服务,通过提供创造性灵感、提高工作效率等方式来服务用户的工作和生活。这款产品与抖音集团旗下AI产品“小悟空”类似,都是基于大语言模型创建的AI工具合集,但ChitChop使用的是OpenAI的模型。

AI视频创企Pika宣布了首个正式版本产品——视频生成平台Pika 1.0,包括一个新的AI模型,能够生成和编辑三维动画、动漫、卡通和电影等不同风格的视频,以及全新的网页版,使其更易于使用,用户可以在官网申请使用。Pika 1.0不仅能根据文字、图片或视频风格生成视频,还能对视频局部进行编辑。Pika还宣布已经筹集了5500万美元融资,包括由硅谷著名AI投资人Nat Friedman和Daniel Gross领投的种子轮,以及由光速创投(Lightspeed Venture Partners)领投的A轮融资,其他投资者包括Quora创始人Adam D’Angelo、OpenAI联创Andrej Karpathy、Hugging Face联创Clem Delangue等。Pika成立于今年4月,创始人郭文景(Demi Guo)和Chenlin Meng都是斯坦福博士。

29日,亚马逊云科技(AWS)于re:Invent大会上推出生成式AI助手Amazon Q,专门面向办公,可以根据企业客户的业务量身定制。Amazon Q为员工提供信息和建议,以简化任务、加快决策和解决问题,并帮助激发工作中的创造力和创新力。此外,AWS称Amazon Q不会使用企业客户的私有内容来训练其底层模型。目前,Amazon Q已在云呼叫中心服务Amazon Connect中全面推出,在云商业智能(BI)服务Amazon QuickSight中推出预览版,在供应链优化服务AWS Supply Chain中也即将推出。

AI独角兽Stability AI旗下的音乐生成产品Stable Audio宣布推出一系列新功能,包括支持输入音频来指导生成音乐,增加更多参数来提升创作体验,新增链接分享、视频下载功能,内置风格提示库等。

12月1日,阿里云在京举办通义千问发布会,开源通义千问720亿参数模型Qwen-72B。据介绍,Qwen-72B在10个权威基准测评创下开源模型最优成绩,性能超越开源标杆Llama 2-70B和大部分商用闭源模型,可适配企业级、科研级的高性能应用。通义千问当天还开源了18亿参数模型Qwen-1.8B和音频大模型Qwen-Audio,在业界率先实现“全尺寸、全模态”开源。

12月1日,Meta推出实时翻译系统Seamless。为了构建Seamless,Meta开发了一种用于保留语音到语音翻译中表达能力的模型SeamlessExpressive,以及一个流式翻译模型SeamlessStreaming,可以以几乎不到两秒的延迟提供最先进的结果。所有模型均基于Meta在8月发布的基础模型SeamlessM4T v2构建。据介绍,与之前在表达性语音研究方面的努力相比,SeamlessExpressive解决了韵律中某些尚未开发的方面,例如语速和节奏停顿,同时还保留了情感和风格。该模型目前在英语、西班牙语、德语、法语、意大利语和中文之间的语音到语音翻译中保留了这些元素。SeamlessStreaming支持近100种输入和输出语言的自动语音识别和语音到文本翻译,以及近100种输入语言和36种输出语言的语音到语音翻译。Meta开源了全部四种模型,以便研究人员在此基础上进一步研究。

(资讯整理自网络,本站不采编新闻)
我们在AIGC/Copilot讨论群,分享最新的技术进展、科技资讯和交流经验。如果你想第一时间用上copilot或是对AI领域感兴趣,欢迎加入我们的群聊!
AIGC/Copilot 讨论群

由上海东桓领导的加速运营效率中心 CAOE (Center for accelerating operational efficiency) 开发和应用先进的AIGC工具和技术,为客户提供企业级AIGC场景应用的决策,规划,落地。