打字就能拍短视频,AI创企Runway旗下文字生成视频模型Gen-2开启免费试用


一起来回顾上周AIGC领域的热门新闻:
6月5日:天眼查App显示,华为技术有限公司还于近期申请注册了两枚“HUAWEI NETGPT”商标,国际分类为科学仪器、网站服务,当前商标状态为申请中。此外,未防被抢注,华为已成功注册多枚“盘古”“PANGU”商标。

6月5日:语音识别人工智能公司Assembly AI近日推出新模型LeMUR (Leveraging Large Language Models to Understand Recognized Speech 利用大型语言模型来理解识别的语音)。就像ChatGPT处理几十页的PDF文本一样,LeMUR 可以将长达10小时的录音进行转录、处理,然后帮用户总结语音中的核心内容,并回答用户输入的问题。

6月5日:香港科技大学(广州)将面向全校教职工及学生上线开放GPT服务,包括GPT-4、ChatGPT,服务的区域为香港科技大学(广州)校园内,仅限校园内网络接入。

6月5日:目前作业帮正在内测基于中国市场的教育大模型,包含多学科解题、中英文作文批改、多语言对话方向等多个教育应用场景,涉及工具类App、智能硬件、图书等业务。据内部人士透露,教育场景中综合能力表现超出预期水平。

6月5日:谷歌发布《生成式AI学习路径 (Generative AI learning path)》教程,是专为初学者设计的免费学习路径,一共包含10门独立课程,帮助初学者理解大型语言模型的基础知识,以及如何在谷歌云上创建和部署生成式AI解决方案。


6月5日:吴恩达最新开课指出ChatGPT不会反转单词。比如让它反转下lollipop这个词,输出是pilollol,完全混乱。

6月5日:美国医疗健康初创公司Carbon Health推出基于GPT 4.0模型的AI工具,可以根据医生和患者之间的对话自动生成医疗记录。如果患者同意录制和转录他们的对话,则录音将被上传到亚马逊的AWS Transcribe Medical云服务,由语音转换为文本,该工具在四分钟内就能生成咨询摘要。

6月5日:因美纳(Illumina)宣布,推出全新AI算法PrimateAI-3D,能高度准确地预测患者的致病基因突变。

6月6日:苹果宣布iOS 17系统键盘自动纠正迎来全面升级,新增 transformer 语言模型。这是一个用于文字预测的先进设备端机器学习语言模型,能够随着用户每次打字不断改进体验与准确度。iOS 17键盘的另一个核心功能是听写,通过新型Transformer语音识别模型,利用神经网络引擎让听写更准确。

6月6日:工具类垂直领域企业Xmind宣布已成功收购AI产品ChatMind系列软件。ChatMind是一个利用 AI 自动生成思维导图的在线工具,只需要输入问题、文章、数据就可以了。并且对于问题,它还能自己获取答案,可导出图片与 Markdown 文档两种格式。通过此次收购,Xmind将进一步强化其产品的AI特性。

6月6日:百度智能云推出Comate代码助手,并正式开放邀测。借助文心大模型的理解、推理能力,Comate 可实现代码的快速补齐、自然语言推荐代码、自动查找代码错误,全面提升开发者研发效率。未来,开发者可以通过插件等形式,在主流开发软件中使用 Comate 代码助手。

6月6日:中央气象台运用台风涡旋识别、智能定强、快速增强判别等技术精准“捕风”——基于人工智能的台风监测和预报系统初步建成。

6月7日:美国最大在线旅游公司Priceline将与谷歌合作,在今年夏天推出一个聊天机器人,该机器人由谷歌云的Generative AI App Builder构建,该机器人可以帮助客户计划旅行,并且拥有直接在聊天对话中直接预订旅行的能力。

6月8日:Google DeepMind推出的全新AI系统AlphaDev,是一种基于深度强化学习的系统,它可以在没有人类代码示例的情况下,自主发现新的和改进的算法。在最近发表在《自然》杂志上的一篇论文中,DeepMind展示了AlphaDev的惊人能力。与 C++库中的算法相比,AlphaDev 发现了一种比最好的算法快70%的方法,用于对五个数据进行排序。

6月8日:谷歌发布博客文章,介绍了其AI聊天机器人Bard通过一种称为“隐式代码执行”的新技术,可帮助自己检测计算提示并在后台运行代码。因此,它可以更准确地响应数学任务、编码问题和字符串操作提示。

6月8日:微软发布博客文章,宣布首次将GPT技术引入为美国政府机构提供云解决方案的Azure Government。微软面向政府客户开发了一种新的架构,使得政府机构能够从Azure government安全地访问商业环境中的大型语言模型,访问是通过REST API,Python SDK或Azure AI Studio进行的,所有这些都不会将政府数据暴露给公共互联网。

6月8日:达摩院的研究人员提出了 Video-LLaMA,一个具有综合视听能力大模型。Video-LLaMA 能够感知和理解视频中的视频和音频信号,并能理解用户输入的指令,完成一系列基于音视频的复杂任务,例如音/视频描述,写作,问答等。目前论文,代码,交互 demo 都已开放。

6月8日:《瞬息全宇宙》幕后技术公司Runway的AI文本转视频工具Gen-2从今天可免费使用。输入文字和图像作为提示词,Gen-2就能直接生成视频。

6月8日:软件开发平台GitLab推出新的GitLab 16平台,这是一个升级和全面的人工智能驱动的DevSecOps解决方案。

6月8日:3D软件厂商Tafi发布了通过文本可直接生成3D角色模型的AI平台。目前该平台处于申请测试阶段。

6月8日:近期一张泄露的屏幕截图显示Meta旗下社交应用Instagram正在测试一款可以“回答问题”和“提供建议”的聊天机器人,用户可以从30种性格中进行选择。

6月9日:近日有消息称,字节跳动正内测一款 AI 对话类产品,其代号暂时为“Grace”,目前已处于“测试完善”阶段。

6月9日:法国著名连锁超市家乐福在官网宣布,通过OpenAI的ChatGPT、GPT-4打造了一款智能购物助手Hopla,Hopla是一个聊天机器人,目前已经集成到了购物网站carrefour.fr中,目前已经提供使用。

6月10日:三星电子已于本月初正式开启了大语言模型(LLM)的开发工作。该项目由三星研究院主导,动员了所有相关的人力和资源,以7月末完成初期开发为目标,该项目将供三星内部使用。

我们在AIGC/Copilot讨论群,分享最新的技术进展、科技资讯和交流经验。如果你想第一时间用上copilot或是对AI领域感兴趣,欢迎加入我们的群聊!

AIGC/Copilot 讨论群

由上海东桓领导的加速运营效率中心 CAOE (Center for accelerating operational efficiency) 开发和应用先进的AIGC工具和技术,为客户提供企业级AIGC场景应用的决策,规划,落地。