打字就能拍短视频，AI创企Runway旗下文字生成视频模型Gen-2开启免费试用

一起来回顾上周AIGC领域的热门新闻：
6月5日：天眼查App显示，华为技术有限公司还于近期申请注册了两枚“HUAWEI NETGPT”商标，国际分类为科学仪器、网站服务，当前商标状态为申请中。此外，未防被抢注，华为已成功注册多枚“盘古”“PANGU”商标。

6月5日：语音识别人工智能公司Assembly AI近日推出新模型LeMUR （Leveraging Large Language Models to Understand Recognized Speech 利用大型语言模型来理解识别的语音）。就像ChatGPT处理几十页的PDF文本一样，LeMUR 可以将长达10小时的录音进行转录、处理，然后帮用户总结语音中的核心内容，并回答用户输入的问题。

6月5日：香港科技大学（广州）将面向全校教职工及学生上线开放GPT服务，包括GPT-4、ChatGPT，服务的区域为香港科技大学(广州)校园内，仅限校园内网络接入。

6月5日：目前作业帮正在内测基于中国市场的教育大模型，包含多学科解题、中英文作文批改、多语言对话方向等多个教育应用场景，涉及工具类App、智能硬件、图书等业务。据内部人士透露，教育场景中综合能力表现超出预期水平。

6月5日：谷歌发布《生成式AI学习路径 (Generative AI learning path)》教程，是专为初学者设计的免费学习路径，一共包含10门独立课程，帮助初学者理解大型语言模型的基础知识，以及如何在谷歌云上创建和部署生成式AI解决方案。

6月5日：吴恩达最新开课指出ChatGPT不会反转单词。比如让它反转下lollipop这个词，输出是pilollol，完全混乱。

6月5日：美国医疗健康初创公司Carbon Health推出基于GPT 4.0模型的AI工具，可以根据医生和患者之间的对话自动生成医疗记录。如果患者同意录制和转录他们的对话，则录音将被上传到亚马逊的AWS Transcribe Medical云服务，由语音转换为文本，该工具在四分钟内就能生成咨询摘要。

6月5日：因美纳（Illumina）宣布，推出全新AI算法PrimateAI-3D，能高度准确地预测患者的致病基因突变。

6月6日：苹果宣布iOS 17系统键盘自动纠正迎来全面升级，新增 transformer 语言模型。这是一个用于文字预测的先进设备端机器学习语言模型，能够随着用户每次打字不断改进体验与准确度。iOS 17键盘的另一个核心功能是听写，通过新型Transformer语音识别模型，利用神经网络引擎让听写更准确。

6月6日：工具类垂直领域企业Xmind宣布已成功收购AI产品ChatMind系列软件。ChatMind是一个利用 AI 自动生成思维导图的在线工具，只需要输入问题、文章、数据就可以了。并且对于问题，它还能自己获取答案，可导出图片与 Markdown 文档两种格式。通过此次收购，Xmind将进一步强化其产品的AI特性。

6月6日：百度智能云推出Comate代码助手，并正式开放邀测。借助文心大模型的理解、推理能力，Comate 可实现代码的快速补齐、自然语言推荐代码、自动查找代码错误，全面提升开发者研发效率。未来，开发者可以通过插件等形式，在主流开发软件中使用 Comate 代码助手。

6月6日：中央气象台运用台风涡旋识别、智能定强、快速增强判别等技术精准“捕风”——基于人工智能的台风监测和预报系统初步建成。

6月7日：美国最大在线旅游公司Priceline将与谷歌合作，在今年夏天推出一个聊天机器人，该机器人由谷歌云的Generative AI App Builder构建，该机器人可以帮助客户计划旅行，并且拥有直接在聊天对话中直接预订旅行的能力。

6月8日：Google DeepMind推出的全新AI系统AlphaDev，是一种基于深度强化学习的系统，它可以在没有人类代码示例的情况下，自主发现新的和改进的算法。在最近发表在《自然》杂志上的一篇论文中，DeepMind展示了AlphaDev的惊人能力。与 C++库中的算法相比，AlphaDev 发现了一种比最好的算法快70%的方法，用于对五个数据进行排序。

6月8日：谷歌发布博客文章，介绍了其AI聊天机器人Bard通过一种称为“隐式代码执行”的新技术，可帮助自己检测计算提示并在后台运行代码。因此，它可以更准确地响应数学任务、编码问题和字符串操作提示。

6月8日：微软发布博客文章，宣布首次将GPT技术引入为美国政府机构提供云解决方案的Azure Government。微软面向政府客户开发了一种新的架构，使得政府机构能够从Azure government安全地访问商业环境中的大型语言模型，访问是通过REST API，Python SDK或Azure AI Studio进行的，所有这些都不会将政府数据暴露给公共互联网。

6月8日：达摩院的研究人员提出了 Video-LLaMA，一个具有综合视听能力大模型。Video-LLaMA 能够感知和理解视频中的视频和音频信号，并能理解用户输入的指令，完成一系列基于音视频的复杂任务，例如音/视频描述，写作，问答等。目前论文，代码，交互 demo 都已开放。

6月8日：《瞬息全宇宙》幕后技术公司Runway的AI文本转视频工具Gen-2从今天可免费使用。输入文字和图像作为提示词，Gen-2就能直接生成视频。

6月8日：软件开发平台GitLab推出新的GitLab 16平台，这是一个升级和全面的人工智能驱动的DevSecOps解决方案。

6月8日：3D软件厂商Tafi发布了通过文本可直接生成3D角色模型的AI平台。目前该平台处于申请测试阶段。

6月8日：近期一张泄露的屏幕截图显示Meta旗下社交应用Instagram正在测试一款可以“回答问题”和“提供建议”的聊天机器人，用户可以从30种性格中进行选择。

6月9日：近日有消息称，字节跳动正内测一款 AI 对话类产品，其代号暂时为“Grace”，目前已处于“测试完善”阶段。

6月9日：法国著名连锁超市家乐福在官网宣布，通过OpenAI的ChatGPT、GPT-4打造了一款智能购物助手Hopla，Hopla是一个聊天机器人，目前已经集成到了购物网站carrefour.fr中，目前已经提供使用。

6月10日：三星电子已于本月初正式开启了大语言模型（LLM）的开发工作。该项目由三星研究院主导，动员了所有相关的人力和资源，以7月末完成初期开发为目标，该项目将供三星内部使用。

我们在AIGC/Copilot讨论群，分享最新的技术进展、科技资讯和交流经验。如果你想第一时间用上copilot或是对AI领域感兴趣，欢迎加入我们的群聊！

AIGC/Copilot 讨论群

由上海东桓领导的加速运营效率中心 CAOE (Center for accelerating operational efficiency) 开发和应用先进的AIGC工具和技术，为客户提供企业级AIGC场景应用的决策，规划，落地。