一起学习网 一起学习网

AI日报:科大讯飞星火多模态交互大模型上线;Anthropic发布提示词优化新功能;腾讯AI智能工作台ima上线Windows版

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、科大讯飞星火多模态交互大模型上线 实现“语音、视觉、数字人交互”三合一

科大讯飞最新推出的讯飞星火多模态交互大模型标志着其从单一语音交互技术拓展到音视频流实时多模态交互的新阶段。该模型集成了语音、视觉和数字人交互功能,实现了三者的无缝结合,引入了超拟人数字人技术,提升了AI的生动性和真实感。新模型通过跨模态的语义一致性实现了情感表达更加真实连贯,支持超拟人极速交互技术,提供个性化的交互体验。多模态视觉交互使模型能全面感知背景场景、物流状态,为用户提供更丰富和精准的交互体验。

image.png

【AiBase提要:】

🌟 科大讯飞推出讯飞星火多模态交互大模型,集成语音、视觉和数字人交互功能,实现无缝结合。

🔥 引入超拟人数字人技术,数字人动作与语音内容精准匹配,提升AI的生动性和真实感。

💡 支持超拟人极速交互技术,实现语音到语音的端到端建模,提供个性化的交互体验。

详情链接:https://www.xfyun.cn/solutions/Multimodel

2、Anthropic发布提示词优化新功能

Anthropic最新推出的提示词优化新功能为开发者带来了巨大便利,提升AI应用的可靠性和效率。优化器通过先进工程技术自动完善提示词,准确率提升30%,字数准确率达100%,用户可提供反馈进一步改进。示例管理功能使开发者能结构化管理示例,简化流程。Kapa.ai已成功迁移多个AI工作流至Claude平台,称赞优化器帮助提速生产环节。

image.png

【AiBase提要:】

🔍 提示词优化新功能提升AI应用可靠性和效率

🚀 优化器自动完善提示词,准确率提升30%,字数准确率达100%

💡 示例管理功能简化示例管理流程,Kapa.ai成功迁移多个AI工作流至Claude平台

详情链接:https://www.anthropic.com/news/prompt-improver

3、大升级!ChatGPT Windows桌面版全面上线,macOS版新增与应用协作功能

OpenAI发布了重要更新,提升ChatGPT在Windows和Mac系统上的实用性。Windows桌面应用正式上线,macOS测试版本与热门编码应用深度集成,变身为实时助手。对开发者带来重大利好。

image.png

【AiBase提要:】

🚀 ChatGPT Windows桌面应用全面上线,提升用户体验。

💻 macOS新增与应用协作功能,开发者可直接分析代码获取智能建议。

📈 OpenAI计划扩展更多应用支持,助力AI工具在桌面工作中实用性提升。

详情链接:https://openai.com/chatgpt/desktop/?ref=maginative.com

4、腾讯AI智能工作台ima.copilot上线Windows版本

腾讯公司推出的ima.copilot(简称ima)Windows版,不仅具备搜索功能,还能回答问题、创作文本、生成图片,展现了腾讯在人工智能领域的技术实力和深入探索。ima特别引人注目的搜索功能整合了微信公众号文章资源,丰富了搜索结果,提高了信息获取效率和质量。ima支持处理本地文件、多语言翻译,提供个人知识库和24小时在线私人助理服务,为用户提供便捷高效的工作学习体验。

image.png

【AiBase提要:】

🔍 搜索功能整合微信公众号文章资源,丰富搜索结果,提高信息获取效率和质量。

📄 处理本地文件,自动总结内容,生成脑图,支持多语言翻译,方便用户理解和使用不同语言资料。

📚 提供个人知识库和24小时在线私人助理服务,为用户打造专属图书馆,提供便捷高效的工作学习体验。

详情链接:https://ima.qq.com/

5、一句话帮你生成应用!阿里通义上线代码模式

阿里通义实验室推出了代码模式,让用户能够通过简单的日常语言指令生成各种应用,包括小游戏、数据图表、网站和简历等。用户只需访问通义网页版,点击“代码模式”即可开始体验全新交互方式。代码模式特别为非编程用户提供便利,支持预设热门应用模板,如个人简历、2048小游戏等。基于Qwen2.5-Coder开发,提升了AI编程性能和效率。

【AiBase提要:】

👩‍💻 通义代码模式让用户通过简单指令生成各种应用,包括小游戏、数据图表等。

🌐 用户可访问通义网页版,点击“代码模式”开始体验全新交互方式。

🚀 代码模式基于Qwen2.5-Coder开发,提升了AI编程性能和效率。

6、波士顿动力Spot 机器人新技能 轻松躲避电线、梯子等障碍物!

波士顿动力公司的机器人犬 Spot 近期进行了重要的软件更新,使其在复杂环境中的行动能力大幅提升。这次更新不仅增强了 Spot 的自主导航能力,也为其在更多复杂环境中的应用奠定了基础。

image.png

【AiBase提要:】

🐶 Spot 机器人现在可以自动识别和避开电线、梯子等障碍物。

🤖 最新 的视频中出现了神秘的恐龙头机器人,激发了观众的好奇心。

📈 软件更新使 Spot 的导航能力更强,应用前景更加广阔。

7、谷歌Gemini Exp1114横空出世!首战碾压GPT-4,多项能力评测登顶引业界震动

谷歌最新推出的Gemini实验版本(Exp1114)在Chatbot Arena平台上取得了令人瞩目的成绩,超越竞品,展现出惊人实力。Gemini-Exp-1114以超出40分的优异成绩与GPT-4-latest并列第一,在数学、复杂提示和创意写作等核心领域全面登顶。业内分析认为,这次突破性进展显示出谷歌在AI领域的长期投入开始收获成果。

image.png

【AiBase提要:】

🚀 Gemini-Exp-1114在总体评分上超越GPT-4-latest并列第一,展现出极强的综合实力。

💡 Gemini-Exp-1114在数学、复杂提示和创意写作等核心领域全面登顶,表现令人印象深刻。

🔗 Gemini-Exp-1114的突破性进展显示出谷歌在AI领域的长期投入开始收获成果,引发业界讨论和关注。

8、TikTok重磅推出AI视频创作工具Symphony,赋能商业广告创作全流程

TikTok宣布全面开放Symphony Creative Studio,为广告主和内容创作者带来前所未有的创作体验,让视频制作更简单高效,无需额外费用。这标志着社交媒体平台在AI创意工具领域的竞争加剧,展现了TikTok在AI视频创作领域的技术实力和商业化进程中的决心。

【AiBase提要:】

🚀 Symphony Creative Studio集视频生成、转换和扩展功能于一体,帮助广告主和创作者突破创意到制作瓶颈,提供快速生成视频内容的功能。

👥 支持AI虚拟人物视频创作,用户可选择现成或定制虚拟形象,系统自动生成视频,广告主可进一步优化。

🎨 提供视频翻译配音、现有视频编辑等功能,根据广告主历史活动自动生成视频内容,为品牌广告主带来更高效、创意的内容制作体验。

9、AI玩《我的世界》大比拼!Claude新版本建筑水平惊艳全网

最近在《我的世界》平台上展开了一场别开生面的AI能力评测,引起了广泛关注。新旧版本的Claude3.5Sonnet在游戏中展开建筑PK,展现出明显的能力差异,新版本Sonnet3.6表现尤为亮眼。评测被戏称为唯一可靠的评测基准,得到开源社区支持并在GitHub上线。AI在游戏中建造过程不依赖视觉理解,通过文本形式提供上下文生成操作指令。

image.png

【AiBase提要:】

🌟 Sonnet3.6在创意性方面胜出,获得2000多名网友的投票支持。

🧠 AI建造过程不依赖视觉理解,通过文本形式提供上下文生成操作指令。

🔧 项目组计划将评测机制进一步完善,打造类似Lmsys竞技场的评分系统,采用Elo算法根据人类用户投票进行排名。

详情链接:https://x.com/mckaywrigley/status/1849613686098506064

10、小马智行正式启动 IPO,预计募资最高达3.78亿美元

小马智行正式启动 IPO,计划在纳斯达克上市,募资最高达3.78亿美元。多家汽车制造商参与认购,推动Robotaxi技术合作与全球布局。【AiBase提要:】

🌟 小马智行开启IPO,计划在纳斯达克上市,募资最高达3.78亿美元。

🚗 主要资金将用于自动驾驶服务的商业化及技术研发。

🤝 多家汽车制造商参与认购,推动Robotaxi技术合作与全球布局。