AI视野:图文混合创作大模型浦语灵笔发布;微软GitHub Copilot每个用户倒赔20美元;AI天才杨植麟交卷大模型产品Kimi Chat;ChatGPT 移动应用9月收入创纪录
🤖📈💻💡大模型动态
AI天才杨植麟交卷大模型产品KimiChat支持20万字长文本
清华AI杨植麟创业公司MoonshotAI发布KimiChat,支持20万字长文本,解决大模型上下文窗口长度问题,旨在打造C端SuperApp。目前Claude支持最大长文本为100k(约8万字),而GPT-4则是32k(约2.5万字)。20万字,分别是它们的2.5倍和8倍。
体验地址:moonshot.cn
🚀【AiBase提要】:
1️⃣清华AI杨植麟创业公司发布KimiChat,千亿参数大模型支持20万字长文本,创下全球最长记录。
2️⃣MoonshotAI解决大模型上下文窗口长度问题,不依赖滑动窗口等捷径方案,着力创新网络结构和工程优化。
3️⃣公司目标是打造C端SuperApp,预计明年发布多模态产品,利用无损压缩实现高程度智能。
上海AI实验室开源图文混合创作大模型浦语灵笔
上海人工智能实验室(上海AI实验室)近日推出了首个图文混合创作大模型书生·浦语灵笔(InternLM-XComposer),该模型能够根据用户提供的主题或图片,自动创作出图文并茂的文章,为大模型落地应用提供更多可能。
项目地址:https://github.com/InternLM/InternLM-XComposer
【AiBase提要】
浦语灵笔是基于书生·浦语大语言模型的多模态创作模型,能够接受视觉和语言输入,生成图文并茂的文章。
浦语灵笔具有强大的多模态理解能力,能够进行流利的中英文图文对话,准确识别图像内容,尤其是中国文化相关的知识。
浦语灵笔已开源其中的智能创作和对话及多任务预训练版本,并提供免费商用,支持多种类型文章的图文生成。
亚马逊机器学习团队推出 Mistral7B 基础模型,支持8000个token上下文长度
亚马逊机器学习团队近日宣布推出 Mistral7B 基础模型,用户可以一键部署该模型进行推理。Mistral7B 是参数规模达70亿的英文文本和代码生成基础模型,采用 transformer架构,可实现低延迟高吞吐量推理,支持长达8000个 token 的上下文长度。
体验网址:https://aws.amazon.com/cn/sagemaker/jumpstart/
【AiBase提要:】
Mistral7B是参数达70亿的英文NLP基础模型,支持多种下游任务。
Mistral7B采用transformer架构,可实现低延迟高吞吐量的推理。
用户可以通过亚马逊SageMaker JumpStart一键部署使用Mistral7B。
挑战GPT-4V!清华唐杰&智谱开源国产多模态模型CogVLM-17B
清华大学和智谱AI合作开发的CogVLM-17B多模态模型在多个基准测试上取得SOTA性能。该模型实现了深度融合,提高了视觉语言模型的性能,支持目标检测和文字识别等功能。
【AiBase提要】
该模型可以识别图像中的对象,并且能够分辨完整可见和部分可见的物体。
CogVLM-17B 采用了独特的深度融合方法,通过四个关键组件实现了图像特征和文本特征的深度对齐。
该模型在多个领域超越了谷歌的模型,被称为 “14边形战士”,展现了出色的多模态处理能力。
Riiid AI模型Sheep-duck-llama-2在HuggingFace排名第一
近日,AI教育解决方案领导者Riiid宣布,其最新生成式AI模型在知名机器学习模型平台HuggingFace上获得第一名。
【AiBase提要】
Riiid最新生成式AI模型在HuggingFace排名第一
模型Sheep-duck-llama-2在10月提交,获得74.07分
该模型通过调优取得进步,验证了瑞德在AI技术上的领先地位
📰🤖📢AI新鲜事
搞大模型巨亏!微软GitHub Copilot每月收10刀,倒赔20
微软GitHub Copilot生成式AI服务于2022年6月推出,根据报道自推出以来微软在该服务上亏损严重,今年年初前几个月每位用户平均亏损超过20美元,某些用户给微软造成的亏损每月高达80美元,微软正在寻找更便宜运行AI服务的方法。
【AiBase提要:】
😔自推出以来GitHub Copilot一直亏损严重,前几个月每用户平均亏损超过20美元,个别用户亏损高达每月80美元。
🤔微软目前正寻找更便宜运行AI服务的方法,可能自制AI芯片而不是向英伟达购买。
💡11月1日微软将为企业用户推出Microsoft365Copilot,定价每月每用户30美元。
Facebook新模型通过脑电波解码语音,给失语症患者带来曙光
最近,Facebook AI研究院(FAIR)在Nature上发表重磅研究,开发出一种名为BrainMagick的大模型,可以通过分析EEG脑电图和MEG脑磁图获取的非侵入性脑电活动,解码出人脑想要表达的语音内容。在测试数据集上,该模型从3秒的MEG记录中,可以在上千个选项中准确识别语音片段,Top-10准确率高达72.5%。
【AiBase提要】
1. Facebook Research开发BrainMagick模型,通过EEG和MEG记录的脑电活动,解码出匹配的语音内容。
2. 该模型在MEG记录中,语音片段Top-10准确率达72.5%,Top-1准确率达41%,支持解码未见过的单词。
3. 为语言功能障碍的失语症患者提供非侵入性的沟通希望,不需要接受脑手术的风险。
陶哲轩利用GPT-4辅助证明不等式定理
著名数学家陶哲轩最近在数学领域借助GPT-4等AI工具研究数学问题,他的成果即将上传至arXiv。陶哲轩还尝试探索Lean4交互式证明系统,并在自然数游戏中使用GPT-4获得有用答复,备受关注。这一尝试引发了对AI是否能超越人类证明能力的讨论。
【AiBase提要】
1. 著名数学家陶哲轩近期借助GPT-4等AI工具研究数学问题,将成果上传至arXiv。
2. 他探索了Lean4交互式证明系统,希望实现形式化证明。
3. 陶哲轩在自然数游戏中使用GPT-4取得有用答复。
4. 他的尝试备受关注,引发对AI超越人类证明能力的猜测。
三星One UI6.1和Galaxy S24系列将带来大量AI功能
据媒体报道,三星即将推出的One UI6.1系统更新和Galaxy S24系列手机,将会带来许多新的由人工智能驱动的功能。三星此次AI更新被称为是其历史上最重要的一次,可能还会推出一个全新的、功能更强大的AI语音助手。鉴于三星最近在生成式AI方面的讨论,Galaxy S24系列很有可能会看到多个生成式AI功能,三星甚至可能会将Galaxy S24定位为一款AI手机。
【AiBase提要】
1. 三星One UI6.1更新将带来许多新的AI驱动功能,是三星历史上最重要的AI更新。
2. 三星可能会推出一个功能更强大的新AI语音助手,比Bixby更强大。
3. Galaxy S24可能会看到多个生成式AI功能,三星可能将其定位为一款AI手机。
网友用AnimateDiff插件成动画短片春夏秋冬场景切换自如
社交平台用户“MachineDelusions”分享了一段令人惊叹的视频,通过使用AnimateDiff视频生成器,她在同一画面中切换了四个季节的景象。这段视频由静态图像与运动力学结合的运动建模模块生成,引起了网友们的广泛关注。
【AiBase提要】
MachineDelusions使用AnimateDiff插件生成四季切换视频引起关注
AnimateDiff允许将文本转化为动画无需调整
生成视频流畅自然推动AI生成动画创作热潮
西红柿被渲染20次成美少女AI魔改原图笔记获赞1.3万
一些平平无奇的AI绘画已经无法吸引网友们的关注,猎奇的AI玩法更能吸引点击和互动,网友猜测AI将原图变成何种效果增加了AI绘图的互动性和趣味性。
【AiBase提要】
👍小红书博主发布笔记“西红柿被AI爆冲20次”,从简单西红柿变成鬼怪、美少女,获得1.3万赞。
👍AI“渲染xx次”玩法利用两级反转吸引关注,增加互动性。
👍网友猜测AI效果增加趣味性,优化平淡AI绘画内容。
ChatGPT 移动应用9月收入创纪录,达458万美元、但增长正在放缓
ChatGPT 的移动应用在9月创下收入和下载量新高,但收入增速出现放缓迹象。ChatGPT 在移动端表现强劲,但与竞争对手相比增长趋缓,移动收入主要来源于 iOS 版 App 和美国市场。
【AiBase提要:】
😆 ChatGPT9月移动端收入达458万美元创新高,但较前两个月收入增速放缓至20%
📈 ChatGPT iOS版App Store收入占比超过60%,美国市场贡献收入主要部分
🤔 AI竞品Ask AI凭借广告投入实现收入655万美元,高于ChatGPT
日本计划年底前制定国际人工智能法规
日本首相岸田文雄在联合国互联网治理论坛上宣布,G7领导人计划在圣诞节前制定国际人工智能法规,以应对AI技术的快速发展,称G7国家将采用“广岛AI进程”来协调各方行动。
【AiBase提要:】
🌟G7成员国将共同制定国际AI法规指导原则和行为准则。
🌟岸田首相呼吁广泛利益相关方参与推广可靠AI信息传播。
🌟日本提出经济计划支持AI技术发展,以提升全球竞争力。
《洛基》第二季宣传海报遭争议 涉嫌使用生成式AI
近日,Disney的《洛基》i第二季宣传海报引发了一场轩然争议,原因是有人声称该海报部分使用了生成AI技术。
【AiBase提要】
🤔 Disney的《洛基》第二季宣传海报被指控使用生成AI制作背景图案,引发创意社区担忧。
😡 设计师质疑背景图案来源的Shutterstock平台未能有效执行内容审查规则。
🧐 Disney面临是否过度使用AI创作宣传内容的质疑,但尚未回应相关询问。
迪士尼玩起强化学习 开发带有情感的新型机器人
迪士尼研究所在国际机器人大会上展示了一款可表达情感的新型四肢机器人。该机器人头部四自由度、腿部五自由度的设计,使其能够在行走中保持动态平衡。通过使用强化学习系统和动画师设计的情感动作,机器人能够以情感方式运动。
【AiBase提要】
迪士尼研究所推出一款可表达情感的新型四肢机器人,在国际机器人大会上首次亮相。
该机器人头部四自由度,腿部五自由度,可保持动态平衡和表达情感,训练过程中使用了强化学习系统。
动画师参与设计机器人动作,强化学习流程结合动画设计和物理约束,大大缩短机器人开发时间。
谷歌云AI医疗搜索工具Vertex AI Search正式上线
据外媒报道,谷歌云公司近日正式推出面向医疗保健领域的人工智能搜索工具“Vertex AI Search”。该工具通过应用搜索技术、医疗技术和研究能力,可帮助医生从不同类型的医疗记录中快速提取准确的临床信息,从而提高工作效率。
【AiBase提要】
1. 谷歌云推出面向医疗领域的AI搜索工具Vertex AI Search。
2. 新工具可帮医生从不同医疗记录快速提取准确信息。
3. 实现方式是将AI与医疗技术相结合,测试结果表明可显著提高医生工作效率
🤖📱💼AI应用
Meta开源数字水印Stable Signature,极大增强生成式AI安全
Meta在官网宣布,开源数字水印产品Stable Signature,据悉,Stable Signature是由Meta和INRIA(法国国家信息与自动化研究所)联合开发而成,可将数字水印直接嵌入到AI自动生成的图片中,防止其非法用途。
开源地址:https://github.com/facebookresearch/stable_signature
论文地址:https://arxiv.org/abs/2303.15435
【AiBase提要】
1. Stable Signature可将数字水印嵌入AI生成图片,用于追溯图片来源。
2. 数字水印技术可减少将人工图片误判为AI生成的概率。
3. 数字水印可用于识别同一AI模型不同版本生成的图片。
免费在线AI图片编辑工具Fotor 提供AI扩图、AI换脸等功能
Fotor是一款免费的在线AI图片编辑工具包,提供丰富的智能编辑功能。Fotor最新推出的全套AI工具包括AI文字生图、AI以图生图、AI扩图、AI背景创作、AI换脸、AI编辑、智能消除和人像编辑等功能。
体验地址:https://www.fotor.com/cn/
【AiBase提要】
Fotor最新推出的免费在线AI图片编辑工具包包括多种功能
用户可以轻松上传照片,AI将自动推荐适合的功能,提高了图片和视频编辑的效率。
这一工具为专业设计师和普通用户提供了一个功能强大且易于使用的在线AI图片编辑解决方案。
👨💻💡🎯聚焦开发者
突破性文本生成视频方法LVD,利用LLM创建动态场景布局
一支研究团队引入了名为LLM-Grounded Video Diffusion(LVD)的新方法,以解决文本生成视频的挑战。LVD利用大型语言模型(LLMs)创建动态场景布局,显著优于基本视频扩散模型,为内容创作和视频生成开辟新可能性。
论文网址:https://arxiv.org/abs/2309.17444
AiBase提要:
🌟 LVD方法解决文本生成视频难题: LVD方法应对文本生成视频的挑战,以LLMs为基础,创建动态场景布局,提高视频质量。
🌟 LLMs出人意料的能力: 研究团队发现LLMs不仅能捕捉空间关系,还能捕捉复杂的时空动态,提高文本生成视频的准确性。
🌟 LVD优于基本模型: LVD的结果显著优于基本视频扩散模型,能够生成符合文本提示的视频,为多种应用带来新可能性。