20240426 每日AI必读资讯
时间:2024-04-28 07:30:39 来源:网络cs 作者:往北 栏目:卖家故事 阅读:
🔊 OpenVoice V2版本发布
- 原生支持英语、西班牙语、法语、中文、日语和韩语。
- 音频质量大幅提升。
- 能轻松克隆任何声音,用多种语言说话,并可控制情感口音。
- 能对声音风格的精细控制,包括情感、口音、节奏、停顿和语调,同时能够复制参考发言者的音色。
网站:Open Voice
GitHub: http:// github.com/myshell-ai/OpenVoice
技术报告:https://arxiv.org/pdf/2312.01479.pdf
在线演示: OpenVoice | Lepton AI Playground
创建自己的语音机器人: http://myshell.ai
🔗 https://blink.csdn.net/details/1687888
🎭DeepFacelive: 可以在直播过程和视频通话时进行实时换脸的工具
- 建立在 DeepFaceLab 的基础上,后者为当前领先的面部交换框架,能够产生接近电影质量的面部合成效果。
- 用户可以在视频通话中实时更换自己的面部,使用来自网络摄像头的实时视频或预录视频。
- DeepFaceLive应用中还包括一个面部动画模块,用户可以控制静态面部图片,通过视频或相机捕捉的自己的面部来操作这些图片。
🔗GitHub:https://github.com/iperov/DeepFaceLive…
🔗软件下载:https://deepfakevfx.com/downloads/deepfacelive/…
🔗 https://blink.csdn.net/details/1687876
👗超真实的虚拟试衣软件IDM-VTON 连衣服的褶子都那么真实
- 高度真实感: IDM-VTON生成的试衣图像细节精细,为用户带来接近现实的试衣体验。
- 复杂背景处理: 技术能在各种场景中准确展示衣物的试穿效果,保持图像高质量。
- 一致性保持: 在不同人物模型上展示同一件服装时,保持服装细节的一致性,确保呈现效果一致。
🔗项目地址:https://idm-vton.github.io/
🔗 https://blink.csdn.net/details/1687877
🔍 HiDiffusion:大幅提升扩散模型的图像生成质速度提升6倍
- HiDiffusion技术能显著提升SD生成图像的分辨率和生成速度,允许图像分辨率高达4096×4096,生成速度提高1.5至6倍。
- HiDiffusion包含认知分辨率U-Net模块和修改版本升降窗多头自注意力机制,有效避免对象重复现象,减少计算量。
- 通过应用HiDiffusion于预训练的扩散模型,能将图像生成的分辨率提高至4096×4096,同时提升生成速度1.5至6倍。
🔗项目地址:https://hidiffusion.github.io
🔗 https://blink.csdn.net/details/1687878
🎵阿里对口型项目EMO开启内测 可将照片转为唱歌视频
- 简便操作和低成本:用户只需提供照片和语音模型即可定制数字人像,与其他产品相比具有免费高效的优势。
- 广泛适用性:不仅限于写实人像,还能生成3D模型和二次元漫画风格视频,满足不同用户需求。
- 自然表达:EMO模型首次提出weak condition设计,生成表情丰富、表现力强的人脸,保持音频特征与图像像素的一致性。
🔗内测申请地址:https://www.wjx.top/vm/exOVbr1.aspx#
🌐比Gemini Pro1.5强!可解读视频的多模态模型Pegasus-1公测
- Pegasus-1在视频理解领域取得新突破,比Gemini Pro1.5强。
- 数据优化驱动模型表现,提供强大基础视频理解能力。
- 在视频问答、对话和摘要等任务中胜过现有模型,展现出卓越性能。
🔗API文档:https://docs.twelvelabs.io/docs/generate-text-from-video
🔗 Introducing Video-To-Text and Pegasus-1 (80B)
🤖Nvidia CEO黄仁勋亲自向OpenAI交付第一台DGX H200
- Nvidia DGX H200作为最新、最先进的AI处理器,在人工智能技术领域迈出重要一步。
- OpenAI通过获得DGX H200将提升研究能力,尤其是在GPT-5模型的发展上。
- DGX H200的推出将赋予研究人员和开发人员处理更雄心勃勃项目的能力,可能在药物发现、气候建模和自动驾驶技术等领域取得重大突破。
🎬 AI电影制作平台Morph Studio正式向候补用户开放访问权限
- Morph Studio正式向候补用户开放访问权限,新增视频生成角色一致性和配音生成功能。
- 用户可通过引入参考图像精细制作视频,使用音效模型丰富音频效果。
- Morph Studio一体化制作流程高效连贯,建立活跃用户社区是竞争优势。
🔗产品入口:Morph Studio
🔗点此加入候补名单:https://app.morphstudio.com/waitlist
阅读本书更多章节>>>>本文链接:https://www.kjpai.cn/gushi/2024-04-28/163090.html,文章来源:网络cs,作者:往北,版权归作者所有,如需转载请注明来源和作者,否则将追究法律责任!
下一篇:返回列表