跨境派

跨境派

跨境派,专注跨境行业新闻资讯、跨境电商知识分享!

当前位置:首页 > 卖家故事 > suno有了新对手udio炸裂音乐圈;又一个开源AI Devin 程序员;完全开源轻量级的文本到语音可生成特定说话者的风格

suno有了新对手udio炸裂音乐圈;又一个开源AI Devin 程序员;完全开源轻量级的文本到语音可生成特定说话者的风格

时间:2024-04-26 11:40:25 来源:网络cs 作者:焦糖 栏目:卖家故事 阅读:

标签: 文本  语音  风格  对手  音乐  程序 
阅读本书更多章节>>>>

✨ 1: udio

由音乐和科技界重量级人物支持的强大 AI 音乐生成器,被称为音乐界的另一个 ChatGPT。

在这里插入图片描述

Udio 由前 Google DeepMind的研究院和工程师创立,得到了a16z的支持,总部在伦敦和纽约。

目前是一个免费的V1测试版产品,每个人每个月可以生成最多 1200 首歌曲。

Udio是一个强大的AI音乐生成器,它背后有音乐和技术领域的重量级支持。它可以根据文本提示生成完整、高保真度的歌曲,特别是在真实听起来像人声的方面表现出色。Udio是由一群前谷歌DeepMind的员工创立的,迅速吸引了技术和音乐界大佬的投资,包括a16z(即Andreesen Horowitz)和Instagram联合创始人兼CTO迈克·克里格尔,以及音乐界的名人如Common、制作人Tay Keith等。

地址:https://www.udio.com/

✨ 2: Akuma Ai

能够实时通过操作动作骨骼生成动漫艺术图像的网站

在这里插入图片描述

Akuma AI是一款免费并且能够实时操作的AI动漫艺术生成器,旨在帮助用户快速生成不同动作的动漫艺术图像。

Akuma AI是一个功能强大且易于上手的AI动漫艺术生成器,适用于广泛的应用场景,从个人兴趣到专业创作,都能提供实时、高效的动漫图像生成服务。

地址:https://heehel.com/aigc/akuma-ai.html

✨ 3: AutoCodeRover

又一个开源AI Devin 程序员

在这里插入图片描述

AutoCodeRover 是一个用来解决 GitHub 问题(比如修复漏洞和增加功能)的全自动程序改进工具。它通过结合大型语言模型(LLM)和分析调试能力,优先考虑修补位置以生成修补方案。这个工具在 SWE-bench lite 这个包含了 300 个真实世界 GitHub 问题的平台上,大约解决了 22% 的问题,这比现有的 AI 软件工程师的解决效率要高。

地址:https://github.com/nus-apr/auto-code-rover

✨ 4: op3 soccer

深度强化学习培养双足机器人灵活的足球技能,包括踢球、追球等

在这里插入图片描述

OP3 Soccer是一个先进的机器人足球项目,运用了深度强化学习技术(Deep Reinforcement Learning, 简称Deep RL)来教会低成本的双足行走机器人在动态环境中表现出敏捷的足球技巧。这项研究的主要目的是探索如何使机器人掌握像铲球、站立、踢球和追球等连贯动作。

地址:https://sites.google.com/view/op3-soccer

✨ 5: Parler-TTS

一个轻量级的文本到语音(TTS)模型

在这里插入图片描述

Parler-TTS是一个轻量级的文本到语音(TTS)模型,可以以特定说话者的风格(包括性别、音调、说话风格等)生成高质量、自然听起来的语音。这个模型是根据Dan Lyth和Simon King的论文《使用合成注解的高保真文本到语音的自然语言指导》而开发的,Dan Lyth属于Stability AI,Simon King来自爱丁堡大学。

与其他TTS模型不同,Parler-TTS是完全开源发布的。所有的数据集、预处理、训练代码和权重都是公开发布的,这使得社区能够在此基础上建立自己的强大TTS模型。

地址:https://github.com/huggingface/parler-tts

在这里插入图片描述



更多AI工具,参考国内AiBard123,Github-AiBard123

阅读本书更多章节>>>>

本文链接:https://www.kjpai.cn/gushi/2024-04-26/162462.html,文章来源:网络cs,作者:焦糖,版权归作者所有,如需转载请注明来源和作者,否则将追究法律责任!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。

文章评论