Bark(Suno AI) 搭建及使用

时间：2024-04-12 15:50:31 来源：网络cs 作者：峨乐栏目：其他工具阅读：45

标签：使用

前言
Bark 是由Suno AI创建的基于转换器的文本到音频模型。Bark 可以生成高度逼真的多语言语音以及其他音频 - 包括音乐、背景噪音和简单的音效。该模型还可以产生非语言交流，如大笑、叹息和哭泣。

1: 环境
win10
rtx 3060TI
bark 下载地址 https://github.com/suno-ai/bark
conda 及 pytorch
可以按照 segment-anything本地部署使用

2:安装
官方安装说明
git clone https://github.com/suno-ai/bark
cd bark && pip install .
在这里插入图片描述

在这里插入图片描述

3：修改缓存目录
下载的东西太大了
HF_HOME 模型下载模型
XDG_CACHE_HOME suno torch …
在这里插入图片描述

在这里插入图片描述

3：测试
1>测试脚本
因为GPU 是 rtx 3060TI VARM 只有8G ，所以必须使用小模型
test.py

import osos.environ["CUDA_VISIBLE_DEVICES"] = "0"os.environ["SUNO_USE_SMALL_MODELS"] = "1"from bark import SAMPLE_RATE, generate_audio, preload_modelsfrom scipy.io.wavfile import write as write_wavfrom IPython.display import Audio# download and load all modelspreload_models()# generate audio from texttext_prompt = """Hello, my name is Suno. And, uh — and I like pizza. [laughs]But I also have other interests such as playing tic tac toe."""audio_array = generate_audio(text_prompt)# save audio to diskwrite_wav("bark_generation.wav", SAMPLE_RATE, audio_array)# play text in notebookAudio(audio_array, rate=SAMPLE_RATE)

2> 结果
在这里插入图片描述

4：可能遇到的问题
如果提示找不到 IPyhton 模块直接安装 pip install -U IPython
如果觉得有用，麻烦点个赞，加个收藏

本文链接：https://www.kjpai.cn/news/2024-04-12/157645.html，文章来源：网络cs，作者：峨乐，版权归作者所有，如需转载请注明来源和作者，否则将追究法律责任！

上一篇：vue前端el-input输入限制输入位数以及输入规则

下一篇：返回列表

跨境派

Bark(Suno AI) 搭建及使用

相关文章

文章评论