跨境派

跨境派

跨境派,专注跨境行业新闻资讯、跨境电商知识分享!

当前位置:首页 > 平台政策 > AI相关的实用工具分享(附带最新评分排行)

AI相关的实用工具分享(附带最新评分排行)

时间:2024-04-13 07:55:35 来源:网络cs 作者:淼淼 栏目:平台政策 阅读:

标签: 附带  评分  排行  相关  实用  工具 
阅读本书更多章节>>>>

AI实用工具大赏:赋能科研与生活,探索AI的无限可能

前言

在数字化浪潮汹涌而至的今天,人工智能(AI)已经渗透到我们生活的方方面面,无论是工作还是生活,都在悄然发生改变。AI的崛起不仅为我们带来了前所未有的便捷与高效,更在不断地拓宽我们的想象边界,让我们看到了未来的无限可能。

作为一名热衷于探索新技术的博主,我深感有责任和义务为大家梳理和分享当前AI领域的实用工具。在这篇文章中,我将带大家走进AI的奇妙世界,一起探索那些能够赋能我们工作与生活的实用工具。

从ChatGPT等闭源大语言模型,到开源大语言模型的崛起,再到GPT/LLMs应用在各个领域的广泛落地,AI技术正在以惊人的速度发展。而这些工具,正是我们踏上AI之旅的得力助手。

接下来,让我们一起开启这场AI实用工具的探索之旅吧!

在这里插入图片描述

各项能力评分

评分方法:从各个维度给大模型打分,每个维度都对应一个评测数据集,包含若干道题。 每道题依据大模型回复质量给1~5分,将评测集内所有题的得分累加并归一化为100分制,即作为最终得分。

类别大模型分类能力信息抽取能力阅读理解能力数据分析能力综合能力
商用gpt4949499.397.096.1
商用微软new-bing958394.0100.093.0
商用gpt-4-turbo(new)919094.096.092.8
商用GLM4869097.396.092.3
商用文心4.0888994.794.091.4
商用讯飞星火v3.5(new)879289.387.388.9
商用阿里qwen-max868295.391.388.7
商用月之暗面kimichat(new)928584.089.387.6
开源Qwen1.5-14B-Chat897990.790.787.3
开源Qwen-72B-Chat898092.787.387.3
开源Qwen1.5-72B-Chat898488.087.387.1
商用gpt-3.5-turbo818392.791.387.0
开源internlm2-chat-20b938086.088.086.8
开源AquilaChat2-70B-Expr(new)828492.089.386.8
开源deepseek-llm-67b-chat878186.792.086.7
商用文心一言v2.2908788.081.086.5
开源tigerbot-70b-chat-v2978480.085.086.5
开源openbuddy-deepseek-67b868984.785.086.2
商用baichuan3868390.784.786.1
商用讯飞星火v3878288.086.085.8
开源XVERSE-65B-Chat838484.089.085.0
商用谷歌bard868885.377.084.1
开源tigerbot-70b-chat-v3948584.071.083.5
开源openbuddy-llama2-70b-v10.1868486.776.083.2
开源tigerbot-13b-chat-v4858280.085.083.0
商用chatglm-turbo867590.081.083.0
开源Yi-34B-Chat888284.777.082.9
开源aquilachat2-34b778288.083.082.5
商用商汤senseChat828582.778.081.9
开源openbuddy-mixtral-7bx8-v17.1867386.082.081.8
开源internlm2-chat-7b868172.782.780.6
开源BELLE-Llama2-13B-chat-0.4M907476.079.079.8
商用字节跳动豆包797780.082.079.5
开源qwen-14b-chat847284.777.079.4
开源Baichuan2-13B-Chat838374.777.079.4
开源Baichuan2-7B-Chat887683.369.079.1
商用阿里通义千问818181.073.079.0
开源BlueLM-7B-Chat828374.072.077.8
开源openbuddy-zephyr-7b828374.072.077.8
开源openbuddy-llama-65b-v8688479.376.076.8
开源xverse-13b-chat867281.367.076.6
商用chatglm-std847176.073.076.0
商用chatglm-pro847076.073.075.8
开源Qwen1.5-7B-Chat807676.070.775.7
商用讯飞星火v1.5768176.069.075.5
开源谷歌gemma-7b-it(new)727974.076.075.3
开源openbuddy-mistral-7b-v13.1797273.376.075.1
商用360智脑867174.066.074.3
开源MiniCPM-2B-dpo(new)797774.066.074.0
开源Llama-2-70b-chat866673.369.073.6
开源Qwen-7B-Chat897274.059.073.5
商用讯飞星火v2.0727579.365.072.8
开源Baichuan-13B-Chat-v2826972.767.072.7
开源chatglm3-6b826878.760.072.2
开源Qwen1.5-4B-Chat756579.363.070.6
开源miniCPM-2B-sft(new)727277.353.368.7
开源Yi-6B-Chat737166.064.768.7
开源Linly-Chinese-LLaMA2-13B786767.357.067.3
开源ziya2-13b-chat765471.368.067.3
开源Qwen-1_8B-Chat736675.351.366.4
商用minimax686173.363.066.3
开源openbuddy-openllama-3b-v10646061.340.756.5
开源谷歌gemma-2b-it(new)566060.043.354.8
开源Qwen1.5-1.8B-Chat575852.748.053.9
开源Qwen1.5-0.5B-Chat444060.034.744.7
AI新闻动态

全部分类

ChatGPT及类似闭源大语言模型开源大语言模型GPT/LLMs 应用ChatGPT Prompts国内可使用的ChatGPT镜像站点大语言模型训练-评估平台集成了多个大语言模型的应用AI工具箱类软件AI Agent搜索引擎写作编程开发翻译工具AI聊天-口语练习图像创作语音识别-生成字幕文字转语音声音克隆语音翻译语音合成语音处理AI生成音频-音效-音乐AI视频创作学术科研OCR图像识别文字视频内容总结

评测

大语言模型评测

精选文章

chatgpt相关文章

ChatGPT及类似闭源大语言模型

名称说明链接费用
ChatGPTopenAI的chatgpt 应用示例: B站视频:这9款工具帮你榨干ChatGPT,解锁隐藏玩法 B站视频:格斗之王!AI写出来的AI竟然这么强!
可汗学院创始人Khan最新TED演讲:GPT-4作为AI学习私教,可能带来教育史上最大变革
URLGPT3.5免费。ChatPlus会员20美元/月,可以使用GPT-4,目前的上限是每3小时25条消息。
微软Copilot微软的Copilot,包含了多种AI工具和插件URL免费
ClaudeAnthropic研发的AI助手ClaudeURL免费
BardGoogle 的对话式AI工具,目前已支持中文等40多种语言URL免费
GeminiGoogle最新的大语言模型,包括Gemini Nono,Gemini Pro和Gemini Ultra。Gemini Pro已开放api和sdk使用。新闻介绍URL免费
Le ChatMistral AI 推出了为 Le Chat 的聊天助手URL免费
豆包字节跳动旗下的AI聊天软件 ;
体验测试视频:B站视频:百模大战-抖音子公司推出AI聊天机器人豆包
URL免费
月之暗面的Kimi Chat支持联网,支持上传文件(最多 50 个,每个 100 MB)接受 pdf、doc、xlsx、ppt、txt 等,文章总结能力比较强
张鹏对谈月之暗面杨植麟:大模型创业需要新的组织范式
URL免费
文心一言百度的大语言模型URL免费
通义千问阿里云的大语言模型 视频介绍: B站视频:国产AI到底行不行?测试完通义千问,我只想说两个字【我们离ChatGPT还有多远】URL免费
智谱AI名为 ChatGLM 的人工智能助手,是基于清华大学 KEG 实验室和智谱 AI 公司于 2023 年共同训练的语言模型开发URL免费
讯飞星火讯飞的大语言模型URL免费
百川大模型百川智能的大语言模型URL免费
中国国内发布的其他大模型目前国内各大企业、科研机构和高校等单位已公开的 AI 大模型至少已经达到了 188 个。2023-12-17更新,更多信息

开源大语言模型

名称说明链接费用
Llama 2Llama2是Meta AI开发的开源的大型语言模型, 它是Llama 语言模型v2版本,可免费用于研究和商业用途。
非官方Llama2在线测试地址:
1. https://labs.perplexity.ai/
2. https://huggingface.co/spaces/ysharma/Explore_llamav2_with_TGI
URL
GitHub
免费
Mixtral-8x7B法国人工智能初创公司 Mistral AI开源的一种具有开放权重的稀疏专家混合模型 (SMoE),在大多数基准测试中都优于 Llama 2 70B 和 GPT-3.5
论文地址:https://arxiv.org/pdf/2401.04088.pdf
论文主页:https://mistral.ai/news/mixtral-of-experts/
Github免费
Qwen(通义千问)阿里云研发的通义千问大模型系列
在线Demo地址:
Qwen-7B-Chat-Demo
Qwen-72B-Chat-Demo
Qwen1.5 72B 在线体验
Qwen-7B
Qwen1.5
免费
ChatGLM2-6B中英双语对话模型 ChatGLM-6B 的第二代版本GitHub免费

GPT-LLMs应用

名称说明链接费用
Poe美版知乎 Quora 构建的AI 产品,有web和客户端。目前的情况是ChatGPT、Sage、Dragonfly、Claude 机器人可以免费、无限制、实时使用。只需要一个邮箱即可注册。可以随时切换AI而对话不中断,并且对话记录是在线保存并且同步到客户端的。chatgpt-4可以每天免费使用一次 视频介绍:B站视频:神器!与chatGPT类似的新人工智能问答AI:Poe, 美国知乎Quaro最新产品,专业回答URL免费,有付费升级版
monicaAI助手,提供搜索、阅读、写作、翻译、绘画等多种任务的帮助。有独立应用和浏览器插件URL
chrome插件
免费/付费
ollama在本地环境中轻松运行和管理大型语言模型,如Llama 、Mistral、Gemma2等Github免费
openai/openai-pythonOpenAI API 的官方 Python 库,它是使用Stainless根据OpenAPI 规范生成的Github免费,需要使用OpenAPI的apikey
sashabaranov/go-openaiOpenAI API的Go语言非官方的SDK,支持ChatGPT、GPT-3、 GPT-4、DALL·E 2Github免费
langchain是一个强大的框架,旨在帮助开发人员使用语言模型构建端到端的应用程序。它提供了一套工具、组件和接口,可简化创建由大型语言模型 (LLM) 和聊天模型提供支持的应用程序的过程。LangChain 可以轻松管理与语言模型的交互,将多个组件链接在一起,并集成额外的资源,例如 API 和数据库。Github免费
ChatGPT-Next-Web一键免费部署你的跨平台私人 ChatGPT 应用, 支持 GPT3, GPT4 & Gemini Pro 模型Github免费
anything-llm开源的文档聊天机器人解决方案Github免费
screenshot-to-code插入截图并将其转换为简洁的 HTML/Tailwind/JS 代码,使用了GPT-4 Vision来生成代码,使用DALL-E 3生成图片GitHub免费,需要有GPT-4 Vision的授权
Chatbox使用ChatGPT API(OpenAI API)的桌面应用程序, 将所有的聊天信息和提示信息存储在本地,从而减少了数据丢失的风险。比网页版使用更稳定些GitHub免费,需要使用OpenAPI的apikey
ChatGPT for Google开源项目,浏览器插件,在搜索页面增加chatgpt的内容和对话框GitHub免费,需要chatgpt账号
gpt-crawler可以爬取指定网站中的内容,并生成json文件,可以直接上传到GPTs的知识库使用Github免费
ChatGPT-Shortcut开源,让生产力加倍的 ChatGPT 快捷指令,按照领域和功能分区,可对提示词进行标签筛选、关键词搜索和一键复制。GitHub免费
ChatGPT SidebarChatGPT 边栏是您在浏览任何网站时可以使用的人工智能助手。 视频介绍:B站视频:CharGPT初体验,浏览器安装人工智能侧边栏AI Sidebar扩展程序URL免费
WebChatGPT开源程序,给chatgpt扩展联网的能力 视频介绍:B站视频:可以让ChatGPT直接联网的扩展程序GitHub免费
AIPRM for ChatGPT浏览器插件,提供一系列精选ChatGPT 指令模板,甚至还能够自己创建,还可以调整AI 语气和写作风格 B站视频:集大成者!ChatGPT百宝箱,内置多种功能,所见即所得!URL免费
GPTCache⚡ GPTCache 是一个用于创建语义缓存以存储来自 LLM 查询的响应的库,类似于aigc场景中的redis。 它可用于降低依赖 LLM 服务(如ChatGPT)的成本,同时也可以有效减少服务响应时间,因为大模型推理一般都比较耗时。GitHub免费
MindMac功能丰富、隐私第一的 macOS 原生 ChatGPT 应用程序,可在一个地方使用 OpenAI, Azure OpenAI, Anthropic Claude, OpenRouter,旨在实现最大生产力。 目前有 15 种语言版本。URL免费,有付费升级版

ChatGPT Prompts

名称说明链接费用
f/awesome-chatgpt-promptsThis repo includes ChatGPT prompt curation to use ChatGPT better.GithubFree

国内可使用的ChatGPT镜像站点

名称说明链接
carrotFree ChatGPT Site List 这儿为你准备了众多免费好用的ChatGPT镜像站点,当前100+站点国内可使用ChatGPT镜像站点GitHub
awesome-free-chatgpt免费的 ChatGPT 镜像网站列表,持续更新。List of free ChatGPT mirror sites, continuously updated.GitHub

大语言模型训练-评估平台

NameDescriptionLinksFees
FastChat用于训练、服务和评估大型语言模型的开放平台。Vicuna 和 Chatbot Arena 的发布仓库。GithubFree

集成了多个大语言模型的应用

名称说明链接费用
chathub浏览器插件,在一个应用中使用不同的聊天机器人,目前支持 ChatGPT、新的 Bing Chat、Google Bard 和 Claude (via Poe),未来将集成更多机器人, 同时与多个聊天机器人聊天,方便比较它们的答案GitHub 免费,付费支持更多功能
ChatALL同时与多个大语言模型聊天的客户端(支持Windows、macOS、Linux系统),支持ChatGPT、Bing Chat、Claude、Bard、MOSS、Alpaca、HuggingChat等。需要拥有可以访问这些 AI 的帐号,或 API tokenGitHub 免费

AI工具箱类软件

名称说明链接费用
Paper2GUI一款面向普通人的 AI 桌面 APP 工具箱,免安装即开即用,已支持 40+AI 模型,内容涵盖 AI 绘画、语音合成、视频补帧、视频超分、目标检测、图片风格化、OCR 识别等领域。支持 Windows、Mac、Linux 系统。B站视频介绍:补帧超分抠图配音,这个开源AI工具箱对小白太友好了!GitHub免费

AI Agent

名称说明链接费用
Auto-GPT开源项目,使用gpt自主地实现你设定的任何目标。演示示例:爆火的自主人工智能AutoGPT,程序员表示开始真正有点担忧会失业了!GitHub免费,需要OpenAI API key
OthersideAI/self-operating-computer一个使用多模态模型(默认模型为GPT-4v)能够操作计算机的框架Github免费,需要GPT-4v
AppAgent可以操作手机应用程序的AI AgentGithub免费

搜索引擎

名称说明链接费用
New Bing只需注册一个账户,首页即可体验。更多介绍URL免费
You.com结合对话模式的搜索引擎URL免费
Perplexity.aiPerplexity.ai 是一个基于 GPT-3 的 AI 工具,类似 New Bing 的搜寻引擎、会附上参考结果URL免费

写作

名称说明链接费用
Notion AIAI辅助的笔记软件,主要包括AI创作文章、翻译、修正语法、摘要和总结等 视频示例:B站视频:Notion AI完整介绍 | 十个节省时间的神功能(ChatGPT般强大)URL有一定免费的AI试用次数,AI功能10$/每月
verse印象笔记推出的AI写作工具URL免费
写作猫集AI写作、多人协作、文本校对、改写润色、自动配图等功能为一体AI Native内容创作平台URL免费
Deep L Write英文、德文写作工具,可以及時修正写作錯誤、改写句子。URL免費版本使用有文字字数限制/有付费升级版
grammarly纠正语法、拼写、标点符号等错误的写作助手URL免费/有付费升级版
火山写作写作润色、翻译URL免费

编程开发

名称说明链接费用
GitHub CopilotGitHub 和 OpenAI 合作开发的一个代码编写助手 Github Copilot技巧和窍门 Github Copilot X的Chat功能介绍,Copilot X申请页面URL付费
通义灵码阿里云开发的代码编写助手,可根据当前代码文件及跨文件的上下文,为你生成行级/函数级代码、单元测试、代码注释等,支持 Java、Python、Go、JavaScript、TypeScript、C/C++、C# 等主流语言,同时兼容 Visual Studio Code、JetBrains IDEs 等主流编程工具URL免费
CodeGeeX2开源项目,由清华大学知识工程实验室团队研发,支持200多种主流编程语言的生成及翻译。 【项目原作解读】清华大学郑勤锴:CodeGeeX大规模多语言代码生成模型GitHub免费
Cursor使用 GPT进行协作的代码编辑器URL免费
ai-code-translator利用chatgpt将代码从一种语言翻译成另一种语言。GitHub免费,需要OpenAI API key
Amazon CodeWhisperer亚马逊开放的AI编程辅助工具,根据你的注释和现有代码,实时生成从片段到完整功能的代码建议。在各种IDE的插件中可以安装,支持15种语言, 包括 Python, Java, and JavaScript等。只需要按照流程注册一个aws builder账号即可。URL免费
Fitten CodeFitten Code是由非十大模型驱动的AI编程助手,可以自动生成代码,提升开发效率,调试Bug。还可以对话聊天,解决您编程碰到的问题。免费且支持80多种语言:Python、C++、Javascript、Typescript、Java等。并提供丰富的IDE支持,包括Visual Studio Code、JetBrains系列IDE等。URL免费
gpt-engineer一个根据指示生成代码的AI工具,能直接构建整个代码库。B站上的介绍演示视频:gpt-engineer:100%替代程序员的AI程序员来了…GitHub免费
flappy一个产品级面向所有程序员的LLM SDKGitHub免费

翻译工具

名称说明链接费用
immersive-translate开源的,沉浸式双语网页翻译扩展GitHub免费
Deep L准确即时的翻译工具,目前支持 31 种语言URL免费/付费
openai-translator基于 ChatGPT API 的划词翻译浏览器插件和跨平台桌面端应用GitHub免费,需要OpenAI API key

AI聊天-口语练习

名称说明链接费用
pi.ai一个公认很会聊天的AI,不用担心把天聊死了,并且支持文字和语音。语音输入需要借助苹果系统自带的输入。很适合练习英语对话和听力URL免费
Voice Control for ChatGPTchrome扩展程序,通过它可以与 ChatGPT 进行语音对话。可以帮助英语口语或其他语言口语练习。视频示例:B站视频:免费口语老师:如何用ChatGPT练习英语口语URL免费,需要chatgpt账号
SpeechGPT开源项目,SpeechGPT 是一个让你与 ChatGPT 聊天的网站。GitHub免费,需要OpenAI API key

图像创作

名称说明链接费用
Midjourney输入文字或图片进行图片创作。应用示例:
尝试用chatGPT+midjourney进行科研绘图,被效果震惊到了。。。
URL免費账户有一定的使用分钟限制,有付费升级版本
Stable diffusion webui开源项目,输入文字或图片进行图片创作, Stable diffusion webui是Stable diffusion的GUI是将stable diffusion实现可视化的图像用户操作界面,它本身还集成了很多其它有用的扩展脚本。
新手入门教程:https://www.bilibili.com/video/BV1Qo4y167AK/ AI风格化视频或AI真人视频的效果:1. 【AI动画】欣小萌天台蹦迪 动画版,2. 死磕真人AI动作,人物和背景的终于不闪了,你们觉得哪个更好点?3. 5分钟,教会你如何生成AI动画
GitHub免费
Photoshop 生成式AI功能在Adobe Photoshop中使用生成式AI填充功能。功能介绍: 1. B站视频:Photoshop 革命性新功能-生成式填充功能介绍
2. 巫师后期B站视频:引爆点——Photoshop核弹级更新(创成式AI填充)彻底改变图片行业!
URLPhotoshop 订阅会员可下载Beta版本试用
fireflyAdobe 的AI图片处理网站URL免费/付费
clipdropstability.ai 公司旗下的图像处理网站,包含文生图、AI扩图、图生图、去除背景等功能URL免费/ 付费
civitaiCivitai(C站)是一个用于分享AI图像创作模型资源的网站平台,拥有大量模型,已成为SD开源社区主要的模型交流场所URL免费
文心一格百度旗下的文生图和AI图片编辑应用URL免费/付费
通义万相阿里旗下的文生图和AI图片创作应用URL免费
美图的奇想智能MiracleVision美图的文生图应用URL免费
ideogram.aiAI 文字生成图片的网站。前谷歌AI绘画4位大牛创立的公司推出的产品URL免费
Skybox AI输入文字生成360度全景图片URL免费/ 付费
Microsoft Bing Image CreatorImage Creator 是使用 DALL-E 技术创作图片的工具。试用了下生成人像图片不堪入目URL免费
remove.bg一键删除图片背景URL免费/付费
简单AI搜狐旗下的文生图和图片分享网站URL免费/付费
ControlNet能够在一个text2image上训练的扩散模型进行高效finetune,并且结合特定的condition输入,得到可控的效果Github免费
StreamDiffusion实时AI互动图片生成的管道级解决方案Github免费
visual-chatgpt通过 ChatGPT 创作图片GitHub免费
DragGAN一种新的交互式图像编辑方法,允许用户通过简单地在图像上点击并拖动点来进行编辑GitHub 免费

语音识别-生成字幕

名称说明链接费用
whisper开源,OpenAPI 开源的通过大规模的弱监督进行鲁棒性的语音识别的模型GitHub免费
buzz开源,基于OpenAI的Whisper识别语音并生成字幕的开源桌面软件,使用CPU进行处理GitHub免费
WhisperDesktop开源,基于OpenAI的Whisper,Windows系统的桌面应用,使用GPU进行处理,GPU性能好的话会比CPU上更快。使用介绍:https://www.appinn.com/const-me-whisper/GitHub免费
whisperX开源,一位来自牛津大学的博士生Max Bain开源的模型,WhisperX可以按照单词对齐时间戳,基本上生成的字幕都是完整的句子。生成结果除了srt还有json文件,里面有每一行里面单词的时间戳,可以根据需要二次整理字幕。还能识别发言人,准确率还可以。使用示例: 1. 在google colab上使用whisperX生成youtube视频字幕的代码:whisperx_youtube_subtitle,可以免费使用colab的GPU,使用GPU T4,2小时40分钟的视频字幕生成6分钟左右,挺快的。whisperX免费
飞书秒记上传视频或者音频可转录为文字,并可一键导出到飞书文档。处理速度很快,一个将近 2 个多小时的视频,约 6 分钟完成。URL免费,有企业付费版
通义听悟阿里旗下的语音转录应用URL免费/付费
whisper-web在浏览器中运行ML驱动的语音识别! 使用Transformers.js构建。Demo链接GitHub免费

文字转语音

名称说明链接费用
剪映文本朗读有很多的音色选择URL免费/vip
微软Azure 文本转语音目前最好用最真实的语音工具,包括自媒体配音最常见的云希和晓晓的声音;教程:免费使用微软的Azure;Azure使用详细教程URL付费/每个月有50万字符的免费额度
TTS-Online提供超过160种声音选项 美真人配音选择,包含主流的小帅 小美 微软的一些语音,如果你是二次元游戏迷之类网站还提供超过1000+的动漫游戏角色的声音。网站可以提供api。分享者:issueURL免费
配音神器有网页端、windows客户端工具,使用比较方便URL付费/非 VIP 每天可试用 5 次
coqui-ai/tts用于文本到语音的深度学习工具包
在线体验Demo网页:https://huggingface.co/spaces/coqui/xtts
Github免费
elevenlabs文字转语音的服务,提供多种语言URL免费/付费
netease-youdao/EmotiVoiceEmotiVoice是一个强大的开源TTS引擎,支持中英文双语,包含2000多种不同的音色,以及特色的情感合成功能,支持合成包含快乐、兴奋、悲伤、愤怒等广泛情感的语音。GithubFree

声音克隆

名称说明链接费用
剪映目前只有APP端有声音克隆的功能,朗读一小段文字就能完成音色的克隆,音色效果很牛。当你添加文本时,在“文本朗读”那个功能中,点击“我的”tab,就能看到这个功能了URL限免
豆包字节跳动的AI聊天应用,豆包app中声音设置可以选择“创建我的声音”,回答问题的时候就可以用克隆的声音来回答了URL免费

语音翻译

名称说明链接费用
Seamless可以实时翻译100多种语言,延迟不到2秒钟,说话者仍在讲话时就开始翻译。Seamless翻译不仅仅是文字上的转换,还能保持说话者的情感和语气、语调等,使得翻译后的语音更加自然和真实。Seamless模型统一了SeamlessExpressive、SeamlessStreaming和SeamlessM4T v2的功能。旨在实现多语言、表达性和流畅的语音翻译。在线体验Demo地址GithubFree

语音合成

名称说明链接费用
so-vits-svcSo-vits-svc(也称Sovits)是基于VITS、soft-vc、VISinger2等一系列项目开发的一款开源免费 AI 语音转换软件,用户只需准备几十分钟到几个小时不等的语音或歌声数据,就能制作属于自己的 AI 声库,将一段语音或歌声转换为你想要的音色。更多介绍 B站视频:手把手教学!如何自己训练一个AI歌手 - sovits本地&云端训练教程GitHub免费
open-mmlab/Amphion开源音频、音乐和语音生成工具包, 在线使用:https://huggingface.co/amphion
文章介绍:机器之心:霉霉演唱《稻香》,国内团队的Amphion音频生成火了
Github免费

语音处理

名称说明链接费用
vocalremover分离人声和伴奏URL免费
lala.ai从任何音频和视频中提取人声、伴奏和各种乐器URL有免费的试用额度/付费

AI生成音频-音效-音乐

名称说明链接费用
suno.aiURL使用AI通过文本来创作音乐
应用示例:
韩雪:【AI音乐家】我在古镇用AI写歌!
免费/付费
suno-ai/bark文本转音频模型Github免费
audiocraftMeta开源的一个用于音频/音乐生成的开源库,其中主要包括两个模型,MusicGen:文本到音乐模型,AudioGen:文本生成声音模型。MusicGen在线DemoGitHub
免费
Stable Audiostability.ai旗下的AI音乐、音效生成应用URL免费/付费

AI视频创作

名称说明链接费用
SoraOpenAI的文本生成视频的模型。Sora技术报告:https://github.com/ikaijua/Awesome-AITools/discussions/54, Sora的访问权限未完全开放,部分视觉艺术家、设计师和电影制作人获得了访问权限URL-
RunwayGen-2: 文本/图像 AI生成视频
Gen-1: 根据视频AI生成视频
应用示例:
B站视频:数字生命卡兹克/我用AI做了一部《流浪地球3》的预告片
URL付费/有一定的免费试用额度
剪映字幕生成语音、识别语音、一键图文成片,还有很便捷、强大的视频剪辑功能URL免费/vip
Fliki將文字生成音频和视频的网站URL免费/付费
d-id根据文字生成数字人的配音视频URL付费,有一定的免费试用额度
HeyGen根据文字生成数字人的配音视频URL付费,有一定的免费试用额度
AnimateDiffAnimatediff是香港中文大学团队开源的AI视频生成方法,基于Stable DIffusion的开源基建,8月份开源模型之后,一个月就把AI视频生成的质量提高了几个等级。
介绍文章:这款工具让你一秒成AI版宫崎骏,AI视频“ChatGPT时刻”快到了
Github免费

学术科研

名称说明链接费用
gpt_academic为GPT/GLM提供图形交互界面,特别优化论文阅读润色体验,模块化设计支持自定义快捷按钮&函数插件,支持代码块表格显示,Tex公式双显示,新增Python和C++项目剖析&自译解功能,PDF/LaTex论文翻译&总结功能,支持并行问询多种LLM模型,支持清华chatglm等本地模型。兼容llama,rwkv,盘古大模型等。GitHub免费

OCR图像识别文字

名称说明链接费用
微信微信对话框中的图片有提取文字的选项,识别效果很好,使用了几次基本没有什么识别错误。
2021-03月份 微信AI对OCR功能的介绍:三年磨一剑——微信OCR图片文字提取
免费
Umi-OCR开源、免费的离线OCR软件。支持截屏/粘贴/批量导入图片,段落排版/排除水印,扫描/生成二维码。内置多国语言库。Github免费

视频内容总结

名称说明链接费用
ChatGPT for YouTubeChrome 插件,快速总结 Youtube 视频內容,需要登录chatgpt账号或者apikeyURL免费
Chat Youtube给一个Youtube 链接,它能给出总结,还可以向它提视频內容相关的问题URL免费
BibiGPT开源项目,音视频内容 AI 一键总结:哔哩哔哩、YouTube、网页、播客、会议、本地文件等GitHub免费

评测

大语言模型评测

B站视频:酷玩实验室/5大AI模型测评,带你一天上班摸鱼4小时!, 2023-08-18B站视频:【AI对决】让ChatGPT4出题!结果你绝对想不到!!B站视频:阿里版GPT【通义千问】,和我的预期不一样:
通义千问在自然科学和专业知识方面表现比较优秀,比如代码能力明显强于文心一言,甚至可以与chatgpt3.5掰掰手腕。在中文表达或者文学创作方面还有待提高,逊色于文心一言。B站视频:chatgpt挑战知乎热门问题-GPT3.5 对战 GPT4

精选文章

chatgpt相关文章

Sparks of Artificial General Intelligence:
Early experiments with GPT-4: 该论文是一篇长达154页的对 GPT-4 的测试。微软的研究院在很早期就接触到了 GPT-4 的非多模态版本,并进行了详尽的测试。这篇论文不管是测试方法还是测试结论都非常精彩,强烈推荐看一遍。《GPT-4 ,通用人工智能的火花》论文内容精选与翻译: Sparks of Artificial General Intelligence:
Early experiments with GPT-4 这篇论文的精选和中文翻译。

后记

回顾这篇关于AI实用工具的分享,我深感AI技术的强大与魅力。从最初的简单应用到如今的深度融合,AI正在以它独特的方式改变着我们的世界。

在探索AI的过程中,我发现了许多令人惊叹的工具,它们不仅提高了我们的工作效率,更为我们的生活带来了无尽的乐趣。而更让我欣喜的是,这些工具大多数都是免费的,让我们在探索AI的道路上无需承担过多的经济压力。

然而,AI技术的发展仍然是一个不断进化的过程。我相信,在不久的将来,我们将会有更多、更强大的AI工具涌现出来,为我们带来更多的惊喜和便利。

最后,我要感谢每一位阅读这篇文章的朋友。希望这篇文章能够为大家带来一些启发和帮助,让我们共同期待AI技术的美好未来!


原文 : https://github.com/ikaijua/Awesome-AITools/blob/main/

阅读本书更多章节>>>>

本文链接:https://www.kjpai.cn/zhengce/2024-04-13/157884.html,文章来源:网络cs,作者:淼淼,版权归作者所有,如需转载请注明来源和作者,否则将追究法律责任!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。

文章评论