🚚 业界资讯播报 - Hugging Face 中国社区共建

AI 小舟哥

回复于 2023-03-31 08:54

ChatGPT API 怎么用？傻瓜教程来了

今天 ChatGPT 的 API 正式发布 🔥 https://openai.com/blog/introducing-chatgpt-and-whisper-apis我们为大家做了一个 HF Spaces 展示如何使用这个 API 开来发 AI app 申请 OpenAI ChatGPT API 打开这个 HF Spaces 输入 API key 做测试https://huggingface.co/spaces/ysharma/ChatGPTwithAPI 点击 Files and versions 下载代码到本地，发挥你的创意吧。Twitter 原文：https://twitter.com/yvrjsharma/status/1631054913240281088?s=20

5

4

Luke

发布于 2023-03-21 19:35

论文（PDF）阅读辅助工具 - Humata AI

Humata AI 可以帮助用户处理与文件相关的任务，如研究、报告创建和文件分析。该工具还允许用户提出问题并即时获得有关其文件的答案。试试看：https://www.humata.ai/还支持中文：还可以详细问到更多：

共3张
共3张
共3张

2

AI 小舟哥

发布于 2023-03-13 16:46

什么？图像也能 CoT 了？

https://huggingface.co/spaces/cooelf/Multimodal-CoT

2

AI 小舟哥

回复于 2023-03-12 18:16

阿里同学的 composer 也太给力了吧！

用了 1B 清洗过的数据训练会开源权重 demo 以及部署和训练的代码十八般武艺全精通，且看下图：代码库：https://github.com/damo-vilab/composerdemo 还在制作当中。感兴趣共建的小伙伴请联系我们～

1

Luke

发布于 2023-03-09 12:54

Google 发布了一款拥有 5620 亿参数的大模型 PaLM-E

转自: @indigo11昨天 Google 发布了一款拥有 5620 亿参数的大模型 PaLM-E，项目网站 http://palm-e.github.io 这是一个多模态的 LLM，它可以接受的数据包括： - 语言（language） - 图像（images） - 场景表征（neural scence representations） - 物体表征（object representations） PaLM-E 是一个仅有解码器的 LLM，在给定提示的情况下，自动生成文本 Tokens。为什么被称为 PaLM-E，那是因为使用了 Google PaLM（2022 年的 LLM）作为预训练的语言模型，并使其成为 Embodied。为机器人感知世界建立的 “基础模型” 将需要跨越不同环境大量数据集，那些虚拟环境、机器人交互、人类的视频、以及自然语言都可以成为这些模型的有用数据源，学界对使用这些数据在虚拟环境中训练的 “智能代理（Agent）” 有个专门的分类 EAI（Embodied Artificial Intelligence）

3

Luke

发布于 2023-03-08 14:48

用你自己的声音说外语：跨语言神经编解码器语言模型 VALL-E X

转自 TG 频道: @TestFlightCN微软亚洲研究院发布 VALL-E 的扩展 VALL-E X，它可以通过一个几秒的源语音片段来生成目标语言的语音，同时保留说话者的声音、情感和声学环境。 VALL-E X 不需要说话人的跨语言语音进行训练即可执行各种语音生成任务，例如跨语言文本到语音、语音合成和语音到语音翻译。 VALL-E 基于 Meta 在2022年10月开源的 EnCodec 技术之上，同时在 Meta 组建的 LibriLight 音频库进行训练，音频库包含了来自7000多名演讲者的6万小时英语演讲，大部分来自 LibriVox 公共领域的有声读物。演示示例中展示了"中文语音转英文语音"、"英文语音转中文语音"、"英语文本转中文语音"等各种场景。https://vallex-demo.github.io/

AI 小舟哥

发布于 2023-03-07 15:43

Composable T2I-Adapter demo 更新了。一键风格迁移

https://huggingface.co/spaces/Adapter/T2I-Adapter

共2张
共2张

2

AI 小舟哥

发布于 2023-03-01 19:16

ZoeDepth

单目图片估计深度。这个 unofficial demo 感觉效果还不错https://huggingface.co/spaces/RamAnanth1/ZoeDepthpaper: https://arxiv.org/abs/2302.12288GitHub: https://github.com/isl-org/ZoeDepth

AI 小舟哥

发布于 2023-02-28 15:24

哈工大的这个工作会成为新一代的 Dreambooth 吗？

In this paper, we instead propose a learning-based encoder for fast and accurate concept customization, which consists of global and local mapping networks.https://arxiv.org/pdf/2302.13848.pdf