全部
精华
评论
AI 小舟哥

回复于 2023-03-31 08:54

ChatGPT API 怎么用?傻瓜教程来了

今天 ChatGPT 的 API 正式发布 🔥 https://openai.com/blog/introducing-chatgpt-and-whisper-apis我们为大家做了一个 HF Spaces 展示如何使用这个 API 开来发 AI app 申请 OpenAI ChatGPT API 打开这个 HF Spaces 输入 API key 做测试https://huggingface.co/spaces/ysharma/ChatGPTwithAPI 点击 Files and versions 下载代码到本地,发挥你的创意吧。Twitter 原文:https://twitter.com/yvrjsharma/status/1631054913240281088?s=20
5
4
Luke

发布于 2023-03-21 19:35

论文(PDF)阅读辅助工具 - Humata AI

Humata AI 可以帮助用户处理与文件相关的任务,如研究、报告创建和文件分析。该工具还允许用户提出问题并即时获得有关其文件的答案。试试看:https://www.humata.ai/还支持中文:还可以详细问到更多:
  • 共3张
  • 共3张
  • 共3张
2
评论
AI 小舟哥

发布于 2023-03-13 16:46

什么?图像也能 CoT 了?

https://huggingface.co/spaces/cooelf/Multimodal-CoT
2
评论
AI 小舟哥

回复于 2023-03-12 18:16

阿里同学的 composer 也太给力了吧!

用了 1B 清洗过的数据训练会开源权重 demo 以及部署和 训练 的代码十八般武艺全精通,且看下图:代码库:https://github.com/damo-vilab/composerdemo 还在制作当中。感兴趣共建的小伙伴请联系我们~
1
1
Luke

发布于 2023-03-09 12:54

Google 发布了一款拥有 5620 亿参数的大模型 PaLM-E

转自: @indigo11昨天 Google 发布了一款拥有 5620 亿参数的大模型 PaLM-E,项目网站 http://palm-e.github.io 这是一个多模态的 LLM,它可以接受的数据包括: - 语言(language) - 图像(images) - 场景表征(neural scence representations) - 物体表征(object representations) PaLM-E 是一个仅有解码器的 LLM,在给定提示的情况下,自动生成文本 Tokens。 为什么被称为 PaLM-E,那是因为使用了 Google PaLM(2022 年的 LLM)作为预训练的语言模型,并使其成为 Embodied。 为机器人感知世界建立的 “基础模型” 将需要跨越不同环境大量数据集,那些虚拟环境、机器人交互、人类的视频、以及自然语言都可以成为这些模型的有用数据源,学界对使用这些数据在虚拟环境中训练的 “智能代理(Agent)” 有个专门的分类 EAI(Embodied Artificial Intelligence)
3
评论
Luke

发布于 2023-03-08 14:48

用你自己的声音说外语:跨语言神经编解码器语言模型 VALL-E X

转自 TG 频道: @TestFlightCN微软亚洲研究院发布 VALL-E 的扩展 VALL-E X,它可以通过一个几秒的源语音片段来生成目标语言的语音,同时保留说话者的声音、情感和声学环境。 VALL-E X 不需要说话人的跨语言语音进行训练即可执行各种语音生成任务,例如跨语言文本到语音、语音合成和语音到语音翻译。 VALL-E 基于 Meta 在2022年10月开源的 EnCodec 技术之上,同时在 Meta 组建的 LibriLight 音频库进行训练,音频库包含了来自7000多名演讲者的6万小时英语演讲,大部分来自 LibriVox 公共领域的有声读物。 演示示例中展示了"中文语音转英文语音"、"英文语音转中文语音"、"英语文本转中文语音"等各种场景。https://vallex-demo.github.io/
点赞
评论
AI 小舟哥

发布于 2023-03-07 15:43

Composable T2I-Adapter demo 更新了。一键风格迁移

https://huggingface.co/spaces/Adapter/T2I-Adapter
  • 共2张
  • 共2张
2
评论
AI 小舟哥

发布于 2023-03-01 19:16

ZoeDepth

单目图片估计深度。这个 unofficial demo 感觉效果还不错https://huggingface.co/spaces/RamAnanth1/ZoeDepthpaper: https://arxiv.org/abs/2302.12288GitHub: https://github.com/isl-org/ZoeDepth
点赞
评论
AI 小舟哥

发布于 2023-02-28 15:24

哈工大的这个工作会成为新一代的 Dreambooth 吗?

In this paper, we instead propose a learning-based encoder for fast and accurate concept customization, which consists of global and local mapping networks.https://arxiv.org/pdf/2302.13848.pdf
点赞
评论
AI 小舟哥

发布于 2023-02-23 08:35

普大喜奔:Diffusers 可以跑 webui 的 Lora 模型了

代码: https://github.com/haofanwang/Lora-for-Diffusers正在和到 diffusers 里感谢小红书 haofanwang@ 同学的贡献
2
评论
AI 小舟哥

发布于 2023-02-23 08:30

看亚麻的华人团队如何用 1B 参数的小模型吊打 GPT3.5

论文:https://arxiv.org/pdf/2302.00923.pdf代码:https://github.com/amazon-science/mm-cotHuggingFace demo 已经在路上了。敬请期待。感兴趣的同学也欢迎加入一起共建。
2
评论
AI 小舟哥

发布于 2023-02-22 18:54

腾讯同学的 T2I demo 出来了

https://huggingface.co/spaces/ChongMou/T2I-Adapter 今天最开心的事情就是看到这个模型的 demo 出来啦。快来玩~ 如果遇到排队可以本地 clone 一下,或者 fork 到自己的 repo 绑定 gpu 独占使用。
点赞
评论
Luke

发布于 2023-02-22 11:26

conifer.chat: 根据给定的文件或者网页内容进行深度问答

今天正好在逛 Hacker News 的 Show HN 板块,发现了这个服务。https://app.conifer.chat这个项目使用语义搜索和 GPT-3 构建,可以让文件具有「对话」功能,快去试试看吧!
2
评论
AI 小舟哥

发布于 2023-02-21 22:16

腾讯 T2I-Adapter - 媲美 controlnet 的开源模型

描边姿势控制工作原理:代码:https://github.com/TencentARC/T2I-Adapter模型:https://huggingface.co/TencentARC/T2I-Adapter
  • 共5张
  • 共5张
  • 共5张
  • 共5张
  • 共5张
3
评论
AI 小舟哥

发布于 2023-02-21 22:12

BioGPT 用生物医学数据集训练的语言模型

BioGPT: https://huggingface.co/microsoft/biogptBioGPT-large: https://huggingface.co/microsoft/BioGPT-Large
1
评论
宙宙Jo

回复于 2023-02-21 21:55

Flexgen 关于消费级显卡运行LLM推理的可行性

https://github.com/Ying1123/FlexGen
3
1
AI 小舟哥

发布于 2023-02-21 09:28

text2panorama

现已集成到 DiffusersDemo: https://huggingface.co/spaces/weizmannscience/MultiDiffusion代码:https://github.com/omerbt/MultiDiffusion
3
评论
AI 小舟哥

发布于 2023-02-21 09:17

Paper: 生成式 AI 模型都是如何被发布的,及其原因

Paper: http://cn.arxiv.org/pdf/2302.04844v1
  • 共3张
  • 共3张
  • 共3张
1
评论
取消
DoDo提供建站支持