OpenIsle
OpenIsle
话题发帖我的消息关于🔥 活动
类别
好玩 & 轻松交流 x 272
技术 & 开发调优 x 138
软件 & 资源 x 67
资讯 & 快讯 x 44
运营反馈 x 37
水深火热 x 13
Crypto x 10
标签
纯水 x 234
软件开发 x 108
人工智能 x 66
抽奖 x 64
开源共建 x 45
快问快答 x 33
夸克网盘 x 31
搬运 x 24
百度网盘 x 14
ChatGPT x 13
查看更多
作为开发者,我折腾了一个 AI 视频小站:Synclip.ai
技术 & 开发调优
人工智能
工具
avatar
IngeniousFrog 开山鼻祖
去年 12.1 18:53

这两年一直在做生成式视频相关的东西,日常写代码的内容基本都是:TTS、对口型、人脸驱动、画质增强、Sora 之类的模型接入和部署。

做久了有一个很强的感受:

单个模型很好用,但真正要「从一句话变成一段能发出去的视频」,中间夹着一堆零碎步骤——找配音、合成音频、贴到嘴型上、补动作、调画质、把成片导出来。日常要跑一堆脚本和小工具,非常碎。

所以最近几个月,我和朋友把这套东西收拢成了一个网站,叫synclip.ai,现在大概长这样:

4debf37f-0f03-4263-b5d8-f179b866f148.png

  • 有一个统一的Workspace,进去之后按功能分成几个小工作台:
    • Lipsync Starter:上传一张人像,配一段文字或音频,生成对口型的视频;
    • Image Studio:对图做裁剪、调色、贴二维码、超分等简单处理;
    • Video Creator:接了 Sora 2 的接口,支持用一段文字(可选一帧参考图)生成 10s / 15s 的视频;
    • 还有在做的Audio Creator,把脚本直接变成语音。
  • 所有功能都用credits 统一计费,用户只看到「这次大概要花多少分」,不用管背后是几十个 API 调用还是一堆脚本。

对普通用户来说,它更像是一个「能快速出片的 AI 视频工具」;

对开发者来说,其实就是一个把一堆模型和脚本包成「几个可以点一下的按钮」的前端。

几个可能对这边的朋友有用的点简单列一下:

  1. 对口型 / 人像驱动这块
    • 支持单张照片生成说话视频,可以选 head focus 或 body focus(这个算法已经搞定了,后端还在debug中);
    • 我们在内部做了一些动作上的增强,尽量避免只动嘴不动身子的那种机械感。
  2. Sora 视频生成
    • 现在支持 10s / 15s,横版 / 竖版两种比例;
    • 跟官方 API 打了一层 credits 包装,站内价格会比直接调 API 便宜不少,而且生成的视频是没有水印的。
  3. 图像工具
    • Image Studio 里顺手集成了一些常用的小功能,比如超分、简单调色、给图贴上二维码之类的,不用再到处找单独的站点。

目前对新用户的设置是:

每个账号每个月会送100个免费 credits,用完再决定要不要充值,更多是想让大家随便玩一玩、顺便帮我们踩踩坑。

如果你:

  • 正好在折腾 AI 视频,想要一个「把模型串起来的实际落地形态」参考;
  • 或者只是想找个地方试试 Sora 2、对口型、人像驱动这些效果;

可以直接上synclip.ai 逛一圈,随便点几下就能出一些 demo 片段。

我这边主要负责算法和整体工作流这块,如果你在做内容、视频或者有类似的需求,欢迎在评论里讲讲你的使用场景。有什么一直想要但还没找到顺手工具解决的点,也可以直接丢给我,当作之后迭代的备忘录。

emoji
3
3
Sort by:
返回
暂无评论