打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
国产AI再次惊艳升级!天工3.0震撼发布!|AI 鲜测
天工AI生成

昆仑万维的AI大模型又双叒叕升级了。

天工3.0更新页面

还记得一年前发布的“天工1.0”吗?当时双千亿级参数就已经让业界震惊了。没想到,仅仅一年过去,“天工3.0”的参数量就直接翻了一倍,高达4000亿!

我的天,4000个亿啊!这是人类的脑子吗?

别慌别慌!咱先来看看4000亿参数到底有多厉害?用一个形象的比喻,如果把“天工1.0”比作一个尖子生,那“天工3.0”就是名校博士生导师级别的。它不仅有更广博的知识,更具备更深入的理解和更强大的处理能力。

当然,数量只是第一步,质量的提升同样惊人。这次的“天工3.0”采用了更时髦的MoE(Mixture of Expert)架构,是全球最大规模的开源MOE大模型。通过混合多个专家模型,实现了性能的大幅跃升。

其中最令人惊喜的,是全新的AI音乐功能天工 SkyMusic,它基于昆仑万维“天工3.0”超级大模型打造,是国内首款、同时也是目前国内唯一公开可用的AI音乐生成大模型。集歌词、曲调、编曲、演唱,直接一条龙服务,是中国首个音乐 AIGC SOTA,下载APP首页就能体验到。

不过对咱们普通用户来说,关心的无非就是AI助手够不够智能,够不够好用,体验感如何。咱们测过那么多产品了,今儿就来验验它成效如何?

(PS:目前“天工3.0”和“天工SkyMusic”开放公测了!下载APP即可体验。)

天工SkyMusic:广告音乐也能生成!

说到天工 SkyMusic,有必要说说它的原理

「天工SkyMusic」采用音乐音频领域类Sora模型架构,Large-scale Transformer 负责谱曲,来学习 Music Patches 的上下文依赖关系,同时完成音乐可控性;Diffusion Transformer 负责演唱,通过LDM让Music Patches被还原成高质量音频,使得「天工SkyMusic」能够支持生成80秒44100Hz 采样率双声道立体声歌曲。这套模型架构在处理视频、音频和音乐领域效果极佳。

天工SkyMusic技术原理图

别急别急,咱用一个例子让你秒懂天工 SkyMusic 是怎么实现的:

你可以把天工 SkyMusic 想象成一个超级厉害的“作曲机器人”。它由三部分组成:编码器(Encoder)、神经网络(DiT)和解码器(Decoder)

  • 编码器就像是这个神器的“耳朵”,专门听遍全球的歌曲,学习里面的音符、节奏和音色。

  • 然后,你只需一句歌词,它的神经网络就像灵感全开,迅速从记忆库里找到最匹配的音乐元素,再巧妙地创作成曲。

  • 最后,解码器将这些信息转换成音频,一首新歌就这样诞生了!

天工 SkyMusic 并不是简单的拼凑,而是真正意义上的用 AI 进行音乐创作。目前,它还在起步阶段,未来随着算法升级、训练数据的丰富,创作能力必将越来越强大。我们有理由期待,AI 会为音乐创作带来一次革命性的突破!

天工 SkyMusic 能根据输入的歌词,自动生成包括旋律、和声编曲在内的完整歌曲,整个过程仅需几分钟

我们尝试用天工 SkyMusic 改编了一些经典神曲和古诗词,不仅歌词韵味十足,连整体旋律都洋溢着浓浓的中国风。

  • 中国风音乐:以古诗词为词,用传统乐器为曲,看看效果如何:

行路难开头国风乐器直接把我带入到行路难这首诗当中,男声一进入则让人感觉一种安定,不过后面的唱和旋律部分差了点儿意思。
  • 音乐魔改:儿时回忆快乐星球片尾曲《月亮船》

上周暴雪国服回归,很想创作一首暴雪版《月亮船》,这不来了!

这首歌开头有点儿那味儿了,不过歌词和旋律需要再打磨打磨。真真儿是降低音乐创作门槛,有手就会啊!真是给所有暴雪游戏粉丝带来了一波怀旧风。

歌词里点到了《魔兽世界》、《炉石传说》等经典,一听就勾起了无数回忆。不过,旋律和编曲方面还能再火一些,让人更有热血沸腾的感觉。AI演唱的部分也确实需要再逼真点,特别是在情感的表达上。

  • 儿童音乐

在教育领域,儿歌可谓是是担当了让娃们“乐呵呵”的利器。这不,系统刚给我推荐一首儿歌,我就赶紧跑来天工 SkyMusic 试试看。特别适合满身艺术细胞的爸妈们,赶紧给娃做一曲!

这《小雨点》这首儿童歌曲真的太朗朗上口了!!旋律简单易学,孩子们一听就能跟着哼唱。而且歌词里用了很多生动的自然画面和拟声词,非常有趣,能吸引孩子们的注意力。(PS:封面也特别的应景。)

除了以上几种类型,天工 SkyMusic 还能用于广告歌制作等商业领域,我们生成了几首由它创作的品牌主题曲,不得不说AI在这方面的发挥已经十分出色。

  • 天工3.0 专属音乐

歌词用粤语唱出来更有感觉,这首歌参考的是张靓颖的《我的梦》,也是作为一首宣传曲,在音色旋律上是有借鉴到。需要加强的是在保持人声自然流畅的同时,还要能够传达出歌词中的深度和力量。

  • 天工 SkyMusic 专属音乐

以传统广告音乐为参考,整体还是不错的!

以上种种案例,都充分展现了天工SkyMusic强大的音乐生成能力。它不仅可以根据不同的需求和场景,快速生成相应风格的音乐,而且生成的音乐在编曲、和声、人声等方面都有相当不错的表现,堪称是一个极具创造力的AI音乐助手。

天工SkyMusic的出现,无疑极大地拓宽了音乐创作的边界。有了它的加持,无论你是音乐爱好者、音乐从业者,还是广告、教育等领域的从业者,都能轻松创作出令人耳目一新的音乐作品。可以说,天工SkyMusic为全民音乐创作时代铺平了道路。

不过,我们也要看到,尽管天工 SkyMusic 展现了惊人的音乐创作潜力,但它终究只是一个工具。在音乐创作这件事情上,人的主观能动性和创造力仍然是不可或缺的。天工 SkyMusic 提供的更多是灵感和素材,真正将其塑造成打动人心的作品,还需要人的二次创作。

因此,与其担心AI会取代人类音乐人,倒不如思考如何让人机协作、相得益彰。AI负责提供想象力,而人负责赋予情感和温度,这样的“AI+人”组合,也许会碰撞出前所未有的音乐火花。

天工3.0全方位测评!

第一,用天工3.0来进行一次'童年回忆杀'。

首先利用它强大的中文理解创作能力,让天工3.0给数学公式编写顺口溜,做文言文阅读理解,然后再做几幅水墨画,看看是否全能!

我用天工学数学!

从中文理解和生成效果来看,天工3.0对中文语言节奏、韵律的掌握还不错,生成的顺口溜儿我都想背了!

我用天工做文言文阅读理解!

为了更全面、系统地测试“天工3.0”的中文理解和创作能力,咱也提升点儿难度,我们选取初中课本中常见的2篇文言文,考察天工学对文言文字词句理解、文章主旨把握、修辞手法分析、作者情感体悟等方面的能力。

结果令人惊喜,天工3.0不仅准确领会了诗词背后的深意,还能用生动的现代语言进行阐释,展现出对人类语言细微差别的把控能力。

我用天工让古诗学画画!

再来看看它的文生图能力如何,首先是让它根据古诗作画,对于给到的词中理解到位,第一句的效果画的很不错。

然后点开图拍之后发现还有扩图二次重绘的功能,功能上有点儿MJ那味儿了。

咱们再升级一下,作为一款与时俱进的AI,天工3.0当然也要经受中文高质量语料'弱智吧'的洗礼。

对于弱智吧的提问,天工3.0中规中矩,逻辑清晰,没出什么大错。

弱智吧提问

再来看看AI识图功能,这部分就只能识别出里面文字了,似乎它的功能并不在于此。

看看天工怎么说的:

再来一张试试:

看这回答,AI识图对梗图不太友好,只能理解到字面意思。

相反对于摄影赏析、古诗创作等功能属性较强的图片更加友好,看来是术业有专攻

AI识图:摄影赏析、古诗创作

第二,多模态能力的展现

接下来我们我们让天工3.0为一个假想的地震救援行动出谋划策,通过三问三答让它快速生成了一套覆盖资源调配、路径规划等全流程的救援方案。

这三问三答展示了模型在处理复杂问题(如地震救援行动)时的强大逻辑推理和全面规划能力,能详尽分解任务并考虑多维度因素。优点在于能详细覆盖救援的关键环节和多方面的技术应用,缺点则是在某些情况下可能过于详细,导致信息过载,不够简洁。

再来一些高难度的,让它做一个股票价格监控应用

这段代码实现了一个基本的股票价格监控应用,能够让用户通过一个简单的界面输入股票代码,查看实时价格。它的好处在于界面直观易用,而且加入了错误处理机制,确保在遇到问题时能给出提示,避免程序崩溃。

第三,再来测测他的搜索能力如何?

天工AI搜索,不仅在在原本的基础上做了加强,搜索的更佳精准,而且平时还能推送热点,最快接触到当下的时事新闻,这一点对于2G网络的伙伴非常友好。

以搜索“贪吃蛇的游戏代码”为例,

先来看第一种:传统模式

它的回答提供了一个基本的贪吃蛇游戏代码实现,使用Python的curses库。虽然代码涵盖了游戏的基础功能,包括初始化、输入处理和游戏逻辑,但存在一些语法和逻辑错误,这影响了代码的准确性和可执行性。信息来源相对单一,主要是一个直接的代码示例,缺乏深入探讨或优化的部分。

再看第二种:增强模式

效果确实比传统模式好上不少:

这个模式在内容丰富度和准确性方面表现较好,详细介绍了使用Python和C++实现贪吃蛇游戏的方法。它涵盖了环境初始化、游戏逻辑、渲染显示以及用户输入处理,提供了全面的信息,适合初学者和有经验的开发者。同时,使用pygame库增强了图形处理和事件管理的能力,使得实现更加高效和可靠。

最后来看第三种:研究模式

这个模式在前两种的基础上在信息源、信息丰富度上有着不小提升。

详细来看,研究模式搜索最为全面和深入,不仅提供了多种编程语言的基础代码示例,还深入探讨了性能优化、算法改进和跨平台实现等高级技术。这种模式的信息来源非常丰富,适合那些希望深入了解和扩展游戏功能的开发者。性能优化的讨论尤其有助于提高游戏的响应速度和流畅度,使其更适合现代游戏开发需求。

同时还有大纲和思维导图的生成,对于信息来源也是一目了然,缺点是因为生成内容长,所以生成速度也会相应拉长。

不得不说搜索这块儿,天工3.0还是有几把刷子的!

第四,创建智能体

这部分是老生常谈了,不过天工3.0APP里面有个标签儿吸引了我的注意,就是元宇宙,打开一看原来是“角色扮演”游戏,那基本上也跟智能体是一家人了。

智能体页面

在天工3.0中,有两种方式来创建智能体,对话式和表单式:

对话式创建有“智能体创建小助手”在手,更适合目前对智能体不太了解的朋友们;

表单式创建则更加自定义,我做了一个国风音乐生成助手,效果如下:

最后

整个测试下来,“天工3.0”确实比“天工2.0”强了不少!看来是下了硬功夫的。

天工3.0不仅数学题信手拈来,文言文读懂吟诵,还能化身“才子佳人”,作诗作画,简直是万能的“小才子”。面对复杂的地震救援任务,它也能全盘托出,制定详尽的行动方案。

当然,天工3.0并非全能,比如对于梗图的理解,它可能还需要再“多上几次网”。但瑕不掩瑜,作为一个正在成长的AI少年,天工展现出的智慧和潜力已经足够亮眼。

当然,作为一个客观理性的吃瓜群众,我也要提醒一下,“天工”虽然很全能,但距离通用人工智能(AGI)还有很长的路要走。毕竟,现在的AI再厉害,也还只是在特定领域发挥专长,离人类思维的全面模拟还差得远呢。

“天工3.0”给我们带来的,不仅仅是一款强大的AI模型,更是对未来科技生活的一次预演。正如马斯克所言:“我们要么选择拥抱人工智能,要么被人工智能拥抱。”与其坐等变革的到来,不如现在就开始拥抱变革。

各位看官,咱们这期的“天工秀”就到这里。如果你也被“天工3.0”圈粉了,就赶紧去APP下载体验一番,咱们下期再见!

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
音乐ChatGPT时刻来临!「天工SkyMusic」音乐大模型今日启动邀测
国内首款AI音乐大模型一曲封神!核心技术业内首公开,爆改霉霉周杰伦效果惊艳
全球AI音乐会,第一次听见中国声音
昆仑万维重磅发布AIGC全系列算法与模型,领跑未来
国内首个音乐版「ChatGPT」来了!Sora同款架构,唱作技巧全面发展,还剧透了全新MoE大模型
Suno爆火!AI版周杰伦来了?
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服