最强国产GPT?一句话生成数字人视频!

哈哈,我这标题能打几分?

图片

今天主要说的是讯飞星火。为什么要说这个东西?因为今天看了他们“讯飞星火2.0”发布会,感觉有点东西哦!

图片

讯飞星火的发布会应该是所有“GPT”发布会中最硬核的,几乎90%时间都是现场使用星火来回答问题。

图片

这次发布会现场“真机实测”了很多东西。

数学能力

这个是开场小菜。

图片

虽然我也是上过学的,但是这个问题,我已经全部还给老师了(希望老师退一下学费)。官方说法是讯飞的在数学解题能力上比较强,有些GPT根本回答不出这个问题。

我尝试了阿里的通义千问和百度的文心一言。千问答出来了,但是公式写的没有星火的漂亮。百度格式比较差,答案不一样...

写代码是重头戏

讯飞的代码能力,确实还不错,我在另一篇文章中也做过简单的对比。

图片

这次发布会,就做了非常全面的演示。现场提需求,现场写代码,现场运行。

除了在星火里写代码外,这次讯飞还演示了一个专门代码工具,叫iflycode

图片

这个工具的定位应该是和github copilot类似。发布会现场演示了一个通过摄像头进行手势识别的demo,感觉还挺强的!

多模态对话一马当先

写代码,做数学,这些国产的GPT基本都会,无非就是好坏的问题。

不过,在多模态方面,讯飞可能要一马当先了。

首先是讯飞现在也能“AI绘画” 了。

图片

水平大概就是这个样子。

更厉害的是....星火现在能看图片了。

图片

只要给出一张图片,就能给你写个绘本故事,而且还能识别到图中有两个角色,然后用不同的声音来讲这个故事。

也就是说,讯飞星火2.0,已经具备,文字,语音,图片输入,发回文字,图片,语音的能力了。

更更厉害的是,它还能直接做视频。

图片

只要一句话,就能给你生成一个”数字人“ 的视频。

图片

几秒钟内,文案,图片,声音,角色全部给整好了。 

这个乍一看确实有点惊艳。

我自己试了其他关键词,配音,角色,动作,口型都问题不大,但是配图好像还不太行。真的动态生成视频内容,这还是一个非常困难的事情。

除了大语言模型之外,这次发布会还介绍了两个针对特定场景的应用

图片

星火智作,AI制作视频,剪辑,字幕生成,配音,配图一站式搞定~~(收费)

星火语伴,AI陪你学英语,沉浸式对话,场景化对话,四级,六级,雅思,托福全覆盖~~

本来我准备看一些具体的演示,因为有事情,就没有看完。

整体来说,感觉还是挺不错,我是比较想用iflycode。

今天写的全是优点,讯飞是不是应该给我点广告费了(广告位)哈哈。

当然,我之所以说它不错,只是因为我觉得真的还不错。当然还不错就是还不错,不是强到爆。

他们的自我认知也比较到位,没有吹自己遥遥领先,承认在综合能力上还不如chatgpt。所以定了个目标,今年能赶上ChatGPT ,明年能达到GPT4的水平。

讯飞整体来说态度比较开放和积极,也比较务实。

从一开始,我申请内测很快就通过了,最近申请了星火API审核也很快,送了100万Token(不多,但是测试够用了)。

最重要的是,

我觉得这次的主讲人,

讯飞董事长刘庆峰

在说起AI大模型

说起技术的时候,

眼里有光,

说到激动处还有泪光!

不论国外,还是国内,无论个人还是公司,对在做的事儿有热情是很重要滴。


本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!

相关文章

立即
投稿

微信公众账号

微信扫一扫加关注

返回
顶部