最强国产GPT?一句话生成数字人视频!
哈哈,我这标题能打几分?

今天主要说的是讯飞星火。为什么要说这个东西?因为今天看了他们“讯飞星火2.0”发布会,感觉有点东西哦!

讯飞星火的发布会应该是所有“GPT”发布会中最硬核的,几乎90%时间都是现场使用星火来回答问题。

这次发布会现场“真机实测”了很多东西。
数学能力
这个是开场小菜。

虽然我也是上过学的,但是这个问题,我已经全部还给老师了(希望老师退一下学费)。官方说法是讯飞的在数学解题能力上比较强,有些GPT根本回答不出这个问题。
我尝试了阿里的通义千问和百度的文心一言。千问答出来了,但是公式写的没有星火的漂亮。百度格式比较差,答案不一样...
写代码是重头戏
讯飞的代码能力,确实还不错,我在另一篇文章中也做过简单的对比。

这次发布会,就做了非常全面的演示。现场提需求,现场写代码,现场运行。
除了在星火里写代码外,这次讯飞还演示了一个专门代码工具,叫iflycode。

这个工具的定位应该是和github copilot类似。发布会现场演示了一个通过摄像头进行手势识别的demo,感觉还挺强的!
多模态对话一马当先
写代码,做数学,这些国产的GPT基本都会,无非就是好坏的问题。
不过,在多模态方面,讯飞可能要一马当先了。
首先是讯飞现在也能“AI绘画” 了。

水平大概就是这个样子。
更厉害的是....星火现在能看图片了。

只要给出一张图片,就能给你写个绘本故事,而且还能识别到图中有两个角色,然后用不同的声音来讲这个故事。
也就是说,讯飞星火2.0,已经具备,文字,语音,图片输入,发回文字,图片,语音的能力了。
更更厉害的是,它还能直接做视频。

只要一句话,就能给你生成一个”数字人“ 的视频。

几秒钟内,文案,图片,声音,角色全部给整好了。
这个乍一看确实有点惊艳。
我自己试了其他关键词,配音,角色,动作,口型都问题不大,但是配图好像还不太行。真的动态生成视频内容,这还是一个非常困难的事情。
除了大语言模型之外,这次发布会还介绍了两个针对特定场景的应用

星火智作,AI制作视频,剪辑,字幕生成,配音,配图一站式搞定~~(收费)
星火语伴,AI陪你学英语,沉浸式对话,场景化对话,四级,六级,雅思,托福全覆盖~~
本来我准备看一些具体的演示,因为有事情,就没有看完。
整体来说,感觉还是挺不错,我是比较想用iflycode。
今天写的全是优点,讯飞是不是应该给我点广告费了(广告位)哈哈。
当然,我之所以说它不错,只是因为我觉得真的还不错。当然还不错就是还不错,不是强到爆。
他们的自我认知也比较到位,没有吹自己遥遥领先,承认在综合能力上还不如chatgpt。所以定了个目标,今年能赶上ChatGPT ,明年能达到GPT4的水平。
讯飞整体来说态度比较开放和积极,也比较务实。
从一开始,我申请内测很快就通过了,最近申请了星火API审核也很快,送了100万Token(不多,但是测试够用了)。
最重要的是,
我觉得这次的主讲人,
讯飞董事长刘庆峰,
在说起AI大模型
说起技术的时候,
眼里有光,
说到激动处还有泪光!
不论国外,还是国内,无论个人还是公司,对在做的事儿有热情是很重要滴。
本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!
