最强国产GPT？一句话生成数字人视频！

2023-08-27 13:03:39

哈哈，我这标题能打几分？

今天主要说的是讯飞星火。为什么要说这个东西？因为今天看了他们“讯飞星火2.0”发布会，感觉有点东西哦！

讯飞星火的发布会应该是所有“GPT”发布会中最硬核的，几乎90%时间都是现场使用星火来回答问题。

这次发布会现场“真机实测”了很多东西。

数学能力

这个是开场小菜。

虽然我也是上过学的，但是这个问题，我已经全部还给老师了（希望老师退一下学费）。官方说法是讯飞的在数学解题能力上比较强，有些GPT根本回答不出这个问题。

我尝试了阿里的通义千问和百度的文心一言。千问答出来了，但是公式写的没有星火的漂亮。百度格式比较差，答案不一样...

写代码是重头戏

讯飞的代码能力，确实还不错，我在另一篇文章中也做过简单的对比。

这次发布会，就做了非常全面的演示。现场提需求，现场写代码，现场运行。

除了在星火里写代码外，这次讯飞还演示了一个专门代码工具，叫iflycode。

这个工具的定位应该是和github copilot类似。发布会现场演示了一个通过摄像头进行手势识别的demo，感觉还挺强的！

多模态对话一马当先

写代码，做数学，这些国产的GPT基本都会，无非就是好坏的问题。

不过，在多模态方面，讯飞可能要一马当先了。

首先是讯飞现在也能“AI绘画” 了。

水平大概就是这个样子。

更厉害的是....星火现在能看图片了。

只要给出一张图片，就能给你写个绘本故事，而且还能识别到图中有两个角色，然后用不同的声音来讲这个故事。

也就是说，讯飞星火2.0，已经具备，文字，语音，图片输入，发回文字，图片，语音的能力了。

更更厉害的是，它还能直接做视频。

只要一句话，就能给你生成一个”数字人“ 的视频。

几秒钟内，文案，图片，声音，角色全部给整好了。

这个乍一看确实有点惊艳。

我自己试了其他关键词，配音，角色，动作，口型都问题不大，但是配图好像还不太行。真的动态生成视频内容，这还是一个非常困难的事情。

除了大语言模型之外，这次发布会还介绍了两个针对特定场景的应用

星火智作，AI制作视频，剪辑，字幕生成，配音，配图一站式搞定~~（收费）

星火语伴，AI陪你学英语，沉浸式对话，场景化对话，四级，六级，雅思，托福全覆盖~~

本来我准备看一些具体的演示，因为有事情，就没有看完。

整体来说，感觉还是挺不错，我是比较想用iflycode。

今天写的全是优点，讯飞是不是应该给我点广告费了（广告位）哈哈。

当然，我之所以说它不错，只是因为我觉得真的还不错。当然还不错就是还不错，不是强到爆。

他们的自我认知也比较到位，没有吹自己遥遥领先，承认在综合能力上还不如chatgpt。所以定了个目标，今年能赶上ChatGPT ，明年能达到GPT4的水平。

讯飞整体来说态度比较开放和积极，也比较务实。

从一开始，我申请内测很快就通过了，最近申请了星火API审核也很快，送了100万Token（不多，但是测试够用了）。

最重要的是，

我觉得这次的主讲人，

讯飞董事长刘庆峰，

在说起AI大模型

说起技术的时候，

眼里有光，

说到激动处还有泪光！

不论国外，还是国内，无论个人还是公司，对在做的事儿有热情是很重要滴。

本文来自互联网用户投稿，文章观点仅代表作者本人，不代表本站立场，不承担相关法律责任。如若转载，请注明出处。 如若内容造成侵权/违法违规/事实不符，请点击【内容举报】进行投诉反馈！

标签：技术

上一篇 > 接入VISA卡进行USDT消费，如何开通并使用 OneKey Card 微信和支付宝全面开放
下一篇 > 论如何提高代码书写速度

Duilib中list控件支持ctrl和shif多行选中的实现

[ICML2015]Batch Normalization:Accelerating Deep Network Training by Reducing Internal Covariate Shif

win10系统微软输入法于eclipse ctrl+shif+f冲突间接处理办法

Codeforces Round #259 (Div. 2) B. Little Pony and Sort by Shif

读LDD3，内存映射与DMA--PAGE_SHIF…

VMware虚拟机安装XP【要先分区，再设置BOOT 启动CD，shif+上移】

更换iBus五笔的左与右Shif

sublime ctrl+shif+f 没用解决办法

idea 对 ctrl + z 的撤销是 ctrl + shif + z

计算机最早的设计师应用于,计算机应用基础选择题doc.doc

win10自带截图神器：Win+Shift+S

Python基础之文件目录操作

python简述目录_Python基础之文件目录操作(示例代码)

tp5 如何做数据采集

任务2-7(服务器字体+阿里巴巴矢量库)

html标签（1)：h1~h6,p,br,pre,hr

TI 电量计介绍与芯片选型指南

几款TI电源芯片简介

TI DSP芯片C2000系列读取FLASH数据

德州仪器(Ti)平台嵌入式开发基础

TI三相电机智能栅极驱动芯片特点分类

省选模拟（12.08） T3 圈圈圈圈圈圈圈圈

Hadoop生态圈技术栈（上）

大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之6.Impala交互式查询

小猿圈之Linux下Mysql 操作命令

大数据Hadoop生态圈常用面试题

大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之4.Hive DDL、DQL和数据操作

备战Noip2018模拟赛11（B组）T3 Monogatari 物语

【智能优化算法-圆圈搜索算法】基于圆圈搜索算法Circle Search Algorithm求解单目标优化问题附matlab代码

NYOJ 78 圈水池

递归问题跑道汽车绕圈问题 Python实现

Hadoop生态圈（三）：MapReduce

最强国产GPT？一句话生成数字人视频！

相关文章