大模型

字节大模型,豆包

自从ChatGPT出来后,这一整段时间里,科技领域都被大模型,搞得沸沸扬扬的。在中国,百度和阿里是最早两家出大模型对话的平台,名字叫“文心一言”和“通义千问”

大模型到底是什么?小白也能看懂的科普贴

从去年到今年,大模型、chatGPT等概念和技术越来越火,但是像笔者一样的技术小白一直对大模型是一种似懂非懂的状态。鉴于最近在做基于大模型和Agent的上层AI应用,如若不了解底层概念,始终还是会限制

什么是大模型幻觉?应该如何解决?

一、什么是大模型幻觉?语言模型的幻觉(Hallucination)指的是模型生成了不符合事实或毫无根据的信息。这种现象在自然语言处理(NLP)任务中尤其常见,如机器翻译、文本生成和问答系统。比如:用户问模型:“秦始皇为什么喜欢用苹果手机,为

十个关键词,带你全面看懂DeepSeek!

DeepSeek的火热仍在持续。相信很多读者在使用DeepSeek的时候,都会默认开启深度思考功能,风叔在阅读DeepSeek思考过程上的时间,甚至比最终回答还要多。这是风叔在使用其他大模型时,从来没

Agent狂飙300天

大模型的世界不缺热点。近日,OpenAI发布的Sora大模型引爆科技圈,大模型能力又一次迎来炸裂更新。而在底层大模型技术快速迭代之外,过去大半年里行业内的最热门