产品中心

说明书

10分钟定制一个「陈天奇GPT」OpenAI新品实测来袭!SamAltman降维打击千家AI初创公司入土

来源:爱游戏app官网下载    发布时间:2024-02-25 03:07:39

  正如Sam Altman所言:「我们正在孕育新物种,它们正在迅速增殖。」

  可以说,基于OpenAI接口构建勇于探索商业模式的公司,产品忽然就失去了意义。许多初创公司的产品,已无了护城河。

  杜克大学教授陈怡然表示,照这个趋势,所有希望在细致划分领域依靠领域知识和OpenAI掰腕子的人,都是死路一条,至少在学术界和中小公司几乎不可能。

  OpenAI只要找到一个合作方,或者在公开领域能找到相应的训练集,剩下的就是降维式打击。

  不过,使用自己的数据集来训练一个定制版GPT-4可不便宜——起步价200-300万美元。

  此外,若能想得到比较理想的效果,最好是拥有极其庞大的专有数据集(至少数十亿token)。

  随着OpenAI的史诗级发布,微软的股价连续上涨8个交易日,并在周二收盘时创下360.53美元的历史新高。

  OpenAI说,这是我们梦寐以求的未来。如果说以前是「让你的钱为你工作」,现在就是「让你的AI为你工作。」

  OpenAI刚刚官宣进入Agent战场,所以,全球十家头部Agent初创公司接下来该做什么?

  看完下面这批API演示,你就会明白,为啥说「OpenAI一更新,千家初创公司要倒闭」。

  号称最最重磅的更新「GPTs」让人人都能不用编程,仅通过对话聊天方式,就打造一个专属个性化的GPT,还能够最终靠「GPT商店」赚钱,果真有这么神奇?

  Altman本人亲自在现场登台演示,几步操作就创建了一个「创业导师GPT」,用时才3分钟不到。

  惊艳的是,「创业导师GPT」根据Altman本人的演讲风格,给出了回答。

  目前,「GPT商店」已经上线了由OpenAI开发的16个机器人,包括数学导师、创意写作教练、助理厨师等等。

  英伟达高级系统软件工程师Bojan Tunguz用时10分钟,创建了一个ChatXGB——一站式XGBoost助手。

  曾创建了火爆的BabyAGI的网友,这次又定制了一个世界首个自定义GPT智能体「Agi.zip」。

  创建这个GPT时,他发现GPT-4-turbo不够快,还使用了添加了20个预构建的热键以加快速度。

  OpenAI官方发布的「HotMods」——可以把你上传的图像改编成一种全新的画风,如下是网友体验的效果。

  不过,对于大多数人来说,ChatGPT依然是下面这个状态:「不好意思,我还没准备好」。

  与此同时,随着海量新功能的发布,OpenAI创始人Greg Brockman也兴奋地转发了网友们各种脑洞大开的应用案例。

  比如,使用OpenAI的vision API,我们就可以用网络摄像头和ChatGPT玩「你画我猜」了。

  它很流利地描述起摄像头里的画面:我看到一个留着短发的年轻男人坐在墙边,他直视着镜头,身穿一件黑色的T恤。

  这位小哥拿起一副墨镜,向摄像头对面的ChatGPT展示了一下,然后问它:我拿着什么?

  而将OpenAI的视觉和语音API相结合,还可以直接让AI变身为足球解说员!

  比如,把一场足球比赛视频的每一帧都传给了GPT-4-vision-preview,只给了它一些简单的提示,要求它生成旁白。

  GPT-4V完美地做到了,配合上TTS的解说,一场现成的体育解说视频就这样出炉了。这一个视频绝对没编辑,是从模型中直出的。

  具体来说,首先提取视频帧,然后创建一个结构化提示,定义GPT请求的参数,包括模型、提示信息、API密钥、最大token限制,然后发送GPT请求、制作语音解说提示、生成语音解说脚本,向TTS API发送请求将脚本转换为音频,再将音频和视频结合就可以了。

  除了体育比赛外,还可通过GPT-4 API识别画面进行游戏解说,比如英雄联盟。

  网友点评:如果能让叙述速度加快,再加入一些感情,那看起来就跟真人解说相差无几!

  而将上网功能与自定义GPTs结合,则可以从自己最喜欢的音乐人中创建音乐播放列表。

  更厉害的是,通过GPT-4V API可以在5小时内将低保真度模拟与实际HTML的流程组合在一起。

  假设你自己做一个全新的推特界面,就可以简单勾勒出结构,GPT-4V瞬间就做成了HTML。

  LangChain平台认为,虽说一张图片胜过1000个字,但图像在RAG应用程序中通常是不可见的。

  使用新的GPT-4V API,LangChain将在本周发布模板和说明书,以重点介绍多模态RAG的几种方法:

  这些办法能够对带有图像内容的文档(如教科书、财务报告、技术手册等)启用 RAG。

  国外小哥在HuggingFace上提交了一个个OpenAI新发布的TTS文字转语音,可以直接体验。

  更震撼的是,TTS模型还能精准把控标点符号的含义,生成语音的语气各不相同。

  GPTvsGPT是一个有趣的应用程序,可以模拟2个个性鲜明的人工智能助理之间的对话。

  总有一天,人工智能只会为人们挑选工作......无需过滤简历。简历将成为过去......

  不过,开发者想要利用OpenAI的Assiatant API,在自己的应用程序中构建个性化的Agent并不便宜——存储数据的成本高达0.20美元/GB/助手/天。

  与每月每GB约0.023美元的S3相比,OpenAI的定价要高出260倍!

  不过,它至少做到以下一点,并在2024年第一季度发布API,才能与GPT分庭抗礼:

  - 水平能力达到GPT-4的100%,但成本只有turbo的一半或速度是turbo的2倍;

  目前,谷歌已经对Bard进行了多次迭代。谷歌DeepMind也在内部开发了一些SOTA的基础模型,如UL2、PaLI、PaLM、Flamingo等。