超越GPT-4V!马斯克发布Grok-1.5 With Vision
在 Grok-1 开源后不到一个月,xAI 的首个多模态模型就问世了。Grok-1.5V是XAI的第一代多模态模型,除了其强大的文本处理能力之外,Grok现在还能够处理包括文档、图表、图形、屏幕截图和照片在内的各种视觉信息。相信Grok-1.5V将很快提供给现有的Grok用户和早期测试者来使用。
精选文章
不过就目前来看,GPT4-Turbo目前还是最强的。在画图、看图、写作、逻辑推理、编码这些方面,其他的大模型还是和GPT4-Turbo有很大的差距。
有需要的同学可以按照 ChatGPT4 Turbo 升级教程 ,很方便就升级并使用GPT4-Turbo。
功能
Grok-1.5V在多个领域与现有的前沿多模态模型具有竞争力,这些领域包括跨学科推理、理解文档、科学图表、图表、屏幕截图和照片。Grok具有理解我们物理世界的能力。在新RealWorldQA基准测试中,Grok在衡量现实世界空间理解方面超越了其同行。xAI 还表示,在接下来的几个月里,预计将在图像、音频和视频等各种模态上显著提高模型能力。
根据手绘流程图编写代码
将白板上的流程图草图转换为 Python 代码
提示词
1 | Can you translate this into Python code?(你能把它翻译成 Python 代码吗?) |
Grok回复
1 | Certainly! The flowchart you’ve provided describes a simple guessing game where the computer generates a random number, and the user has to guess it. Here’s the Python code that represents the logic in the flowchart: |
计算商品的卡路里
提示词
1 | How many calories are there in 5 slices of this?(5 片有多少卡路里?) |
Grok回复
1 | If one serving size is 3 slices and contains 60 calories, then 5 slices would contain approximately 100 calories. This is calculated by first determining the calories per slice: 60 calories / 3 slices = 20 calories per slice. Then, multiply the calories per slice by the number of slices: 20 calories per slice * 5 slices = 100 calories. |
解决Leetcode中等难度的问题
提示词
1 | Prompt:Can you write Python code that solves this?(你能编写 Python 代码来解决这个问题吗?) |
Grok回复
1 | def find_triplets(nums): |
理解现实世界
为了开发有用的现实世界人工智能助手,提高模型对物理世界的理解至关重要。为了实现这一目标,xAI正在引入一个新的基准测试,即RealWorldQA。这个基准测试旨在评估多模态模型的基本现实世界空间理解能力。
从上面的图片中可以看到,Grok已经能够识别真实世界的物品和事物。
总结
从Grok-1.5V放出来的实例来看,Grok-1.5V的图片识别能力还是很强的。毕竟Grok-1.5V是马斯克的,可能是借鉴了特斯拉的图像识别技术。
ChatGPT前脚刚更新了最新强大的GPT4-Turbo,马斯克这边立马放出来了Grok-1.5V。
各家的大模型技术又要卷起来了啊。现在的大模型的竞争,让我想起了当年国产手机的发布会的感觉,各家都不断迭代开发新技术发布新手机,
希望后面的大模型可以给我们带来更多的惊喜,最终收益的还是我们这些普通用户。
按照 ChatGPT4 Turbo 升级教程 ,很方便升级到GPT4-Turbo,体验到目前最强大的人工智能工具。
你好,我是火哥!
亲爱的读者你好,我是火哥,一个乐于分享技术类干货的博主。 最新原创的文章都先发布在公众号,欢迎关注哦~
扫描下方二维码,带你第一时间了解ChatGPT、Sora、Midjourney最新动态!
超越GPT-4V!马斯克发布Grok-1.5 With Vision