云霞育儿网

如何挑选AI模型选AI模型正确打开方式AI模型到底该怎么选?宾大教授Ethan

如何挑选AI模型选AI模型正确打开方式

AI模型到底该怎么选?宾大教授Ethan Mollick用一篇文章梳理得明明白白。

首先,别再纠结“哪个模型更强”,关键是选一个“整体”好用的。

主流选项只有三个:Claude(Anthropic)、Gemini(Google)和ChatGPT(OpenAI)。三者都提供基础对话、语音模式、看图、看文档、写代码、生成图像、以及深度调研功能。

那么选哪个更合适?可以根据以下几个维度来判断:

- Claude最注重隐私,默认不会用你的数据训练模型;

- ChatGPT图像生成能力最强,控制更细;

- Gemini的语音和视频功能更突出,特别适合“拍照提问”这类多模态场景;

- 想免费用,可以试试DeepSeek R1,性能也不错。

每个厂商都有三个主力模型,对应不同使用场景:【图1】

1. 聊天类任务(速度快,但智能稍弱):

- Claude 4 Sonnet

- GPT-4o(ChatGPT)

- Gemini 2.5 Flash

2. 工作类任务(更聪明、更少错误,但速度稍慢):

- Claude 4 Opus

- o3(ChatGPT)

- Gemini 2.5 Pro

3. 高难度问题(非常慢,使用次数有限):

- Claude 4 Opus Extended thinking

- o3-pro(ChatGPT)

- Gemini 2.5 Pro(目前还没有专门的“深度思考版”,但可能会补上)

值得注意的是,想使用更强大的模型,需要手动切换,因为默认的一般都是快速模型。【图2】

功能上,“Deep Research”是墙裂推荐的高级功能,它可以生成靠谱、结构清晰、带引用的调研报告,适合做决策、选礼物、规划旅行、甚至医学、法律的“第二意见”。【图3】

如果不想等太长时间,可以模拟一个“Deep Research”,也就是给强力模型开启联网功能实现。

再说一种新型交互方式,让AI通过你的摄像头看世界。

比如指着一个坏掉的设备、数学习题、菜单、植物,AI能直接识别并回应。ChatGPT和Gemini支持拍照互动,Claude目前不支持。

下面是图像和视频生成方面,分别给三种模型输入这样的提示词——

“给我来一张水獭的照片,手里拿着一块牌子,上面写着‘水獭很酷,也是技艺精湛的飞行员’。水獭还拿着一架银色微型747飞机。”

【图4】可以看到,ChatGPT对细节把控更好。

然而在视频生成方面,Gemini的Veo 3模型非常出色,也是目前视频生成领域的顶级模型,就是太贵了,8s左右视频大概需要8美元。

最后,为什么同样是AI,有的人就只是多了个聊天搭子,而有的人却像有个工作助理?记住这些方法:

- 给足上下文语境,不然AI就是在瞎猜;

- 说清楚你要什么,别光说模糊请求;

- 大型任务可以让AI一步一步来,便于发现哪里出问题了;

- 多要点输出数量,比如让它出50个想法,不要怕麻烦AI;

- 如果之前的提问有误,可以点编辑按钮修正提问,该功能支持回看每次编辑,只要点切换按钮就好。

常见坑也别踩:

- AI通常具有幻觉问题(胡说八道),理论上使用越高级的模型,答案越靠谱,而且打开Web搜索功能,结果通常更稳;

- 别把AI当神,它只是个聪明的助手;

- 别只问完就走,多讨论多思考,才是正确用法;

- 别忘看看“推理过程”,看AI是怎么一步步得出答案的。

作者最后总结道,大部分人用AI的方式还停留在“搜索引擎”阶段。而真正用得好的人,是那些敢让它动手做事、分析真实问题、探索多个方案的人。