作者: physixfan
最近几年AI的进展十分迅猛,其中令人印象深刻的包括但不限于:基于 Diffusion Model 的各种图像生成模型、以及我今天想讨论的大语言模型 ChatGPT。尽管网上关于 ChatGPT 的讨论已经很多了,但是这东西确实足够有趣,因此我也来瞎扯几句吧。Disclaimer: 我是纯外行,对AI了解大概不比其他学物理的学生更多。
第一次使用 ChatGPT 的时候,有点让我回忆起了当年第一次见到 Google 时的场景。不过差距还是存在的,当我第一次使用 Google 时,我当即就知道这东西我会一辈子不停地使用它了;而 ChatGPT 大概还稍逊风骚,我目前并不觉得它能取代搜索引擎,它只适合完成一部分任务,而对另一部分任务则满嘴胡话无法信任其结果。
ChatGPT 既不像有些人以为的几乎成为通用人工智能了,也不像有些人以为的那样只是个玩具。我认为它的确可以在一些任务上潜在的提升生产力。这篇文章主要是探索一下 ChatGPT 能做什么、不能做什么。
在美卡论坛的这个帖子里,大家在讲自己有哪些工作或生活中的实际需求已经被 ChatGPT 满足了的时候,提到最多的就是润色自己写的文档和paper的语言。甚至可以直接让 ChatGPT 给自己的paper写摘要。ChatGPT 的确在这方面至少比一个非英语母语的人好得多。
也有很多人已经开始拿 ChatGPT 写那种根本没人看的诸如 year end review 之类的bullshit文章了。如果在我当年上学的时候就有 ChatGPT,估计我也会用它来写那种主旋律片子观后感之类的根本没人care却不得不写的破玩意。
只要对内容的创新程度没有要求,那么用 ChatGPT 写课程论文都是可以的。我个人感觉 ChatGPT 的出现大概会对教育行业产生比较大的影响。即使很快可以发展出探测一个课程论文是否是 ChatGPT 写出的AI,这种AI一定会有一定的出错率,如果一个学生真的是自己写的课程论文而被AI判定为 ChatGPT 所写,他得觉得多冤枉?所以这种AI即使存在,老师们也不能100%信任它,这和抓抄袭作弊是完全不可同日而语的。而如果以后学生都用 ChatGPT 写课程论文拿高分,那么对课程论文的评价还能衡量出一个学生对课程的掌握水平吗?会不会以后想认真打分的老师们最后还是要回归闭卷考试这种原始的方式了。
ChatGPT 最令我吃惊的能力之一就是能够写简单的代码。例如我让它给我写一段Python代码,把csv表格转化成html网页。这种任务让我(一个并非程序员的人)来写的话,我怎么也得花个至少十几分钟在网上搜搜哪个库可以实现这个功能、也许会从StackOverflow上找到一些可以抄的代码、然后一行行写出来、再试着运行几次看看有没有哪儿有bug。然而 ChatGPT 几秒钟就搞定了,确实是 amazing!

前面说了不少 ChatGPT 目前能做的事情了,下面再说一说 ChatGPT 目前做不好的事情。

这是我随便打了俩数字相乘。ChatGPT 很自信的给出了答案,但是答案是错的。正确的答案见下图。

可见 ChatGPT 毕竟只是个“语言模型”,它最擅长的还是说话看着像人类,它目前没有数学能力。

这是我随便问了个冷门学术话题,想让 ChatGPT 给我推荐几篇 paper。ChatGPT 很自信的给我推荐了几篇 paper,然而这几篇 paper 并不真正存在。

比如搜了一下它列出来的第一篇paper的标题,只找到了两篇接近的,然而其作者和出版年份都对不上。
这也是为什么我对有些人认为的 ChatGPT 会对Google产生降维打击这一想法感到嗤之以鼻。ChatGPT 对于事实的把握能力是偏弱的,如果真的想获得一点信息量,靠 ChatGPT 完全不如 Google 可靠。
ChatGPT 的确是一个令人惊叹的存在。不过也要客观的认识它。我们需要搞明白它擅长哪些事情,从而在合适的场景下用它为自己提升效率节省时间;也需要搞明白它目前还无法做到哪些事情,没必要去做那种AI要取代XX工作了那种不切实际的幻想。目前我感觉最简洁的理解 ChatGPT 的方式,就是:它是一个语文能力非常强、编程能力尚可、而数学能力很弱、喜欢一本正经地胡说八道的一个AI。
作者: physixfan
最近几年AI的进展十分迅猛,其中令人印象深刻的包括但不限于:基于 Diffusion Model 的各种图像生成模型、以及我今天想讨论的大语言模型 ChatGPT。尽管网上关于 ChatGPT 的讨论已经很多了,但是这东西确实足够有趣,因此我也来瞎扯几句吧。Disclaimer: 我是纯外行,对AI了解大概不比其他学物理的学生更多。
第一次使用 ChatGPT 的时候,有点让我回忆起了当年第一次见到 Google 时的场景。不过差距还是存在的,当我第一次使用 Google 时,我当即就知道这东西我会一辈子不停地使用它了;而 ChatGPT 大概还稍逊风骚,我目前并不觉得它能取代搜索引擎,它只适合完成一部分任务,而对另一部分任务则满嘴胡话无法信任其结果。
ChatGPT 既不像有些人以为的几乎成为通用人工智能了,也不像有些人以为的那样只是个玩具。我认为它的确可以在一些任务上潜在的提升生产力。这篇文章主要是探索一下 ChatGPT 能做什么、不能做什么。
在美卡论坛的这个帖子里,大家在讲自己有哪些工作或生活中的实际需求已经被 ChatGPT 满足了的时候,提到最多的就是润色自己写的文档和paper的语言。甚至可以直接让 ChatGPT 给自己的paper写摘要。ChatGPT 的确在这方面至少比一个非英语母语的人好得多。
也有很多人已经开始拿 ChatGPT 写那种根本没人看的诸如 year end review 之类的bullshit文章了。如果在我当年上学的时候就有 ChatGPT,估计我也会用它来写那种主旋律片子观后感之类的根本没人care却不得不写的破玩意。
只要对内容的创新程度没有要求,那么用 ChatGPT 写课程论文都是可以的。我个人感觉 ChatGPT 的出现大概会对教育行业产生比较大的影响。即使很快可以发展出探测一个课程论文是否是 ChatGPT 写出的AI,这种AI一定会有一定的出错率,如果一个学生真的是自己写的课程论文而被AI判定为 ChatGPT 所写,他得觉得多冤枉?所以这种AI即使存在,老师们也不能100%信任它,这和抓抄袭作弊是完全不可同日而语的。而如果以后学生都用 ChatGPT 写课程论文拿高分,那么对课程论文的评价还能衡量出一个学生对课程的掌握水平吗?会不会以后想认真打分的老师们最后还是要回归闭卷考试这种原始的方式了。
ChatGPT 最令我吃惊的能力之一就是能够写简单的代码。例如我让它给我写一段Python代码,把csv表格转化成html网页。这种任务让我(一个并非程序员的人)来写的话,我怎么也得花个至少十几分钟在网上搜搜哪个库可以实现这个功能、也许会从StackOverflow上找到一些可以抄的代码、然后一行行写出来、再试着运行几次看看有没有哪儿有bug。然而 ChatGPT 几秒钟就搞定了,确实是 amazing!

前面说了不少 ChatGPT 目前能做的事情了,下面再说一说 ChatGPT 目前做不好的事情。

这是我随便打了俩数字相乘。ChatGPT 很自信的给出了答案,但是答案是错的。正确的答案见下图。

可见 ChatGPT 毕竟只是个“语言模型”,它最擅长的还是说话看着像人类,它目前没有数学能力。

这是我随便问了个冷门学术话题,想让 ChatGPT 给我推荐几篇 paper。ChatGPT 很自信的给我推荐了几篇 paper,然而这几篇 paper 并不真正存在。

比如搜了一下它列出来的第一篇paper的标题,只找到了两篇接近的,然而其作者和出版年份都对不上。
这也是为什么我对有些人认为的 ChatGPT 会对Google产生降维打击这一想法感到嗤之以鼻。ChatGPT 对于事实的把握能力是偏弱的,如果真的想获得一点信息量,靠 ChatGPT 完全不如 Google 可靠。
ChatGPT 的确是一个令人惊叹的存在。不过也要客观的认识它。我们需要搞明白它擅长哪些事情,从而在合适的场景下用它为自己提升效率节省时间;也需要搞明白它目前还无法做到哪些事情,没必要去做那种AI要取代XX工作了那种不切实际的幻想。目前我感觉最简洁的理解 ChatGPT 的方式,就是:它是一个语文能力非常强、编程能力尚可、而数学能力很弱、喜欢一本正经地胡说八道的一个AI。