你完全错了,伙计。ChatGPT(你们都知道的最新例子之一,是吧?其实有很多这样的AI,自从十年前以来就存在了)被编程成以一种方式生成信息,既不需要抓取三维来源,也不需要知道它在说什么。基本上,这类AI被训练在一个预测模型上:给定x连续的单词,y是下一个单词吗?你可以使用各种各样的文本来源(各种类型和形式的数十亿文本)来训练AI,它会找出其中的模式,并为单词和集合分配概率。然后,你会得到一个基于它期望出现的单词的回复。如果你将互联网作为数据集,加上抓取和其他一些额外功能,你应该开始把简历投给火星了。这还没有考虑到量子问题。