一首《谦比希铜矿之歌》厂歌火爆全网,背后是AI的数学本质

发布时间:2026/6/23 11:58:51
一首《谦比希铜矿之歌》厂歌火爆全网,背后是AI的数学本质 近几天一首《谦比希铜矿之歌》火爆全网。那铿锵有力、激情昂扬、节奏欢快的旋律让人越听越上头。开始人们以为这是美加墨世界杯主题曲泄露了结果仔细一看居然只是一首非洲铜矿厂的厂歌。而这首歌是作者借助suno studio这一AI软件辅助创作的作者更是在音乐界查无此人。或许你没有用AI创作过音乐但你一定用DeepSeek、豆包查过资料、写过报告。AI早已不知不觉成为了我们工作生活的一部分。和AI对话的时候你有没有这种感觉AI聊天时好像真的在思考回答问题头头是道偶尔还能抛出点出人意料的见解。有一次我问它深圳最高的楼叫什么它秒回平安国际金融中心我愣了1秒……这家伙不会真的知道吧那AI是不是真的在“思考”呢“透过本质看现象AI的本质其实就是一个超级复杂的数学函数。搞清楚了这一点就能理解AI为什么既能写出流畅的文章又会一本正经地胡说八道。一、本质一个超级复杂的数学函数你还记得高中数学里的函数 y f(x) 吗简单说就是输入 x得到 y。AI 做的事情本质上和它一模一样只不过高中函数输入的是数字AI 输入的是文字、图片、文档等等。而核心的区别在于计算过程完全不同。我们高中接触到的普通函数比如 f(x) 2x 1输入 2 就能明确得到 5过程是确定的。AI 显然没这么简单。拿让AI写一封邮件为例你输入请帮我写一封邮件告知客户项目延期一周AI 会先把这句话分解成几十个 tokenAI 处理信息的基本单位这些token进入一个有数十亿个参数的神经网络经过计算后得到一个概率分布下一个词最有可能是敬然后是请然后是谅……最后把这些token再转回文字你就看到一封完整的邮件。整个过程就是一个数学运算只不过这个运算特别复杂规模异常庞大。那怎么让 AI 的运算结果符合我们的预期答案是用海量数据、复杂算法和天价算力去训练。正因为成本高得离谱目前 AI 的主要玩家集中在中美两国的头部公司因为它们在互联网时代积累了海量数据也赚够了钱。二、边界预测而非检索理解了AI是个数学函数我们再来看它的边界在哪里。AI的工作方式是预测下一个词最可能是什么而不是检索正确答案。这是一个根本性的区别。当你问AI深圳最高的楼叫什么时AI不是在数据库里搜索答案。它是在计算根据训练数据里见过的海量文本深圳最高楼这些词后面最常跟着什么词。如果训练数据里出现频率最高的是平安国际金融中心那AI就会输出这个答案。但问题来了它输出的依据是这个答案在训练数据里出现最多而不是这个答案是正确的。这就是为什么同一个问题你换种问法AI有时会给出不同的回答。不是因为它理解了不同的问题而是因为不同的问法让它的概率计算指向了不同的词序列。三、局限为什么会一本正经地说胡话知道了边界我们就能理解AI最大的局限幻觉Hallucination。AI在训练数据里见过大量类似表达它会根据统计规律猜一个答案。这个猜测可能完全错误但它说得非常自信。因为AI无法区分对错比如你问AI我们公司去年的营收增长率是多少AI可能在训练数据里见过大量公司营收增长率的文章所以会根据统计规律编一个答案比如15%。但实际上你们公司去年的营收增长率可能是8%也可能是负增长。AI根本不知道。它只是根据类似的句子猜了一个。AI没有不确定的感受它的参数只会输出一个答案不管对不对。这就是为什么永远不要直接用AI给的未经核实的公司内部数据。遇到关键信息时几个好习惯第一核实关键事实AI给出的具体数据、人名、日期用可靠来源验证一遍。第二让AI说出推理过程要求AI解释它的推理逻辑往往能发现漏洞。第三多角度验证同一个问题换几种方式问看答案是否一致。第四直接问你能确定吗AI有时会承认不确定。四、方法理解机制才能用好工具说了这么多局限不是为了吓退你而是为了让你用得更踏实。理解AI的本质和局限才能真正用好它。比如你现在知道了AI是根据概率猜答案的那你就会明白给它足够的背景信息就是在帮它把猜的概率往正确方向推。给背景、给约束、给角色这三个简单的动作能让AI的输出质量提升好几个档次。再比如你知道了AI会一本正经地说胡话那在处理关键数据时就会多一步核实而不是直接复制粘贴。