问题因为涉密用户和业务信息了我就简要阐述下 ① 交互中包 阿联酋 WhatsApp 号码 含的可以利用的信息 实际上这个是经典的信息论原理的利用一般应用到的会包括以下两点同样的我以非算法的视角阐述下我的理解 A 信息的输入一定要大于输出存在冗余才能通过算法压缩输出需要的信息并且还原信息。 通俗点比如模型完全没有学习过小学数学就不可能可以解决小学数学题。 像GPT这种大模型可以让你输入很短的几句话就帮你写出论文原因在于GPT本质上是一个语言模型是语言模型训练过程输入压缩了相关的知识信息因此才可以在很少输入的情况下让语言模型补足需要的输出。其实从GPT计算小学内容经常出错也可以
看出这个原理因为这类信息不在GPT的训练数据中。 另一个直观的理解方式是给定的输入就最多只能有的输出不可能产生实际上AI需要冗余信息才可以保证压缩传递后能够输出一样的结果即的输入产生的输出因为处理就一定会损失一些东西有冗余才可以容忍更多处理空间。 B 引入解决问题需要的更多维度尤其是正交维度的信息就可以显著提升模型效果。 其实这也是最常用的大幅优化效果的方式例如在语音类的AI设计中【用户输入的语音音频】和【用户的语言表达】就是两个不重叠的正交维度即使一些纯粹的语音AI能力例如声纹识别语音合成引入语言的维度也可以大幅提升效果因此。