第321章 语言的原罪:AI的天花板(2 / 5)

加入书签

的语气,“当年你在东莞,天天半夜给我打电话,说什么SAp‘结丹’,搞得我一头雾水,差点以为你走火入魔了。”

“哈哈,此一时彼一时也!”张伟心情大好,“不管你了,我先忙,别和我说话,千万别把我这点灵感小火苗给搅和黄了。”

“哼,懒得理你,我一觉睡到罗马!”小玲佯装生气,把头一歪,戴上眼罩,不再管他了。

张伟收敛笑容,指尖在冰冷的屏幕上轻点,打开了一个新的笔记文档。

机舱外是深邃的夜空,与来时的航班上领悟“智慧茧房”时一般无二,但这一次,他感觉自己的思维触角伸向了一个更底层的结构。

岳父岳母关于“假”“骗”与“策略”的拌嘴,与他之前对AI“智慧茧房”的思考,在万米高空发生了奇妙的化学反应。

“垃圾进,垃圾出……”张伟喃喃自语,这是ERp行业乃至整个It领域颠扑不破的铁律。

低质量、错误的数据输入,经过再完美的系统处理,也只能得到毫无价值的垃圾输出。

“那么……”张伟的眼神锐利起来,“如果,输入给AI的‘原料’——我们人类引以为傲的自然语言,本身在某种意义上就是一种‘假’的东西,是一种‘垃圾’呢?

那AI输出的‘智能’,无论看起来多么光鲜,其本质是否也建立在流沙之上?

它的天花板,是否在诞生之初就被注定了?”

这个念头如同闪电,瞬间照亮了他脑海中盘踞许久的迷雾。

张伟猛地坐直身体,手指在键盘上飞舞起来。

张伟仿佛进入了一个无形的“脑内会议室”六边形战力,代表六种能力,在大脑里博弈,逻辑的齿轮开始高速咬合,层层递进地展开论证。

“自然语言,”他在文档上敲下第一个标题,“无论中文、英文,还是任何人类语种,都有一个与生俱来的‘原罪’。”

他的思绪回到自己深耕十年的SAp领域,那些庞大而严谨的系统,最终都依赖人来输入数据,而人,使用语言。

“这个原罪就是:语言所指代的,并非真正的‘实物’或‘意义本身’,而是一个被社会群体强制定义、约定俗成的‘含义’!”

语言、文字,其实是一套符号系统,这是当初在北京做项目时,偷师学到的。

张伟回忆起当时教授的讲课:

“看,中文的‘山’,发音是‘shān’,字形是三个竖线加一个基座;英文的‘mountain’,发音完全不同,字形更是风马牛不相及。但是,它们指向的是同一个客观存在——那个在地球表面隆起的、高大稳固的地貌实体。”

“‘山’≠山本身!‘mountain’≠山本身!”教授用力敲下这两个不等式。

“它们都只是符号,是标签,是任意的指代。实物、文字、语音,这三者之间在物理上本无任何必然联系,是人类文明用数千年的时间,强行将这三者捆绑在一起的,赋予了它们共同的‘意义’。”

“而我们的人脑,在处理语言时,有一个专门的区域负责这种‘翻译’工作,它将内在的‘意思’或脑海中的‘意象’,转换成特定的语音波动或文字形状输出,同时将接收到的语音文字,再‘翻译’回内在的‘意思’。我们输入输出的,从来不是‘意义实体’本身,而是它‘指代’的文字或语音!”

张伟大脑犹如被注入一股神秘的力量,感觉一扇通往底层逻辑的大门被瞬间推开:

“所以,自然语言不是‘意义本体’,它只是一套庞大而精巧的‘指代体系’、‘一套符号系统’!”

“而现在的AI,基于transformer架构的大语言模型,它的全部养料就是人类产生的海量自然语言语料。

它学习的,不是‘山’这个实体为何物,不是它的地质构成、生态分布,而是‘山’这个字符、这个符号,在数以亿计的文本中,与‘高’、‘水’、‘攀登’、‘稳重’等等其他字符之间的统计关联性和共现概率!”

“transformer不是在理解世界

↑返回顶部↑

书页/目录