“对呀,其实我们也可以用传统方法,就是神经元系统卷积算法识别观察对象,脱离大模型及训练的情况下,不但准确性太差,而且对复杂环境中事物的分辨也有问题,用了多元关联技术,尤其是信息元编码方式,命中率提高了不少。”鲁少校说话的时候,还看了一眼林久浩。
安静立刻意识到,这个老鲁可是出了名的挖墙角达人,赶紧问道:“如果你们用多元的模型,可以直接命中信息元,我们就不用做事了,是这个意思吗?”。
“哎~~,可不能这么说,我们这边是尽量精确定义,最终的定义过程必须由你们那边完成,你们的方法可以直接命中信息元,进入拟脑思维,更直接。”鲁少校感觉到安静又处于战斗状态了,马上把话圆回来。
【以下部分全部用类脑细胞信息元存储格式解释,即增加‘思维空间第零层语义空间嵌入数组坐标’,如果信息元编码通用,可以使类脑细胞信息元直接在LLM中计算,如果LLM不能形成通用信息元编码,那么可以增加一个LLM概念编码位置。】
会议继续着,安静接着说道:“你们通过多模态大语言模型,为我们提供精确的特征组,对应到内容,抽离关键字形成TAG组关联模型,我们再根据词元组,查找对应的信息元编码,只要能够得到信息元编码,那么拟脑思维就可以开始了。”。
“可以,我们现在的大语言模型不只是类似于TAG的Token标识,而且还可以利用多维嵌入模组,在不同维度的空间进行语义定义,可以把观察对象多维度多层次拆分特征码组,然后定义对象描述,抽离成关键字,把多关键字在多元关联拟脑模型中,形成TAG组模型,并把这个模型输出给你们这边,然后你们去定义或指向信息元,这种固定的流程和算法可以芯片化了。”鲁少校说道。
“对,基于词元的Token可以形成关联模型吗,输出给我们。”安静又问。
这时,林久浩插了一句话:“师姐,不需要输出,我们可以把大语言模型的Token,以及对内容定义的由嵌入向量组,直接对应到信息元的第二个地址上。”
安静也小声回了一句,“我知道,我们两个都需要,尤其是前期训练的时候,需要对方先输出给我们内容特征组。”
“小声讨论什么呢?还背着我。”鲁少校笑眯眯地看着。
“哦,老鲁,我们继续吧。”安静转头说道。
“其实我们前端的大语言模型可以直接向多元关联拟脑模型发出公式化指令,这个层面不需要提供TAG类组,因为大语言模型可以识别信息元。”鲁少校又发出了惊人言论,这个言论正好于林久浩的一致了,鲁少校认为前端可以识别信息元,就能够发起思维行走,而林久浩的意见是,将前端大语言模型定义的向量数组,直接写在信息元编码地址位置,那么信息元与语义就对应上了,但是。。。
“确实是可以,你们大语言模型能够准确地了解语义,然后通过对语义的了解,对应到信息元上,直接发出公式化指令,但是,我们多元关联拟脑模型这边不只是执行呀,还需要在信息变动的过程中,定义信息元、修改信息元及查询信息元,所以,还是需要的。”安静说清楚了,这个训练的过程,必须先提交特征组,才能形成信息元与语义的对应,而且这个过程是需要不断训练,不断优化的,其中还涉及到内容固化与信息元固化的问题。
“确实啊,其实我们都多向对方走一步,两边的系统结合就更紧密了。”鲁少校也明白了,安静部门为什么强调需要特征组对应到信息元的过程内容。
“然后,你提供的特征码组模型,就会产生多个特征码循环输出及关联模型匹配的情况,这样可以更准确的命中信息元集合。”安静接着说道。
“你们那边在特征码定义上要注意分类等级,不是所有的特征码都是平等的关系。”鲁少校也提出要求。
“这一点已经考虑过了,特征码不但有等级,例如医疗、军事、人群等有些词本来就是大合集,同时我们还考虑的其他分类,例如,方位特征码、数量词特征码。而且这些基本的特征码直接采用基础信息元编码,可以直接进入多元关联拟脑模型计算。”安静接着说道。
“对,这些带有特殊含义的特征码,在处理芯片中的标识应该能区别出来,避免了信息字段无法直接计算的缺点。”鲁少校称赞了一下编码方式。
安静接着说道:“这就是我师父陆教授的想法,以前叫计算机,是做数值计算处理的,以后叫人工智能,要做信息思维处理。”。
大家又休息了一会儿,看看时间,再看看会议内容,该结束了。。。
鲁少校最后发出了三联问:“我们的工作界限定好了吧?我没事了吧?我可以走了吧?”。
>本章未完,点击下一页继续阅读